MCP HubMCP Hub
Retour aux compétences

qdrant-scaling-query-volume

qdrant
Mis à jour 6 days ago
158
18
158
Voir sur GitHub
Designdesign

À propos

Cette compétence de Claude propose des stratégies d'optimisation Qdrant pour gérer de grands volumes de requêtes et la pagination. Elle traite spécifiquement des problèmes de performance liés aux requêtes à limite élevée sur plusieurs fragments en mettant en œuvre un sous-échantillonnage basé sur la distribution de Poisson. Utilisez cette compétence pour les problèmes de performance de défilement, les ensembles de résultats volumineux ou les requêtes à haute cardinalité dans les déploiements Qdrant fragmentés.

Installation rapide

Claude Code

Recommandé
Principal
npx skills add qdrant/skills -a claude-code
Commande PluginAlternatif
/plugin add https://github.com/qdrant/skills
Git CloneAlternatif
git clone https://github.com/qdrant/skills.git ~/.claude/skills/qdrant-scaling-query-volume

Copiez et collez cette commande dans Claude Code pour installer cette compétence

Documentation

Scaling for Query Volume

Problem: When a query has a large limit (e.g. 1000) and there are multiple shards (e.g. 10), naively each shard must return the full 1000 results — totaling 10,000 scored points transferred and merged. This is wasteful since data is randomly distributed across auto-shards.

Core idea

Instead of asking every shard for the full limit, ask each shard for a smaller limit computed via Poisson distribution statistics, then merge. This is safe because auto-sharding guarantees random, independent data distribution.

When it activates

  • More than 1 shard
  • Auto-sharding is in use (all queried shards share the same shard key)
  • The request's limit + offset >= SHARD_QUERY_SUBSAMPLING_LIMIT (128)
  • The query is not exact

Key tradeoff

The strategy trades a small probability of slightly incomplete results for a large reduction in inter-shard data transfer, especially for high-limit queries across many shards. The 1.2x safety factor and the 99.9% Poisson threshold keep the error rate very low — comparable to inaccuracies already introduced by approximate vector indices like HNSW.

Dépôt GitHub

qdrant/skills
Chemin: skills/qdrant-scaling/scaling-query-volume
0
agent-skillsai-agentsclaude-codecodexcursorembeddings

Compétences associées

executing-plans

Design

Utilisez la compétence executing-plans lorsque vous disposez d'un plan de mise en œuvre complet à exécuter par lots contrôlés avec des points de contrôle de revue. Elle charge et examine le plan de manière critique, puis exécute les tâches par petits lots (3 tâches par défaut) tout en rapportant la progression entre chaque lot pour une revue par l'architecte. Cela garantit une mise en œuvre systématique avec des points de contrôle de qualité intégrés.

Voir la compétence

requesting-code-review

Design

Cette compétence délègue un sous-agent réviseur de code pour analyser les modifications apportées au code par rapport aux exigences avant de poursuivre. Elle doit être utilisée après avoir terminé des tâches, implémenté des fonctionnalités majeures, ou avant une fusion vers la branche principale. La revue aide à détecter précocement les problèmes en comparant l'implémentation actuelle avec le plan initial.

Voir la compétence

connect-mcp-server

Design

Cette compétence fournit un guide complet permettant aux développeurs de connecter des serveurs MCP à Claude Code via les transports HTTP, stdio ou SSE. Elle couvre l'installation, la configuration, l'authentification et la sécurité pour intégrer des services externes tels que GitHub, Notion et des API personnalisées. Utilisez-la lors de la configuration d'intégrations MCP, de la configuration d'outils externes ou du travail avec le Protocole de Contexte de Modèle de Claude.

Voir la compétence

web-cli-teleport

Design

Cette compétence aide les développeurs à choisir entre les interfaces Web et CLI de Claude Code en fonction de l'analyse des tâches, puis permet une téléportation transparente des sessions entre ces environnements. Elle optimise le flux de travail en gérant l'état et le contexte de la session lors du passage entre le web, la CLI ou le mobile. Utilisez-la pour des projets complexes nécessitant différents outils à diverses étapes.

Voir la compétence