qdrant-search-strategies

qdrant

Mis à jour 6 days ago

158

Designwordapidesigndata

À propos

Cette compétence aide les développeurs à sélectionner et à mettre en œuvre des stratégies de recherche avancées avec Qdrant pour améliorer la qualité de la récupération. Elle fournit des conseils pour des scénarios tels que la recherche hybride, le reclassement, la diversité (MMR), le feedback de pertinence et la combinaison de la recherche par mots-clés avec la recherche vectorielle. Utilisez-la lorsque la recherche vectorielle de base renvoie des résultats non pertinents, trop similaires ou incomplets depuis votre jeu de données.

Installation rapide

Claude Code

Recommandé

Principal

npx skills add qdrant/skills -a claude-code

Commande PluginAlternatif

/plugin add https://github.com/qdrant/skills

Git CloneAlternatif

git clone https://github.com/qdrant/skills.git ~/.claude/skills/qdrant-search-strategies

Copiez et collez cette commande dans Claude Code pour installer cette compétence

Documentation

How to Improve Search Results with Advanced Strategies

These strategies complement basic vector search. Use them after confirming the embedding model is fitting the task and HNSW config is correct. If exact search returns bad results, verify the selection of the embedding model (retriever) first. If the user wants to use a weaker embedding model because it is small, fast, and cheap, use reranking or relevance feedback to improve search quality.

Missing Keyword Matches or Need to Combine Multiple Search Signals

Use when: pure vector search misses keyword/domain term matches, or the use case benefits from combining searches on multiple representations (including languages and modalities) of the same item.

See how to use hybrid search

Right Documents Found But Not in the Top Results

Use when: good recall but poor precision (right docs in top-100, not top-10).

See how to use Multistage queries, for example with late interaction rerankers through Multivectors.
Cross-encoder rerankers via FastEmbed Rerankers

Dense Retriever Misses Relevant Items or Reranking Is Too Costly

Use when: dense retriever misses relevant items you know exist in the collection; relevant documents lie outside the initial ANN retrieval pool; reranking a large candidate pool is too slow or expensive; using a small/cheap embedding model but need quality close to a larger model; or want to improve top-1/3 precision without the full cost of reranking.

See Relevance Feedback in Qdrant

Results Too Similar

Use when: top results are redundant, near-duplicates, or lack diversity. Common in dense content domains (academic papers, product catalogs).

Use MMR (v1.15+) as a query parameter with diversity to balance relevance and diversity MMR
Start with diversity=0.5, lower for more precision, higher for more exploration
MMR is slower than standard search. Only use when redundancy is an actual problem.

Want to improve search results based on examples (positive and negative)

Use when: you can provide positive and negative example points to steer search closer to positive and further from negative.

Recommendation API: positive/negative examples to recommend fitting vectors Recommendation API
- Best score strategy: better for diverse examples, supports negative-only Best score
Discovery API: context pairs (positive/negative) to constrain search regions without a request target Discovery

Have Business Logic Behind Results Relevance

Use when: results should be additionally ranked according to some business logic based on data, like recency or distance.

Check how to set up in Score Boosting docs

What NOT to Do

Use hybrid search before verifying pure vector search quality (adds complexity, may mask model issues)
Skip evaluation when adding relevance feedback — score the end-to-end pipeline to confirm it actually helps Pipeline Output Quality

Dépôt GitHub

qdrant/skills

Chemin: skills/qdrant-search-quality/search-strategies

agent-skillsai-agentsclaude-codecodexcursorembeddings

Compétences associées

executing-plans

Design

Utilisez la compétence executing-plans lorsque vous disposez d'un plan de mise en œuvre complet à exécuter par lots contrôlés avec des points de contrôle de revue. Elle charge et examine le plan de manière critique, puis exécute les tâches par petits lots (3 tâches par défaut) tout en rapportant la progression entre chaque lot pour une revue par l'architecte. Cela garantit une mise en œuvre systématique avec des points de contrôle de qualité intégrés.

Voir la compétence

requesting-code-review

Design

Cette compétence délègue un sous-agent réviseur de code pour analyser les modifications apportées au code par rapport aux exigences avant de poursuivre. Elle doit être utilisée après avoir terminé des tâches, implémenté des fonctionnalités majeures, ou avant une fusion vers la branche principale. La revue aide à détecter précocement les problèmes en comparant l'implémentation actuelle avec le plan initial.

Voir la compétence

connect-mcp-server

Design

Cette compétence fournit un guide complet permettant aux développeurs de connecter des serveurs MCP à Claude Code via les transports HTTP, stdio ou SSE. Elle couvre l'installation, la configuration, l'authentification et la sécurité pour intégrer des services externes tels que GitHub, Notion et des API personnalisées. Utilisez-la lors de la configuration d'intégrations MCP, de la configuration d'outils externes ou du travail avec le Protocole de Contexte de Modèle de Claude.

Voir la compétence

web-cli-teleport

Design

Cette compétence aide les développeurs à choisir entre les interfaces Web et CLI de Claude Code en fonction de l'analyse des tâches, puis permet une téléportation transparente des sessions entre ces environnements. Elle optimise le flux de travail en gérant l'état et le contexte de la session lors du passage entre le web, la CLI ou le mobile. Utilisez-la pour des projets complexes nécessitant différents outils à diverses étapes.

Voir la compétence