Zurück zu Fähigkeiten

qdrant-hybrid-search

qdrant
Aktualisiert 5 days ago
154
18
154
Auf GitHub ansehen
Dokumentewordpowerpointai

Über

Diese Fähigkeit erklärt, wie hybride Suche in Qdrant implementiert wird, die Keyword- und semantische Suche kombiniert, indem parallele Suchen mit der `prefetch`-Funktion in der Query API durchgeführt werden. Sie führt Entwickler durch das Zusammenführen von Ergebnissen aus spärlichen und dichten Vektoren, um Probleme wie fehlende Keyword-Übereinstimmungen zu behandeln. Nutzen Sie sie beim Einrichten kombinierter Suchmethoden oder bei der Verarbeitung mehrerer Suchrepräsentationen.

Schnellinstallation

Claude Code

Empfohlen
Primär
npx skills add qdrant/skills -a claude-code
Plugin-BefehlAlternativ
/plugin add https://github.com/qdrant/skills
Git CloneAlternativ
git clone https://github.com/qdrant/skills.git ~/.claude/skills/qdrant-hybrid-search

Kopieren Sie diesen Befehl und fügen Sie ihn in Claude Code ein, um diese Fähigkeit zu installieren

Dokumentation

Hybrid Search in Qdrant

Hybrid search means running two or more different searches in parallel and combining their results into one.

In Qdrant this is powered by the Query API via prefetch: each prefetch runs exactly one type of search independently, and the outer query combines results from parallel prefetches.
Prefetches can be nested and searches can be multi-stage, all pipeline happening in one request through Query API. See Universal Query API for examples.

Identify the user's problem and pick building blocks:

  • What can go into one prefetch, e.g. power one search, in Search Types
  • How to combine results of these searches (RRF, DBSF, FormulaQuery, reranking) in Combining Searches

Based on what you've picked, test your approach:

  1. Configure Qdrant collection with named vectors, where each named vector usually corresponds to one representation (different embedding models or different vector types) of a data point.
  2. Construct a hybrid search request with Query API from your building blocks. You can search independently among one type of vectors, with prefetch + using, like shown in examples in Hybrid Queries documentation.
  3. Evaluate hybrid search quality on real user data and provide user with improvements and tradeoffs (speed/resources).

How Isolated Are Parallel Searches?

Use when: different tenants share one collection and you need to understand hybrid search isolation guarantees.

If user wants to isolate/share hybrid search pipelines between tenants, consider that:

  • Indexes (sparse, payload and dense) and IDF modifier for sparse vectors are computed independently per shard, not per tenant.
  • Prefetch runs independently per shard to retrieve #limit results, so for collection-level prefetches if collection has several shards, Qdrant will always prefetch under the hood #limit * #shard results. Final results are merged based on scores.
  • In nested prefetches (deeper than 1 level), methods described in "Combining Searches" might be done on a shard level first, then per-shards results once again will be merged based on scores.

What NOT to Do

  • Choose a hybrid search pattern based on "vibes" without any hybrid search quality evaluation in-place.
  • Create too many named vectors without a need. An unfilled named vector might take as much resources as a filled one.

GitHub Repository

qdrant/skills
Pfad: skills/qdrant-search-quality/search-strategies/hybrid-search
0
agent-skillsai-agentsclaude-codecodexcursorembeddings

Verwandte Skills

release-standards

Dokumente

Diese Fähigkeit bietet Richtlinien für semantische Versionierung (semver) und Formatierungsstandards für Changelogs bei Softwareveröffentlichungen. Nutzen Sie sie bei der Vorbereitung von Releases, um Versionsnummern (Major/Minor/Patch) korrekt zu erhöhen und Changelog-Einträge zu strukturieren. Sie enthält Regeln für Pre-Release-Kennzeichnungen und klare Beispiele für Entwickler.

Skill ansehen

commit-standards

Dokumente

Diese Fähigkeit formatiert Git-Commit-Nachrichten gemäß dem Conventional Commits-Standard. Sie stellt Vorlagen und Typdefinitionen (wie `feat`, `fix`, `refactor`) bereit, um Konsistenz beim Schreiben oder Überprüfen von Commits zu gewährleisten. Verwenden Sie sie während des Commit-Prozesses, um eine klare, strukturierte Commit-Historie zu erstellen.

Skill ansehen

huggingface-tokenizers

Dokumente

Diese Fähigkeit bietet eine leistungsstarke Tokenisierung mit HuggingFace's Rust-basierter Bibliothek und verarbeitet 1 GB Text in unter 20 Sekunden. Sie unterstützt BPE-, WordPiece- und Unigram-Algorithmen und ermöglicht das Training benutzerdefinierter Tokenizer sowie die Verfolgung von Ausrichtungen. Nutzen Sie sie, wenn Sie produktionsreife, schnelle Tokenisierung benötigen oder benutzerdefinierte Tokenizer erstellen möchten, die in das Transformers-Ökosystem integriert sind.

Skill ansehen

nano-pdf

Dokumente

nano-pdf ist ein CLI-Tool, das Entwicklern ermöglicht, PDFs mit natürlichen Sprachbefehlen zu bearbeiten, wie etwa Text zu ändern oder Tippfehler auf bestimmten Seiten zu korrigieren. Es ist ideal für schnelle, programmatische PDF-Modifikationen direkt vom Terminal aus. Überprüfen Sie stets die Ausgabe, da die Seitennummerierung zwischen Versionen variieren kann.

Skill ansehen