MCP HubMCP Hub
Вернуться к навыкам

qdrant-hybrid-search

qdrant
Обновлено 5 days ago
154
18
154
Посмотреть на GitHub
Документыwordpowerpointai

О программе

Этот навык объясняет, как реализовать гибридный поиск в Qdrant, который объединяет ключевой и семантический поиск путем выполнения параллельных запросов с использованием функции `prefetch` в Query API. Он помогает разработчикам объединять результаты разреженных и плотных векторов для решения таких проблем, как отсутствие совпадений по ключевым словам. Используйте его при настройке комбинированных методов поиска или работе с несколькими поисковыми представлениями.

Быстрая установка

Claude Code

Рекомендуется
Основной
npx skills add qdrant/skills -a claude-code
Команда плагинаАльтернативный
/plugin add https://github.com/qdrant/skills
Git клонированиеАльтернативный
git clone https://github.com/qdrant/skills.git ~/.claude/skills/qdrant-hybrid-search

Скопируйте и вставьте эту команду в Claude Code для установки этого навыка

Документация

Hybrid Search in Qdrant

Hybrid search means running two or more different searches in parallel and combining their results into one.

In Qdrant this is powered by the Query API via prefetch: each prefetch runs exactly one type of search independently, and the outer query combines results from parallel prefetches.
Prefetches can be nested and searches can be multi-stage, all pipeline happening in one request through Query API. See Universal Query API for examples.

Identify the user's problem and pick building blocks:

  • What can go into one prefetch, e.g. power one search, in Search Types
  • How to combine results of these searches (RRF, DBSF, FormulaQuery, reranking) in Combining Searches

Based on what you've picked, test your approach:

  1. Configure Qdrant collection with named vectors, where each named vector usually corresponds to one representation (different embedding models or different vector types) of a data point.
  2. Construct a hybrid search request with Query API from your building blocks. You can search independently among one type of vectors, with prefetch + using, like shown in examples in Hybrid Queries documentation.
  3. Evaluate hybrid search quality on real user data and provide user with improvements and tradeoffs (speed/resources).

How Isolated Are Parallel Searches?

Use when: different tenants share one collection and you need to understand hybrid search isolation guarantees.

If user wants to isolate/share hybrid search pipelines between tenants, consider that:

  • Indexes (sparse, payload and dense) and IDF modifier for sparse vectors are computed independently per shard, not per tenant.
  • Prefetch runs independently per shard to retrieve #limit results, so for collection-level prefetches if collection has several shards, Qdrant will always prefetch under the hood #limit * #shard results. Final results are merged based on scores.
  • In nested prefetches (deeper than 1 level), methods described in "Combining Searches" might be done on a shard level first, then per-shards results once again will be merged based on scores.

What NOT to Do

  • Choose a hybrid search pattern based on "vibes" without any hybrid search quality evaluation in-place.
  • Create too many named vectors without a need. An unfilled named vector might take as much resources as a filled one.

GitHub репозиторий

qdrant/skills
Путь: skills/qdrant-search-quality/search-strategies/hybrid-search
0
agent-skillsai-agentsclaude-codecodexcursorembeddings

Похожие навыки

release-standards

Документы

Этот навык предоставляет рекомендации по семантическому версионированию (semver) и стандарты форматирования журнала изменений для релизов программного обеспечения. Используйте его при подготовке выпусков, чтобы правильно увеличивать номера версий (мажорные/минорные/патчи) и структурировать записи в журнале изменений. Он включает правила для идентификаторов предварительных релизов и понятные примеры для разработчиков.

Просмотреть навык

commit-standards

Документы

Этот навык форматирует сообщения коммитов Git в соответствии со стандартом Conventional Commits. Он предоставляет шаблоны и определения типов (такие как `feat`, `fix`, `refactor`), чтобы обеспечить единообразие при написании или проверке коммитов. Используйте его в процессе создания коммитов для формирования понятной и структурированной истории изменений.

Просмотреть навык

huggingface-tokenizers

Документы

Этот навык обеспечивает высокопроизводительную токенизацию с использованием Rust-библиотеки от HuggingFace, обрабатывая 1 ГБ текста менее чем за 20 секунд. Он поддерживает алгоритмы BPE, WordPiece и Unigram, а также позволяет обучать пользовательские токенизаторы и отслеживать выравнивание. Используйте его, когда требуется производственно-быстрая токенизация или для создания пользовательских токенизаторов, интегрированных с экосистемой transformers.

Просмотреть навык

nano-pdf

Документы

nano-pdf — это инструмент командной строки, который позволяет разработчикам редактировать PDF-файлы с помощью инструкций на естественном языке, например, изменять текст или исправлять опечатки на конкретных страницах. Он идеально подходит для быстрых программных изменений PDF прямо из терминала. Всегда проверяйте результат, так как нумерация страниц может различаться в разных версиях.

Просмотреть навык