MCP HubMCP Hub
Вернуться к навыкам

qdrant-performance-optimization

qdrant
Обновлено 5 days ago
154
18
154
Посмотреть на GitHub
Другоеgeneral

О программе

Этот навык предоставляет методы для оптимизации производительности Qdrant через стратегии индексирования, оптимизацию запросов и учет аппаратных требований. Разработчикам следует использовать его, когда необходимо повысить скорость поиска (задержку/пропускную способность) и эффективность развертывания. Он служит навигационным центром с отдельными разделами для различных аспектов оптимизации.

Быстрая установка

Claude Code

Рекомендуется
Основной
npx skills add qdrant/skills -a claude-code
Команда плагинаАльтернативный
/plugin add https://github.com/qdrant/skills
Git клонированиеАльтернативный
git clone https://github.com/qdrant/skills.git ~/.claude/skills/qdrant-performance-optimization

Скопируйте и вставьте эту команду в Claude Code для установки этого навыка

Документация

Qdrant Performance Optimization

There are different aspects of Qdrant performance, this document serves as a navigation hub for different aspects of performance optimization in Qdrant.

Search Speed Optimization

There are two different criteria for search speed: latency and throughput. Latency is the time it takes to get a response for a single query, while throughput is the number of queries that can be processed in a given time frame. Depending on your use case, you may want to optimize for one or both of these metrics.

More on search speed optimization can be found in the Search Speed Optimization skill.

Indexing Performance Optimization

Qdrant needs to build a vector index to perform efficient similarity search. The time it takes to build the index can vary depending on the size of your dataset, hardware, and configuration.

More on indexing performance optimization can be found in the Indexing Performance Optimization skill.

Memory Usage Optimization

Vector search can be memory intensive, especially when dealing with large datasets. Qdrant has a flexible memory management system, which allows you to precisely control which parts of storage are kept in memory and which are stored on disk. This can help you optimize memory usage without sacrificing performance.

More on memory usage optimization can be found in the Memory Usage Optimization skill.

GitHub репозиторий

qdrant/skills
Путь: skills/qdrant-performance-optimization
0
agent-skillsai-agentsclaude-codecodexcursorembeddings

Похожие навыки

llamaguard

Другое

LlamaGuard — это модель от Meta с 7–8 миллиардами параметров для модерации входных и выходных данных больших языковых моделей по шести категориям безопасности, таким как насилие и разжигание ненависти. Она обеспечивает точность 94–95% и может быть развернута с помощью vLLM, Hugging Face или Amazon SageMaker. Используйте этот навык, чтобы легко интегрировать фильтрацию контента и защитные механизмы в ваши ИИ-приложения.

Просмотреть навык

cost-optimization

Другое

Этот навык Claude помогает разработчикам оптимизировать облачные расходы за счет правильного подбора ресурсов, стратегий тегирования и анализа затрат. Он предоставляет framework для сокращения облачных расходов и внедрения управления затратами в AWS, Azure и GCP. Используйте его, когда вам нужно проанализировать расходы на инфраструктуру, оптимизировать ресурсы или уложиться в бюджетные ограничения.

Просмотреть навык

quantizing-models-bitsandbytes

Другое

Этот навык выполняет квантизацию LLM до 8-битной или 4-битной точности с использованием библиотеки bitsandbytes, обеспечивая сокращение использования памяти на 50-75% при минимальной потере точности. Он идеально подходит для запуска больших моделей при ограниченной памяти GPU или для ускорения вывода, поддерживая форматы INT8, NF4 и FP4. Навык интегрируется с HuggingFace Transformers и позволяет использовать обучение QLoRA и 8-битные оптимизаторы.

Просмотреть навык

dispatching-parallel-agents

Другое

Этот навык Claude распределяет нескольких агентов для исследования и устранения трёх и более независимых проблем параллельно. Он предназначен для сценариев с несвязанными сбоями, которые можно устранить без общего состояния или зависимостей. Ключевая возможность — параллельное решение проблем, где за каждую независимую предметную область назначается отдельный агент для максимальной эффективности.

Просмотреть навык