document-rag-pipeline
À propos
Cette compétence construit un pipeline RAG complet pour des collections de documents, gérant l'extraction de texte PDF, l'OCR pour les fichiers scannés et les embeddings vectoriels pour la recherche sémantique. Elle est conçue pour les développeurs créant des bases de connaissances consultables à partir de dossiers de documents tels que des normes techniques ou des bibliothèques PDF. Le pipeline gère l'ensemble du flux de travail, de l'ingestion au stockage vectoriel prêt à l'interrogation.
Installation rapide
Claude Code
Recommandénpx skills add vamseeachanta/workspace-hub -a claude-code/plugin add https://github.com/vamseeachanta/workspace-hubgit clone https://github.com/vamseeachanta/workspace-hub.git ~/.claude/skills/document-rag-pipelineCopiez et collez cette commande dans Claude Code pour installer cette compétence
Dépôt GitHub
Compétences associées
data-mesh-expert
AutreCette compétence de Claude offre des conseils d'expert sur la mise en œuvre d'une architecture Data Mesh pour des systèmes de données décentralisés et évolutifs. Elle aide les développeurs à concevoir une gouvernance des données orientée domaine, à créer des produits de données et à établir une gouvernance fédérée avec des plateformes en libre-service. Utilisez cette compétence lors de la planification ou de la refonte d'infrastructures de données à grande échelle pour les aligner sur les domaines organisationnels.
airflow-expert
AutreCette Compétence Claude offre une orchestration experte d'Apache Airflow pour concevoir et gérer des pipelines de données complexes. Elle fournit une connaissance approfondie des DAGs, opérateurs, capteurs, XComs, dépendances de tâches et planifications pour créer des workflows fiables. Utilisez-la lors du développement, du dépannage ou de l'optimisation de déploiements Airflow en production.
airflow-expert
AutreCette compétence de Claude fournit des conseils de niveau expert pour l'orchestration de flux de travail avec Apache Airflow, incluant la conception de DAG, les opérateurs, les capteurs et les dépendances entre tâches. Utilisez-la lors de la construction ou du dépannage de pipelines de données complexes pour mettre en œuvre des modèles fiables de planification et d'exécution. Elle couvre les opérations en production, les XComs et la génération dynamique de tâches pour une gestion évolutive des flux de travail.
data-mesh-expert
AutreCette compétence de Claude fournit des conseils d'expert sur la mise en œuvre de l'architecture Data Mesh, aidant les développeurs à concevoir des systèmes de données décentralisés et détenus par les domaines. Elle couvre les principes fondamentaux tels que les données en tant que produit, la gouvernance fédérée et les plateformes en libre-service pour une gestion des données évolutive. Utilisez cette compétence lors de la construction ou de la modernisation d'une infrastructure de données pour gérer la complexité organisationnelle à grande échelle.
