Ce répertoire, nommé RAG-Samples-Project, est dédié à la démonstration et à l'expérimentation des applications pratiques de la Génération Augmentée par Recherche (RAG - Retrieval Augmented Generation). Le projet vise à fournir des exemples concrets et des codes source en Python pour illustrer les différentes facettes de la RAG.
- Démontrer l'utilisation de la RAG : Ce projet contient des exemples clairs de l'utilisation de la génération augmentée par la recherche pour améliorer la qualité et la précision des réponses générées à partir de documents textuels.
- Exploration des modèles d'embeddings et de vectorisation : Il montre comment utiliser des modèles de transformation de texte et des bases de données vectorielles pour stocker et interroger efficacement de grands volumes de texte.
- Manipulation et extraction d'informations : La base de données vectorielle FAISS est utilisée pour la recherche de similarités et la génération de réponses basées sur les informations pertinentes.
load_and_segment_documents.py
: Script pour le chargement, la segmentation et la vectorisation des documents PDF.query_vector_database.py
: Script pour interroger la base de données vectorielle et récupérer les informations pertinentes.vector_db.pkl
: Fichier contenant la base de données vectorielle générée à partir des embeddings des documents.README.md
: Ce fichier, qui explique la structure et les objectifs du projet.requirements.txt
: Liste des dépendances Python nécessaires pour exécuter les scripts.
Avant de lancer les scripts, assurez-vous que les éléments suivants sont installés :
- Python 3.8 ou supérieur
- Les bibliothèques Python listées dans
requirements.txt
.
Installez les dépendances via pip :
pip install -r requirements.txt
Le code pour charger et segmenter des documents PDF se trouve dans le fichier load_and_segment_documents.py
.
Le code pour interroger la base de données vectorielle se trouve dans le fichier query_vector_database.py
.
Les contributions sont les bienvenues. Veuillez soumettre des demandes de tirage (PR) avec des descriptions détaillées des modifications.
Ce projet est sous licence MIT. Veuillez vous référer au fichier LICENSE pour plus d'informations.