Paramètres de recherche avancés
Comprendre la recherche RAG
Vue d'ensemble
La recherche RAG (Retrieval-Augmented Generation) fonctionne en deux phases :
Le système calcule la similarité entre votre question et TOUS les chunks de votre dossier de travail.
Il ne retient que les n_results meilleurs chunks pour les envoyer au modèle LLM.
Le paramètre "Nombre de résultats" (n_results)
Attention : Ce paramètre ne détermine PAS combien de chunks sont analysés, mais combien sont retenus!
Vos 1000 documents sont découpés en chunks et vectorisés
→ 1000 chunks stockés dans la base
Votre question est comparée aux 1000 chunks
→ 1000 scores de similarité calculés
Élimination des chunks trop petits/grands
→ ~850 chunks valides restants
Tri des chunks par score décroissant
→ Meilleurs scores en premier
Sélection de n_results × 3 meilleurs chunks
n_results = 8 → 24 candidats
n_results = 64 → 192 candidats
Ne garde que les chunks avec score > threshold
→ Résultats finaux (≤ n_results)
Exemple concret
Imaginons que vous cherchez une information rare dans 1000 chunks :
Avec n_results = 8
- ✅ Calcul sur 1000 chunks
- ✅ Filtrage → 850 valides
- ✅ Tri par score
- ⚠️ Sélection des 24 meilleurs
- ❌ Chunk pertinent au rang 150 → IGNORÉ
8 sources consultées
8.1s
11.5K car.
Avec n_results = 64
- ✅ Calcul sur 1000 chunks
- ✅ Filtrage → 850 valides
- ✅ Tri par score
- ✅ Sélection des 192 meilleurs
- ✅ Chunk pertinent au rang 150 → TROUVÉ
30 sources consultées
36.2s
43.4K car.
Recommandations
n_results = 5-8 → 15-24 candidats
Pour des questions simples et directes
n_results = 12-20 → 36-60 candidats
Recommandé pour un usage général
n_results = 30-64 → 90-192 candidats
Pour des analyses complexes ou informations rares
Métaphore simple
C'est comme chercher une aiguille dans une botte de foin :
Vous ne regardez que les 24 premières poignées de foin
Vous regardez les 192 premières poignées → plus de chances !
Résumé
La recherche analyse TOUS les chunks de votre dossier de travail
Mais ne considère que n_results × 3 candidats
Si l'info est rare → augmenter n_results
Compromis : performance vs complétude
Analyse en temps réel
Contexte utilisé pour la réponse
×Ajouter des documents PDF
×Glissez vos documents ici
ou
Formats acceptés : PDF, Word, Excel, PowerPoint, Images (PNG, JPG, TIFF, BMP, WebP), HTML, Markdown, CSV • Taille max : 50 MB par fichier