Assistant - Power-RAG

Cache: 0% hits

Détection auto

Paramètres de recherche avancés

Mode de recherche :

Réorganiser les résultats (Reranking) ⓘ

Reranker BGE (Cross-Encoder) ⓘ

Expansion de requête (LLM) ⓘ

Recherche parallèle (Asyncio) ⓘ

Nombre de résultats : 12 ⓘ Seuil de similarité : 0.3 ⓘ Diversité des résultats : 0.0 ⓘ Poids sémantique : 70% ⓘ Taille min. chunk : 100 car. ⓘ Taille max. chunk : 1000 car. ⓘ

Modes standards

Modes hybrides ⓘ

Modes GPT-OSS 20B (128K tokens) ⓘ

Chain-of-Thought (Raisonnement en chaîne) ⓘ

Activer le Chain-of-Thought ⓘ

Inclure le raisonnement dans la réponse ⓘ

Comprendre la recherche RAG

Vue d'ensemble

La recherche RAG (Retrieval-Augmented Generation) fonctionne en deux phases :

Phase de recherche

Le système calcule la similarité entre votre question et TOUS les chunks de votre dossier de travail.

Phase de sélection

Il ne retient que les n_results meilleurs chunks pour les envoyer au modèle LLM.

Le paramètre "Nombre de résultats" (n_results)

Attention : Ce paramètre ne détermine PAS combien de chunks sont analysés, mais combien sont retenus!

Étape 1 : Indexation

Vos 1000 documents sont découpés en chunks et vectorisés

→ 1000 chunks stockés dans la base

Étape 2 : Calcul de similarité

Votre question est comparée aux 1000 chunks

→ 1000 scores de similarité calculés

Étape 3 : Filtrage

Élimination des chunks trop petits/grands

→ ~850 chunks valides restants

Étape 4 : Tri

Tri des chunks par score décroissant

→ Meilleurs scores en premier

Étape 5 : Sélection des candidats

Sélection de n_results × 3 meilleurs chunks

n_results = 8 → 24 candidats

n_results = 64 → 192 candidats

Étape 6 : Filtrage par seuil

Ne garde que les chunks avec score > threshold

→ Résultats finaux (≤ n_results)

Exemple concret

Imaginons que vous cherchez une information rare dans 1000 chunks :

Avec n_results = 8

✅ Calcul sur 1000 chunks
✅ Filtrage → 850 valides
✅ Tri par score
⚠️ Sélection des 24 meilleurs
❌ Chunk pertinent au rang 150 → IGNORÉ

Résultat : "Information non disponible"

8 sources consultées

8.1s

11.5K car.

Avec n_results = 64

✅ Calcul sur 1000 chunks
✅ Filtrage → 850 valides
✅ Tri par score
✅ Sélection des 192 meilleurs
✅ Chunk pertinent au rang 150 → TROUVÉ

Résultat : Réponse complète et précise

30 sources consultées

36.2s

43.4K car.

Recommandations

Recherche rapide

n_results = 5-8 → 15-24 candidats

Pour des questions simples et directes

Équilibre qualité/performance

n_results = 12-20 → 36-60 candidats

Recommandé pour un usage général

Recherche approfondie

n_results = 30-64 → 90-192 candidats

Pour des analyses complexes ou informations rares

Métaphore simple

C'est comme chercher une aiguille dans une botte de foin :

n_results = 8

Vous ne regardez que les 24 premières poignées de foin

→

n_results = 64

Vous regardez les 192 premières poignées → plus de chances !

Résumé

La recherche analyse TOUS les chunks de votre dossier de travail

Mais ne considère que n_results × 3 candidats

Si l'info est rare → augmenter n_results

Compromis : performance vs complétude

Bonjour ! Je suis votre assistant, que souhaitez-vous savoir ?

Maintenant

Paramètres de recherche avancés

Comprendre la recherche RAG

Vue d'ensemble

Le paramètre "Nombre de résultats" (n_results)

Exemple concret

Avec n_results = 8

Avec n_results = 64

Recommandations

Métaphore simple

Résumé

Analyse en temps réel

Contexte utilisé pour la réponse

Ajouter des documents PDF

Glissez vos documents ici

Fichiers sélectionnés :

Résultats de la conversion :

Historique récent :