RAG Search
Buscar en el contexto cuando el usuario lo pide
¿Para qué sirve?
Esta acción hace que, cuando se detecte la intención asociada, el sistema busque siempre en el contexto RAG (tu base de conocimiento). Sin ella, el bot solo usa el RAG cuando otras condiciones lo permiten; con RAG Search activa en una intención, esa intención “dispara” la búsqueda.
Características principales
- No requiere configuración extra: la añades a la intención y listo.
- El resultado se usa para construir el contexto que recibe el LLM.
- Va muy bien para intenciones tipo “buscar en la web”, “consultar información”, “qué dice la documentación”, etc.
Configuración en el dashboard
En el dashboard, al editar una intención, eliges la acción RAG Search (o “Buscar en RAG”): no tiene un formulario propio dentro de la intención. En la pantalla Búsqueda RAG del bot, el acordeón Configuración de Búsqueda agrupa fragmentos para el chat, opciones de reranking y documento completo, y—si eres dueño del bot—los ajustes de orden de resultados. La guía de importancia y límite máximo del refuerzo está más abajo en esta misma página.
Flujo en el sistema
Usuario escribe → se detecta la intención (frases + umbral) → se ejecuta la acción RAG Search → el pipeline fuerza la búsqueda en ChromaDB → los fragmentos encontrados se inyectan en el contexto del LLM → el LLM responde usando ese contexto.
Configuración de búsqueda en el panel
Cuando el sistema prepara la respuesta, busca fragmentos relevantes en tu conocimiento y los ordena con un puntaje híbrido: parte viene de la similitud por significado (embeddings) y parte de refuerzos cuando el contenido coincide con lo que escribió el usuario o con metadatos (etiquetas, entidades nombradas, frases literales).
Importancia
La importancia de cada criterio actúa como multiplicador: indica cuánto puede sumar ese tipo de coincidencia al puntaje total antes de aplicar el techo. Valores habituales van de 0 a 5. Si subes la importancia de las palabras del mensaje, por ejemplo, las páginas donde aparezcan esas palabras ganarán más terreno frente a fragmentos solo “parecidos” por significado.
Límite máximo del refuerzo
El límite máximo es el techo de ese refuerzo: aunque haya muchas coincidencias, la contribución de esa señal no pasará de ese valor. Sirve para que una sola señal (muchas etiquetas coincidentes, muchas palabras clave, etc.) no reordene todo el ranking. En similitud semántica, un límite muy alto equivale a “casi sin techo”: el componente por embeddings puede usar casi todo el margen disponible.
Criterios (mismos nombres que en el panel)
- Similitud semántica — parecido por significado (embeddings), no solo texto idéntico.
- Palabras del mensaje — términos del usuario que aparecen en el contenido.
- Etiquetas del contenido — tags que asignaste a páginas o fragmentos.
- Entidades detectadas — nombres propios, lugares u organizaciones (NER).
- Frases literales — secuencias de palabras que coinciden tal cual con el texto.
Consejo práctico: Si las respuestas priorizan páginas solo por palabras sueltas y pierden el “sentido” del tema, baja un poco la importancia o el límite de palabras/frases y deja más peso a la similitud semántica. Si el bot “se pierde” en textos vagos y necesitas anclar a términos concretos o etiquetas, sube con moderación la importancia de palabras o etiquetas y revisa los límites para evitar saltos bruscos.