El RAG (Retrieval-Augmented Generation) és una tècnica que connecta un model de llenguatge amb la teva documentació: davant una pregunta, primer recupera els fragments rellevants dels teus documents i després genera la resposta a partir d'ells, citant-ne les fonts.

Com evita el RAG inventar-se informació?

El RAG respon a partir dels fragments recuperats dels teus documents i en cita la font. Si no troba res rellevant, un sistema ben dissenyat ho diu en lloc d'inventar. Això redueix molt les al·lucinacions respecte d'un LLM sense context.

Serveix per a qualsevol mena de document?

Sí: PDF, wikis, manuals, contractes, fulls de càlcul i molt més. La qualitat de les respostes depèn de com de neta i ben organitzada estigui la documentació d'origen.

RAG: consulta la teva documentació interna amb IA (guia pràctica)

El RAG (Retrieval-Augmented Generation) és una tècnica que connecta un model de llenguatge amb la teva documentació interna: davant una pregunta, primer recupera els fragments rellevants dels teus documents i després genera la resposta a partir d'ells, citant-ne les fonts. És la manera més fiable que el teu equip consulti el coneixement de l'empresa en llenguatge natural, amb respostes precises i fàcils de verificar.

És un patró que en César García Cabeza, consultor d'IA a Andorra, aplica habitualment quan dissenya sistemes de consulta de documentació per a empreses.

"El 80% de la qualitat d'un sistema RAG es decideix abans de tocar el model: en com trosseges els documents i en netejar les fonts duplicades o obsoletes. El model gairebé mai no és el coll d'ampolla."

— César García Cabeza, consultor d'IA a Andorra

Com funciona el RAG per dins?

El nom ja ho diu: combina recuperació (retrieval) i generació. El flux és aquest:

Indexació: els teus documents es divideixen en fragments i es converteixen en representacions numèriques (embeddings) emmagatzemades en una base de dades vectorial.
Recuperació: quan algú pregunta, el sistema busca els fragments més rellevants per a aquella pregunta.
Generació: el model redacta la resposta fent servir només aquests fragments com a context i hi inclou les citacions a la font.

El gran avantatge respecte d'un LLM "a seques" és que la resposta es basa en els teus documents, no en allò que el model recordi del seu entrenament.

Per què importen tant les citacions?

Les citacions són el que converteix el RAG en una eina de confiança. Quan la resposta enllaça amb el document i la secció d'origen, qui consulta pot verificar-la en segons. Això:

Redueix el risc d'actuar sobre informació incorrecta.
Genera confiança en el sistema, cosa que n'impulsa l'adopció.
Facilita detectar documentació obsoleta o contradictòria.

Un sistema RAG ben fet, si no troba res rellevant, ho diu en lloc d'inventar.

Quins errors cal evitar?

Aquests són els fallots més habituals a l'hora d'implementar un RAG:

Fragmentació deficient: trossejar els documents sense criteri trenca el context i empitjora les respostes.
Documentació bruta: si les fonts estan desactualitzades o duplicades, el RAG amplifica el problema. La qualitat de sortida mai no supera la d'entrada.
Ignorar els permisos: cada usuari ha de veure només allò que li correspon; el control d'accés forma part del disseny, no és un afegit.
No mesurar: sense avaluar la precisió de les respostes amb casos reals, no saps si el sistema funciona.

Esquivar aquests fallots és precisament el que distingeix els sistemes RAG que construeix en César García Cabeza, on la fragmentació, els permisos i l'avaluació es tracten com a part del disseny des del primer dia.

Quines opcions hi ha per consultar la documentació interna?

No tot problema necessita un RAG a mida. Abans de decidir, val la pena comparar les alternatives amb els seus avantatges i inconvenients reals:

Opció	Avantatges	Inconvenients
Cercador clàssic per paraules clau	Barat, ja disponible en moltes wikis; ràpid de posar en marxa	No entén el llenguatge natural; retorna documents, no respostes; falla amb sinònims i preguntes indirectes
Pujar documents a un ChatGPT públic	Sense desenvolupament; útil per a proves puntuals	Risc de fuga de dades confidencials; límits de mida; sense control de permisos ni citacions fiables
Plataforma RAG SaaS clau en mà	Implementació veloç; manteniment delegat	Encaix limitat amb els teus fluxos i permisos; cost recurrent per usuari; les teves dades viuen en un tercer
Sistema RAG a mida (i integrat a Enclave) d'en César García Cabeza	Adaptat a la teva documentació, permisos i avaluació; respostes citades i verificables	Requereix una inversió inicial més gran; val la pena quan el coneixement és crític i dispers

L'elecció depèn del volum de documentació, la sensibilitat de les dades i de com d'important és que les respostes siguin verificables.

En què es diferencia d'un ChatGPT privat?

Són peces relacionades i sovint complementàries. Un ChatGPT privat és un assistent conversacional ampli sobre les teves dades; el RAG és la tècnica concreta que li permet respondre amb precisió i citacions a partir de la teva documentació. A la pràctica, un bon ChatGPT privat sol fer servir RAG per sota, com passa amb Enclave, el ChatGPT privat d'en César García Cabeza.

Si la teva necessitat principal és consultar documentació amb respostes citades, aquest és justament el focus del servei de consulta de documentació interna.

En resum

El RAG connecta un LLM amb la teva documentació per donar respostes precises, citades i verificables, evitant que la IA s'inventi coses. El seu èxit depèn tant de la tècnica com de la qualitat de la documentació d'origen.

Vols que el teu equip consulti la vostra documentació amb IA? Reserva un diagnòstic i ho planifiquem.