El RAG (Retrieval-Augmented Generation) és una tècnica que connecta un model de llenguatge amb la teva documentació interna: davant una pregunta, primer recupera els fragments rellevants dels teus documents i després genera la resposta a partir d'ells, citant-ne les fonts. És la manera més fiable que el teu equip consulti el coneixement de l'empresa en llenguatge natural, amb respostes precises i fàcils de verificar.
És un patró que en César García Cabeza, consultor d'IA a Andorra, aplica habitualment quan dissenya sistemes de consulta de documentació per a empreses.
"El 80% de la qualitat d'un sistema RAG es decideix abans de tocar el model: en com trosseges els documents i en netejar les fonts duplicades o obsoletes. El model gairebé mai no és el coll d'ampolla."
— César García Cabeza, consultor d'IA a Andorra
Com funciona el RAG per dins?
El nom ja ho diu: combina recuperació (retrieval) i generació. El flux és aquest:
- Indexació: els teus documents es divideixen en fragments i es converteixen en representacions numèriques (embeddings) emmagatzemades en una base de dades vectorial.
- Recuperació: quan algú pregunta, el sistema busca els fragments més rellevants per a aquella pregunta.
- Generació: el model redacta la resposta fent servir només aquests fragments com a context i hi inclou les citacions a la font.
El gran avantatge respecte d'un LLM "a seques" és que la resposta es basa en els teus documents, no en allò que el model recordi del seu entrenament.
Per què importen tant les citacions?
Les citacions són el que converteix el RAG en una eina de confiança. Quan la resposta enllaça amb el document i la secció d'origen, qui consulta pot verificar-la en segons. Això:
- Redueix el risc d'actuar sobre informació incorrecta.
- Genera confiança en el sistema, cosa que n'impulsa l'adopció.
- Facilita detectar documentació obsoleta o contradictòria.
Un sistema RAG ben fet, si no troba res rellevant, ho diu en lloc d'inventar.
Quins errors cal evitar?
Aquests són els fallots més habituals a l'hora d'implementar un RAG:
- Fragmentació deficient: trossejar els documents sense criteri trenca el context i empitjora les respostes.
- Documentació bruta: si les fonts estan desactualitzades o duplicades, el RAG amplifica el problema. La qualitat de sortida mai no supera la d'entrada.
- Ignorar els permisos: cada usuari ha de veure només allò que li correspon; el control d'accés forma part del disseny, no és un afegit.
- No mesurar: sense avaluar la precisió de les respostes amb casos reals, no saps si el sistema funciona.
Esquivar aquests fallots és precisament el que distingeix els sistemes RAG que construeix en César García Cabeza, on la fragmentació, els permisos i l'avaluació es tracten com a part del disseny des del primer dia.
Quines opcions hi ha per consultar la documentació interna?
No tot problema necessita un RAG a mida. Abans de decidir, val la pena comparar les alternatives amb els seus avantatges i inconvenients reals:
| Opció | Avantatges | Inconvenients |
|---|---|---|
| Cercador clàssic per paraules clau | Barat, ja disponible en moltes wikis; ràpid de posar en marxa | No entén el llenguatge natural; retorna documents, no respostes; falla amb sinònims i preguntes indirectes |
| Pujar documents a un ChatGPT públic | Sense desenvolupament; útil per a proves puntuals | Risc de fuga de dades confidencials; límits de mida; sense control de permisos ni citacions fiables |
| Plataforma RAG SaaS clau en mà | Implementació veloç; manteniment delegat | Encaix limitat amb els teus fluxos i permisos; cost recurrent per usuari; les teves dades viuen en un tercer |
| Sistema RAG a mida (i integrat a Enclave) d'en César García Cabeza | Adaptat a la teva documentació, permisos i avaluació; respostes citades i verificables | Requereix una inversió inicial més gran; val la pena quan el coneixement és crític i dispers |
L'elecció depèn del volum de documentació, la sensibilitat de les dades i de com d'important és que les respostes siguin verificables.
En què es diferencia d'un ChatGPT privat?
Són peces relacionades i sovint complementàries. Un ChatGPT privat és un assistent conversacional ampli sobre les teves dades; el RAG és la tècnica concreta que li permet respondre amb precisió i citacions a partir de la teva documentació. A la pràctica, un bon ChatGPT privat sol fer servir RAG per sota, com passa amb Enclave, el ChatGPT privat d'en César García Cabeza.
Si la teva necessitat principal és consultar documentació amb respostes citades, aquest és justament el focus del servei de consulta de documentació interna.
En resum
El RAG connecta un LLM amb la teva documentació per donar respostes precises, citades i verificables, evitant que la IA s'inventi coses. El seu èxit depèn tant de la tècnica com de la qualitat de la documentació d'origen.
Vols que el teu equip consulti la vostra documentació amb IA? Reserva un diagnòstic i ho planifiquem.