AxisOne Group Sol·licitar reunió
← Tornar al blog Intel·ligència artificial

RAG sobre la teva documentació interna: del PDF a la resposta amb cites

Equip AxisOne
Enginyeria i IA
9 de juny de 2026  •  7 min de lectura

La teva empresa ja té el coneixement: està repartit en milers de PDF, contractes, manuals i wikis que gairebé ningú consulta perquè trobar-los porta més temps del que ningú té. RAG (Retrieval-Augmented Generation) converteix aquest arxiu mort en respostes precises, amb cita a la font.

La idea és senzilla i potent: en lloc de demanar a un model de llenguatge que «recordi» la teva documentació —cosa que faria malament i amb risc d'inventar—, primer recuperem els fragments rellevants dels teus propis documents i els hi lliurem perquè redacti la resposta a partir d'ells. El resultat és una resposta fonamentada, amb enllaç al document d'origen.

Amb RAG, la IA deixa d'improvisar: respon només a partir del teu coneixement, i t'ensenya d'on ha tret cada afirmació.

Com funciona, pas a pas

Un sistema de RAG ben construït segueix un recorregut clar, i cada etapa es pot mesurar i millorar:

  • Ingesta: connectem les teves fonts (Drive, SharePoint, repositoris, bases de dades) i n'extraiem el text de cada document, inclosos els PDF escanejats mitjançant OCR.
  • Fragmentació: dividim cada document en trossos coherents que conserven el seu context i la seva referència d'origen.
  • Indexació: convertim cada fragment en un vector (embedding) i el desem en una base de dades vectorial per poder cercar per significat, no només per paraules.
  • Recuperació: davant d'una pregunta, busquem els fragments més rellevants i els ordenem per pertinència.
  • Generació: el model redacta la resposta usant només aquests fragments, i adjunta les cites als documents d'on prové.

La qualitat comença a la dada, no al model

L'error més comú és pensar que un RAG millora canviant de model. A la pràctica, la major part de la qualitat es decideix abans: en com es netegen, fragmenten i etiqueten els documents. Un bon preprocessament —respectar taules, títols i seccions, eliminar duplicats, conservar metadades com data i autor— marca més diferència que qualsevol ajust posterior.

Per això, durant la fase de consultoria organitzem i preparem les teves dades com a part del mateix projecte. No necessites tenir-ho tot ordenat per començar: comencem amb el que tens.

Cites, traçabilitat i confiança

Una resposta sense font no serveix en un entorn professional. Cada resposta d'un RAG ben fet enllaça al document i al fragment exactes que la sustenten, de manera que qualsevol pot verificar-la en segons. Aquesta traçabilitat és el que converteix un experiment simpàtic en una eina en què l'equip confia i que de debò fa servir.

A més, acotar el model als teus documents redueix dràsticament les al·lucinacions: si la resposta no és a les teves fonts, el sistema ho diu en lloc d'inventar-la.

Privat des del disseny

Tot el flux es pot executar dins del teu perímetre: la base vectorial, la recuperació i, si ho necessites, un model open source privat per a la generació. Els teus documents no s'usen per entrenar models de tercers i resideixen en regions de la Unió Europea. El coneixement de la teva empresa continua sent teu.

Casos d'ús que funcionen des del primer dia

  • Suport intern: respostes immediates sobre polítiques, procediments i normativa, amb cita al manual.
  • Atenció al client: esborranys de resposta basats en la teva base de coneixement i el teu històric.
  • Legal i compliment: cerca i resum sobre contractes i documentació regulatòria.
  • Onboarding: que cada nova incorporació pregunti i aprengui sense saturar l'equip.

Com ho abordem a AxisOne

Dissenyem l'arquitectura, connectem les teves fonts, ajustem la recuperació amb mètriques reals i despleguem la solució al teu núvol o en un entorn privat. I formem els teus equips perquè la mantinguin i la facin créixer.

Si tens coneixement dispers i vols convertir-lo en respostes fiables, escriu-nos i ho veiem sobre el teu cas concret.

Desplaça cap amunt