Il RAG classico ha un limite strutturale: la ricerca avviene una volta sola, a monte, e il modello deve arrangiarsi con quello che gli arriva. Un paper su arXiv propone un’alternativa, A-RAG, che ribalta lo schema dando al modello il controllo della ricerca.
L’idea
A-RAG è un framework di Agentic RAG che espone al modello interfacce di retrieval gerarchiche. In pratica fornisce tre strumenti: ricerca per parole chiave, ricerca semantica e lettura diretta dei chunk. L’agente li usa in autonomia per cercare e recuperare informazioni a diversi livelli di granularità, iterando finché ha davvero il contesto che gli serve.
Perché conta
È la differenza tra ricevere un pacco di documenti e poter frugare in un archivio. Nei casi reali una singola query di retrieval spesso non basta: servono affinamenti, ricerche incrociate, letture mirate. Dare al modello strumenti di ricerca espliciti, invece di un contesto preconfezionato, lo avvicina a come ragiona una persona quando indaga un problema.
Per chi costruisce sistemi RAG in produzione, l’approccio agentico è interessante perché sposta la complessità dal tuning del retrieval a monte alla capacità del modello di orchestrare la ricerca. Resta da valutarne il costo: più chiamate significano più latenza e più token, e il paper si concentra proprio sullo scaling di questo schema.
In sintesi
A-RAG è un tassello del trend che trasforma il RAG da pipeline statica a processo agentico. Vale la lettura se stai progettando sistemi di retrieval che devono reggere domande complesse e multi-passo.
