에이전틱 RAG
에이전틱 RAG(Agentic RAG)는 자율 AI 에이전트를 검색 증강 생성(RAG) 파이프라인에 결합해, 에이전트가 검색 여부와 방법을 스스로 판단하고 질의를 다시 쓰며 도구를 사용하고 결과를 평가해 필요하면 재검색하는 방식의 RAG입니다. 한 번 검색하고 답을 생성하는 일반 RAG와 달리, 검색을 반복·계획·검증하는 동적 과정으로 만든다는 점이 핵심입니다.
- 에이전틱 RAG는 자율 에이전트가 검색을 반복·계획·도구사용하며 동적으로 수행하는 RAG로, '한 번 검색 후 생성'하는 일반 RAG와 구분됩니다.
- 핵심은 에이전트의 판단입니다. 검색할지 말지, 어떤 도구·지식원을 쓸지, 질의를 어떻게 다시 쓸지, 결과가 부실하면 재검색할지를 에이전트가 스스로 결정합니다.
- 서베이 논문(arXiv:2501.09136)은 에이전틱 RAG의 네 가지 핵심 패턴으로 리플렉션, 플래닝, 도구 사용, 멀티 에이전트 협업을 제시합니다.
- 아키텍처는 단일 에이전트(라우터)부터 마스터 에이전트가 여러 전문 에이전트를 조율하는 멀티 에이전트, 그래프 기반까지 다양하게 분류됩니다.
- 다중 홉 추론, 모호한 질문, 여러 지식원이 얽힌 복잡한 업무에서 일반 RAG보다 정확하고 맥락에 맞는 답을 만드는 데 유리합니다.
에이전틱 RAG란 무엇인가
에이전틱 RAG(Agentic RAG)는 자율적으로 행동하는 AI 에이전트를 검색 증강 생성(RAG) 파이프라인 안에 결합한 방식입니다. 일반 RAG가 '질의 → 검색 → 생성'이라는 고정된 한 번의 흐름을 따른다면, 에이전틱 RAG는 에이전트가 검색 자체를 반복적이고 동적인 과정으로 다룹니다. 즉 에이전트가 검색할지 말지를 판단하고, 어떤 도구나 지식원을 쓸지 고르고, 질의를 스스로 다시 작성하고, 검색된 맥락을 평가해 부족하면 다시 검색한 뒤에야 최종 답을 생성합니다.
Weaviate의 정의에 따르면 에이전틱 RAG는 "RAG 파이프라인에 AI 에이전트를 결합해 그 구성요소를 오케스트레이션하고, 단순 검색·생성을 넘어서는 추가 행동을 수행"하는 방식이며, 검색을 "에이전트가 검색하고, 평가하고, 재검색하고, 검증한 뒤 최종 답을 생성하는 반복 과정"으로 바꾸는 것이 핵심입니다(Shorten & Monigatti, 2024). 다시 말해 무엇을 결합했느냐(에이전트)보다, 그 에이전트가 검색 과정에서 판단하고 반복하고 도구를 쓴다는 점이 이 개념의 본질입니다.
일반 RAG와 에이전틱 RAG의 차이
두 방식의 차이는 '얼마나 검색을 잘하느냐'가 아니라 '검색 과정을 누가, 어떻게 통제하느냐'에 있습니다. 일반 RAG는 사람이 미리 정해 둔 파이프라인을 그대로 실행하지만, 에이전틱 RAG는 에이전트가 상황을 보고 흐름을 바꿉니다.
| 항목 | 일반 RAG (Vanilla RAG) | 에이전틱 RAG (Agentic RAG) |
|---|---|---|
| 검색 흐름 | 질의 → 검색 → 생성의 고정된 한 번의 흐름 | 에이전트가 검색·평가·재검색을 반복하는 동적 흐름 |
| 제어 주체 | 사람이 설계한 정적 파이프라인 | 에이전트의 자율적 판단(검색 여부·방법 결정) |
| 외부 도구 사용 | 없음(단일 벡터 검색 중심) | 벡터 검색·웹 검색·계산기·외부 API 등 여러 도구 선택 사용 |
| 질의 전처리 | 없음(입력 질의 그대로 검색) | 에이전트가 질의를 다시 쓰고 분해·정제 |
| 다중 단계 검색 | 단일 검색(원샷) | 다중 홉·반복 검색 가능 |
| 결과 검증 | 검색 결과 검증 없음 | 맥락 적합성·환각 여부를 평가하고 부실하면 재검색 |
| 비용·속도 | 일반적으로 빠르고 저렴 | 반복·도구 호출로 더 느리고 비용 높음 |
| 적합한 질문 | 단순·단일 사실 질의 | 다중 홉·모호·복합 추론 질의 |
위 표의 핵심 4개 행(외부 도구·질의 전처리·다중 단계 검색·결과 검증)은 Weaviate가 일반 RAG와 에이전틱 RAG를 가르는 결정적 차이로 제시한 항목입니다. NVIDIA 기술 블로그도 같은 대비를 "일반 RAG는 단순하다 — 질의하고, 검색하고, 생성한다"와 "에이전틱 RAG는 동적이다 — 에이전트가 질의하고, 정제하고, RAG를 하나의 도구로 사용하며, 시간에 걸쳐 맥락을 관리한다"로 요약합니다(Sessions, 2025).
핵심 동작 패턴
에이전틱 RAG에서 에이전트가 실제로 수행하는 동작은 대체로 다음과 같습니다. 서베이 논문은 이를 리플렉션, 플래닝, 도구 사용, 멀티 에이전트 협업이라는 네 가지 핵심 패턴으로 정리합니다(Singh et al., 2025).
- 리플렉션(Reflection): 검색 결과나 생성한 답이 질문에 맞는지 스스로 점검하고, 부족하면 질의를 다시 써서 재검색합니다.
- 플래닝(Planning): 복잡한 질문을 여러 하위 단계로 분해하고 검색 순서를 계획합니다(다중 홉 추론).
- 도구 사용(Tool Use): 벡터 검색뿐 아니라 웹 검색, 계산기, 외부 API 등 여러 도구 중 적절한 것을 골라 호출합니다.
- 멀티 에이전트 협업(Multi-Agent Collaboration): 마스터 에이전트가 내부 문서·이메일·웹 검색 등을 담당하는 여러 전문 에이전트에게 작업을 분배하고 결과를 종합합니다.
아키텍처 분류와 근거
에이전틱 RAG의 구조는 에이전트의 수와 제어 방식에 따라 나뉩니다. Weaviate는 가장 단순한 형태로 단일 에이전트 RAG(라우터)를 듭니다. 에이전트가 "여러 지식원 가운데 어디서 추가 맥락을 가져올지 결정하는 단순 라우터" 역할을 하는 구조입니다. 더 복잡한 멀티 에이전트 RAG에서는 "여러 전문 검색 에이전트 사이에서 정보 검색을 조율하는 하나의 마스터 에이전트"를 두어, 사내 독점 데이터·개인 계정(이메일·채팅)·공개 웹 검색을 각각 다른 에이전트가 담당하게 합니다(Shorten & Monigatti, 2024).
서베이 논문(arXiv:2501.09136)은 더 나아가 "에이전트 수(cardinality), 제어 구조, 자율성 수준, 지식 표현 방식"을 기준으로 에이전틱 RAG 아키텍처의 체계적 분류를 제시하며, 단일 에이전트·멀티 에이전트·그래프 기반 프레임워크를 다룹니다. 이 논문은 일반 RAG가 "정적 워크플로"이며 "다중 단계 추론과 복잡한 작업 관리에 필요한 적응성이 부족"하다는 점을 문제로 지적하고, 자율 에이전트를 끼워 넣어 "유연성, 확장성, 맥락 인식"을 확보하는 것이 에이전틱 RAG라고 설명합니다(Singh et al., 2025).
활용 사례
에이전틱 RAG는 단일 사실 조회보다, 여러 지식원을 오가며 단계적으로 추론해야 하는 업무에서 강점을 보입니다. 서베이 논문은 적용 분야로 헬스케어, 금융, 교육, 기업 문서 처리를 듭니다(Singh et al., 2025). NVIDIA 블로그는 에이전트가 "추론 모델로 답의 적합성을 점검하고 질의를 다시 써서, 최선의 응답을 얻을 때까지 반복"하는 동작을 강조하며, 고객 지원·법률 서비스·기업 지식 관리처럼 맥락이 풍부한 응답이 필요한 복잡한 애플리케이션에 유리하다고 설명합니다(Sessions, 2025). 다만 반복 검색과 도구 호출 때문에 일반 RAG보다 지연 시간과 비용이 커지므로, 질문의 복잡도에 맞춰 두 방식을 선택하거나 혼합하는 설계가 일반적입니다.
참고·출처
- Singh, A., Ehtesham, A., Kumar, S., Khoei, T. T., & Vasilakos, A. V. (2025). Agentic Retrieval-Augmented Generation: A Survey on Agentic RAG. arXiv:2501.09136
- Shorten, E., & Monigatti, L. (2024). What Is Agentic RAG? From LLM RAG to AI Agents. Weaviate Blog
- Sessions, N. (2025). Traditional RAG vs. Agentic RAG—Why AI Agents Need Dynamic Knowledge to Get Smarter. NVIDIA Technical Blog