AI 에이전트
AI 에이전트는 대규모 언어 모델(LLM)이 주어진 목표를 달성하기 위해 스스로 계획을 세우고, 도구를 호출하며, 환경의 피드백을 받아 다음 행동을 반복적으로 결정하는 자율 시스템입니다. 정해진 코드 경로를 따르는 워크플로와 달리, 에이전트는 작업을 어떻게 수행할지에 대한 통제권을 LLM이 직접 쥐고 있다는 점이 핵심입니다.
- AI 에이전트는 LLM이 목표 달성을 위해 자율적으로 계획·도구 사용·반복을 수행하는 시스템을 가리킵니다.
- Anthropic은 정해진 코드 경로로 LLM을 조율하는 워크플로와, LLM이 자기 프로세스와 도구 사용을 스스로 통제하는 에이전트를 명확히 구분합니다.
- 에이전트의 기본 구성요소는 계획(Planning), 메모리(Memory), 도구(Tools)이며, 이를 갖춘 LLM을 '증강된 LLM(augmented LLM)'이라 부릅니다.
- 에이전트는 매 단계 환경의 실제 결과(ground truth)를 받아 진행 상황을 평가하고 다음 행동을 결정하는 피드백 루프로 동작합니다.
- 이 항목은 에이전트 시스템 자체에 초점을 맞추며, 에이전틱 웹·에이전틱 검색 같은 응용 개념과는 구분됩니다.
AI 에이전트란 무엇인가
AI 에이전트는 대규모 언어 모델(LLM)이 사람이 모든 단계를 지시하지 않아도 목표를 향해 스스로 판단하며 작업을 진행하는 시스템입니다. 사용자가 목표를 제시하면, 에이전트는 필요한 단계를 계획하고, 검색·코드 실행·API 호출 같은 도구를 골라 쓰며, 각 단계의 결과를 보고 다음에 무엇을 할지 반복적으로 결정합니다. Google은 에이전트를 "추론·계획·메모리 능력을 사용해 사용자를 대신해 행동할 수 있는 지능형 시스템"으로 설명하며, 여러 단계를 미리 내다보고 여러 시스템에 걸쳐 작업을 수행하는 점을 강조합니다.
주의할 점은 이 용어가 에이전틱 웹이나 에이전틱 검색과 인접하지만 같지 않다는 것입니다. 후자는 에이전트가 웹을 탐색하거나 검색을 수행하는 응용 영역을 다루는 반면, 여기서 말하는 AI 에이전트는 그 응용을 가능하게 하는 '에이전트 시스템 자체'의 구조와 동작 원리에 초점을 맞춥니다.
워크플로와 에이전트의 구분
Anthropic은 「Building Effective Agents」에서 LLM 기반 시스템을 두 부류로 나눕니다. 둘을 묶어 '에이전틱 시스템(agentic system)'이라 부르되, 동작 방식은 분명히 다릅니다. 이 구분은 어떤 작업에 어느 수준의 자율성이 필요한지를 판단하는 실무적 기준이 됩니다.
| 구분 | 워크플로(Workflow) | 에이전트(Agent) |
|---|---|---|
| 제어 방식 | 사람이 미리 짠 코드 경로로 LLM과 도구를 조율 | LLM이 자기 프로세스와 도구 사용을 스스로 통제 |
| 경로 결정 | 고정·예측 가능 | 동적·런타임에 결정 |
| 적합한 상황 | 단계가 명확하고 반복적인 작업 | 경로를 미리 정하기 어렵고 판단이 필요한 작업 |
| 예시 | 프롬프트 체이닝, 라우팅, 병렬화 | 목표만 주고 해결 과정을 위임하는 자율 루프 |
Anthropic의 핵심 권고는 "단순한 해법에서 시작하고, 복잡성은 분명히 필요할 때만 추가하라"는 것입니다. 많은 작업은 완전한 에이전트가 아니라 잘 설계된 워크플로만으로 충분하며, 자율성이 높아질수록 비용·지연·예측 불가능성도 함께 커지기 때문입니다.
구성요소: 계획, 메모리, 도구
에이전트의 토대는 '증강된 LLM(augmented LLM)'입니다. 이는 검색(retrieval), 도구(tools), 메모리(memory)로 강화된 LLM으로, 단순히 텍스트를 생성하는 데 그치지 않고 "스스로 검색 쿼리를 만들고, 적절한 도구를 선택하며, 무엇을 기억할지 결정"합니다. 학계의 대표 서베이인 Wang et al.의 「A Survey on Large Language Model based Autonomous Agents」(arXiv:2308.11432, 2023)는 다수의 선행 연구를 아우르는 통합 프레임워크를 제안하며, 자율 에이전트를 프로파일·메모리·계획·행동 모듈로 구조화하는 관점을 정리했습니다.
계획(Planning)
복잡한 목표를 실행 가능한 하위 단계로 분해하고, 순서를 정하며, 중간 결과에 따라 계획을 수정합니다. 한 번에 정답을 내기 어려운 문제를 단계적으로 풀어 나가는 능력의 핵심입니다.
메모리(Memory)
대화 이력과 과거 단계의 결과를 저장해 다중 턴 상호작용과 추론에 활용합니다. Google 역시 메모리가 이력을 보관해 멀티턴 대화를 가능하게 하고 에이전트의 추론을 돕는다고 설명합니다.
도구(Tools)
웹 검색, 코드 실행, 외부 API 호출처럼 LLM 자체가 갖지 못한 능력을 외부에서 끌어옵니다. 도구의 결과는 다음 행동을 결정하는 '환경의 실제 정보'가 되므로, 명확한 문서화와 테스트를 갖춘 도구 설계가 에이전트 성능을 좌우합니다.
동작 원리: 피드백 루프
에이전트의 본질은 한 번의 응답이 아니라 반복 루프에 있습니다. Anthropic의 설명에 따르면 에이전트는 독립적으로 계획을 세우고, "매 단계 환경으로부터 얻은 실제 정보(ground truth from the environment at each step)"를 바탕으로 도구를 사용하며, 진행 상황을 스스로 평가하고, 필요하면 중간 체크포인트에서 사람의 피드백을 받기 위해 멈춥니다. 이런 자율 동작이 안정적으로 작동하려면 "명확한 평가 기준(clear evaluation criteria)"과 에이전트의 의사결정에 대한 신뢰가 전제되어야 합니다.
Google Vertex AI의 설명도 같은 골격을 보여 줍니다. 오케스트레이션 계층이 모델 출력과 도구를 결합하는 '추론 루프(reasoning loop)'를 관리하며, 멀티 스텝 워크플로를 다루고 더 정확한 응답을 위해 언제 도구를 호출할지 판단합니다.
SEO·GEO 시사점
AI 에이전트의 부상은 검색·콘텐츠 전략의 전제를 바꿉니다. 사람이 직접 페이지를 클릭해 읽는 대신, 에이전트가 사람을 대신해 정보를 수집·비교·종합하는 흐름이 늘어나기 때문입니다. 운영자 관점에서 다음을 고려할 만합니다.
- 에이전트가 호출하는 도구의 출력(검색 결과, API 응답)이 곧 의사결정 근거가 되므로, 기계가 신뢰성 있게 파싱할 수 있는 구조화된 콘텐츠와 명확한 사실 진술이 중요해집니다.
- 에이전트는 단편 텍스트가 아니라 '환경의 실제 결과'를 평가하며 움직이므로, 권위 있는 출처·일관된 데이터·검증 가능한 정보를 제공하는 페이지가 인용·활용될 가능성이 높아집니다.
- 이는 생성형 검색에 인용되도록 최적화하는 GEO와 직접 맞닿아 있으며, AI 에이전트는 그 응용을 구동하는 기반 기술에 해당합니다.