INSIGHTS
Agent Washing — 진짜 Agent 가르는 7개 체크리스트
“Agent”라는 이름을 단 모든 제품이 진짜 Agent는 아닙니다. 운영 환경에서 끝까지 책임지는 Agent를 가르는 7개 기준.
2026년, “Agent”는 가장 흔한 마케팅 단어가 됐습니다.
그러나 우리가 실제 도입 후 자주 듣는 말은 두 가지입니다 — “생각보다 자동화가 안 된다”와 “규정 준수가 불안하다”. 이름만 Agent인 제품과, 진짜 운영 가능한 Agent를 가르는 7개 체크리스트를 정리했습니다.
1. 자율 실행 (Autonomous Execution)
사용자 명령 한 번으로 여러 단계를 스스로 결정·실행할 수 있는가? 매 단계마다 사용자 입력이 필요하다면 그건 “AI 비서”이지 Agent가 아닙니다. 진짜 Agent는 “이메일 보내” 같은 하이레벨 명령에 도구 선택 → 컨텍스트 수집 → 작성 → 검증 → 발송까지 스스로 합니다.
2. 안전한 정지 (Safe Halt)
판단이 불확실하거나 권한 밖이면 안전하게 멈추는가? 잘못된 답을 자신만만하게 내놓는 Agent는 위험합니다. “확신이 없습니다, 사람에게 넘기겠습니다”라고 말할 줄 아는 게 운영 Agent의 기본기.
3. 추적 가능성 (Auditability)
모든 판단이 추적 가능한가? “왜 이 답변을 했나”를 사후에 재구성할 수 있어야 규제 산업에 도입 가능. RAG 인용·도구 사용 로그·모델 버전·프롬프트 — 전부 기록되고 검색 가능해야 합니다.
4. 권한 분리 (Permission Boundaries)
역할별 권한이 명확한가? 일반 직원 Agent와 임원 Agent가 같은 데이터에 접근해선 안 됩니다. RBAC가 Agent 동작 안에 적용되는지 확인하세요.
5. 성능 평가 (Eval Framework)
“점수”가 있는가? Demo는 잘 보이지만 운영에서 무너지는 이유는 Eval이 없기 때문. LLM-as-Judge + 휴먼 검수 + 리그레션 테스트가 표준 셋. Drift 감지도 필수.
6. 비용·지연 통제 (Cost & Latency Control)
예산 한도와 응답 시간 SLA가 있는가? 토큰 폭주로 청구서가 1000% 뛰는 사례, 매일 발생합니다. Multi-LLM 라우팅으로 비용·지연을 동시 통제하는 구조가 필요합니다.
7. 도메인 데이터 결합 (Domain Grounding)
회사 데이터에 진짜로 묶여 있는가? Generic LLM이 우리 회사인 척하는 것과 도메인 RAG로 인용하는 것은 다릅니다. 우리 정책·우리 가격·우리 문서를 인용하지 못한다면 그건 도메인 Agent가 아닙니다.
요약
이 7개 중 4개 이상 통과하지 못한다면, 그건 Agent라기보다 LLM 챗봇 인터페이스에 가깝습니다. 도입 전 벤더에게 위 항목별로 구체적 답변을 받아보시길 권합니다.
인지하다는 위 7개 항목 모두 표준으로 제공합니다. Discovery 미팅 신청 →