에이전트 & 아키텍처

22개의 글

에이전트 프레임워크·오케스트레이션·메모리·Claude Code 같은 프론티어 도구의 내부 설계를 분석하고, 자기 시스템에 옮겨 적용할 수 있는 패턴으로 정리합니다.

단일 에이전트로 풀리던 문제와 멀티 에이전트가 필요한 문제를 구분하는 의사결정 프레임, 컨텍스트·메모리·평가 사이클의 실제 한계, 그리고 "AI 도구가 AI 도구를 만든다"는 사이클의 비용 구조를 같이 본다.

자기 에이전트를 만드는 1인 빌더, 사내 에이전트 도입을 검토하는 PM·아키텍트, AI 도구 아키텍처를 학습 자료로 다루는 분석가가 주된 독자다. 코드 스니펫보다 의사결정 프레임 중심으로 다룬다.

에이전트 & 아키텍처

에이전트는 어디서 처음 틀렸나: 평가가 주장 단위까지 내려가다

주장(claim) 단위로 내려가 답에 영향 준 오류 구간을 표시하는 DRIFT와 TELBench를 읽는다. 유해 구간 찾기는 절반까지 올라왔지만 첫 오류는 ~20%에서 막힌다. 시리즈 4부, 마지막

2026년 6월 22일

에이전트 & 아키텍처

내가 짠 에이전트는 평가가 딸려 오지 않는다

커스텀 에이전트를 평가하는 세 편(MAST·AgentRx·DRBench)을 방법론 중심으로 읽는다. 실패를 부를 어휘, 틀린 자리를 짚는 법, 내 데이터를 닮은 시험대. 연구실 규모를 빌더가 어떻게 골라 빌리나. 시리즈 3부

2026년 6월 12일

에이전트 & 아키텍처

잘 만든 에이전트를 평가하는 세 가지 방식

잘 패키징된 에이전트를 평가하는 세 편(TRACE·DeepHalluBench·TRAIL)을 방법론 중심으로 읽는다. 채점 방식을 바꾸는 고도, 주장을 검증하는 고도, 측정 바탕을 바꾸는 고도. 시리즈 2부

2026년 6월 9일

전체 글

2026년 6월 22일에이전트 & 아키텍처

에이전트는 어디서 틀렸나: 정답 평가에서 과정 평가로

정답률 1등이 효용 점수 꼴찌가 되는 high-score illusion에서 시작해, 평가가 왜 과정으로 내려가는지와 일곱 편의 방법론 지형도를 깐다. 시리즈 1부

2026년 5월 9일에이전트 & 아키텍처

멀티 에이전트 워크플로 6 패턴 - Supervisor부터 Swarm까지

멀티 에이전트 워크플로의 6가지 패턴(Supervisor / Sequential / Hierarchical / Network / Swarm / Map-Reduce)을 1차 자료 기반으로 정리. 각 패턴의 토폴로지와 적합 task, production에서 패턴 선택 의사결정 기준.

2026년 5월 8일에이전트 & 아키텍처

한국 금융 마케팅 멀티 에이전트 - 시나리오 및 아키텍처 예시

한국 금융사 광고 기획 흐름(브리핑→리서치→기획→컴플라이언스→집행)을 멀티 에이전트로 옮겨 보는 3단계 로드맵. Phase 1 RAG Agent Chatbot, Phase 2 협업 멀티 에이전트(CrewAI 예시) + HITL, Phase 3 LangGraph 매크로 플로우 + Mem0 + Langfuse 그림을 컴포넌트 다이어그램·핵심 코드·한계 시나리오와 함께 한 가지 시각으로 정리.

2026년 5월 7일에이전트 & 아키텍처

싱글 vs 멀티 에이전트 - 같은 자료, 반대 결론

Anthropic은 멀티 에이전트가 90.2% 향상을 만든다고 보고하고, Cognition은 'Don't Build'를 권한다. 두 진영의 1차 자료를 정면 비교해 single vs multi 의사결정 기준을 정리.

2026년 4월 29일에이전트 & 아키텍처

Advisor는 건축이 아니라 가격표다

Anthropic의 Advisor Tool을 두 번 읽고 떠오른 생각. 이건 새 아키텍처가 아니라 2026년 가격 구조에 맞춰진 임시 해법이다. Opus 가격이 내려가면 사라질 패턴이고, 같은 시기 다른 11편의 논문도 결국 같은 방향으로 움직이고 있다. 시리즈의 앵커.

2026년 4월 28일에이전트 & 아키텍처

에이전트를 어떻게 조직하는가 - Hierarchy·Graph·Swarm·Routing과 회의론

쪼갠 에이전트를 어떻게 조직할 것인가. 네 가지 구조를 살펴보면서 'LLM 스웜은 사실 스웜이 아니다'라는 회의적 논문 한 편을 함께 본다. 결국 구조 선택은 가격에 끌려간다는 게 결론. 시리즈 2편.

2026년 4월 27일에이전트 & 아키텍처

에이전트를 어떻게 쪼개는가 - 2026년 다섯 갈래

2026년 논문들이 에이전트를 쪼개는 다섯 가지 방식을 한자리에 놓고 본다. Role·Skill·Judge가 같은 개념을 다른 이름으로 부르고 있다는 점, 그리고 시간축 연구가 거의 비어 있다는 점이 따라 나오는 결론. 시리즈 1편.

2026년 4월 24일에이전트 & 아키텍처

Self-Tuning Loop 직접 만들기 - 레퍼런스 구현 가이드

Self-Tuning Loop 4단계(Generate → Capture → Analyze → Evolve)를 범용 모듈로 추출. Supabase DDL, diff 캡처 유틸, 분석/진화 프롬프트 전문, 이메일/블로그 적용 예시, GitHub 레퍼런스 구현.

2026년 4월 21일에이전트 & 아키텍처

크론 + Telegram + Claude로 만든 자기 개선 시스템 - $0 아키텍처 해부

1편에서 소개한 Self-Tuning Loop 패턴을 실제로 운영하는 시스템의 전체 아키텍처. 데이터 수집(35개 소스), AI 큐레이션, Telegram 입력 파이프라인, 주간 자동 리뷰, Syncthing 기반 무배포 프롬프트 진화까지.

2026년 4월 18일에이전트 & 아키텍처

매일 버려지는 학습 시그널 - AI 초안과 최종본 사이의 간극

AI 초안을 수정할 때마다 발생하는 implicit feedback(편집 diff)을 캡처하고, 주기적으로 패턴을 분석하여 프롬프트를 자동 진화시키는 Self-Tuning Loop 패턴. 학술 연구(DSPy, TextGrad, POHF)와의 gap 분석 포함.

2026년 4월 3일에이전트 & 아키텍처

에이전트 시스템 설계 캔버스 - Claude Code 유출이 증명한 12가지 프로덕션 패턴

Claude Code 소스 유출(512K줄 TS)에서 확인된 에이전트 시스템 설계의 6-Layer 캔버스와 8+4 핵심 패턴. 250K/일 API 낭비를 3줄로 해결한 Circuit Breaker부터, 23단계 bash AST 보안까지.

2026년 4월 3일에이전트 & 아키텍처

Claude Code 유출이 보여준 것: AI 에이전트의 해부학

2026년 3월 31일 npm 소스맵 사고로 드러난 Claude Code 내부. 4단계 실행, 7가지 모드, 11단계 Agent Loop의 전체 구조를 분석

2026년 4월 3일에이전트 & 아키텍처

KAIROS, Auto-Dream, Coordinator: 아직 나오지 않은 기능이 말해주는 AI의 미래

44개 Feature Flag 중 20개 비활성. KAIROS, Auto-Dream, UltraPlan, Coordinator, Bridge, Daemon, UDS Inbox, Buddy 분석과 경쟁사 비교

2026년 4월 3일에이전트 & 아키텍처

내가 구축한 메모리 시스템이 Claude Code 내부와 닮아있었다

CC 내부 Memory System(4타입 영구 메모리, Auto-Dream, Auto-Compact)과 독립 구축한 3-Layer 시스템(문서→인덱스→시맨틱검색)의 구조적 대응. validate_placement()는 CC에 없는 차별점

2026년 4월 3일에이전트 & 아키텍처

52개 도구, 23단계 보안: 에이전트 Tool System의 실제

52개 빌트인 도구의 공통 인터페이스, 10단계 실행 파이프라인, 안전=병렬/위험=순차 동시성 모델, 5단계 권한 파이프라인, 888KB 23단계 bash 보안

2026년 3월 31일에이전트 & 아키텍처

랄프루프 너머 - 자율 진화 에이전트와 AI 개발자의 역할 변화

랄프루프의 한계(프롬프트 기반, 가중치 학습 불가)를 넘어 ALAS·Self-Evolving Agents의 자율 파라미터 업데이트, Multi-Agent Swarm + World Models까지. 한국 랄프톤 사례와 개발자 역할 전환 분석

2026년 3월 31일에이전트 & 아키텍처

랄프루프 실전 구현 가이드 - Bash 한 줄에서 Cross-Model Review까지

while true + cat task.md에서 출발하여 Stop Hook, 파일 기반 상태 영속성, Cross-Model Worker-Reviewer 분리까지. 코딩·프롬프트 정제·테스트 확장 3가지 실전 예시와 오픈소스 생태계 분석

2026년 3월 31일에이전트 & 아키텍처

AI 에이전트 루프의 진화 - RLHF에서 랄프루프까지

RLHF → ReAct → Reflexion → LangGraph/AutoGen → Context Rot → Ralph Loop. AI 에이전트 루프 아키텍처 6세대의 진화 과정과, 각 세대가 해결한 문제·남긴 한계를 실험 데이터와 함께 분석

2026년 3월 13일에이전트 & 아키텍처WICHI

LLM-as-Judge - AI 응답을 AI로 평가하는 구조

AI 응답 품질을 다른 AI로 평가하는 LLM-as-Judge 패턴의 정의와 다차원 평가 지표 설계, 신뢰성 검증 방법 및 위치·장황함 편향 대응 전략 분석