
멀티 에이전트 워크플로 6 패턴 — Supervisor부터 Swarm까지
멀티 에이전트 워크플로의 6가지 패턴(Supervisor / Sequential / Hierarchical / Network / Swarm / Map-Reduce)을 1차 자료 기반으로 정리. 각 패턴의 토폴로지와 적합 task, production에서 패턴 선택 의사결정 기준.
에이전트 프레임워크·오케스트레이션·메모리·Claude Code 같은 프론티어 도구의 내부 설계를 분석하고, 자기 시스템에 옮겨 적용할 수 있는 패턴으로 정리합니다.
단일 에이전트로 풀리던 문제와 멀티 에이전트가 필요한 문제를 구분하는 의사결정 프레임, 컨텍스트·메모리·평가 사이클의 실제 한계, 그리고 "AI 도구가 AI 도구를 만든다"는 사이클의 비용 구조를 같이 본다.
자기 에이전트를 만드는 1인 빌더, 사내 에이전트 도입을 검토하는 PM·아키텍트, AI 도구 아키텍처를 학습 자료로 다루는 분석가가 주된 독자다. 코드 스니펫보다 의사결정 프레임 중심으로 다룬다.

멀티 에이전트 워크플로의 6가지 패턴(Supervisor / Sequential / Hierarchical / Network / Swarm / Map-Reduce)을 1차 자료 기반으로 정리. 각 패턴의 토폴로지와 적합 task, production에서 패턴 선택 의사결정 기준.

한국 금융사 광고 기획 흐름(브리핑→리서치→기획→컴플라이언스→집행)을 멀티 에이전트로 옮겨 보는 3단계 로드맵. Phase 1 RAG Agent Chatbot, Phase 2 협업 멀티 에이전트(CrewAI 예시) + HITL, Phase 3 LangGraph 매크로 플로우 + Mem0 + Langfuse 그림을 컴포넌트 다이어그램·핵심 코드·한계 시나리오와 함께 한 가지 시각으로 정리.

Anthropic은 멀티 에이전트가 90.2% 향상을 만든다고 보고하고, Cognition은 'Don't Build'를 권한다. 두 진영의 1차 자료를 정면 비교해 single vs multi 의사결정 기준을 정리.
멀티 에이전트 워크플로의 6가지 패턴(Supervisor / Sequential / Hierarchical / Network / Swarm / Map-Reduce)을 1차 자료 기반으로 정리. 각 패턴의 토폴로지와 적합 task, production에서 패턴 선택 의사결정 기준.
한국 금융사 광고 기획 흐름(브리핑→리서치→기획→컴플라이언스→집행)을 멀티 에이전트로 옮겨 보는 3단계 로드맵. Phase 1 RAG Agent Chatbot, Phase 2 협업 멀티 에이전트(CrewAI 예시) + HITL, Phase 3 LangGraph 매크로 플로우 + Mem0 + Langfuse 그림을 컴포넌트 다이어그램·핵심 코드·한계 시나리오와 함께 한 가지 시각으로 정리.
Anthropic은 멀티 에이전트가 90.2% 향상을 만든다고 보고하고, Cognition은 'Don't Build'를 권한다. 두 진영의 1차 자료를 정면 비교해 single vs multi 의사결정 기준을 정리.
Anthropic의 Advisor Tool을 두 번 읽고 떠오른 생각. 이건 새 아키텍처가 아니라 2026년 가격 구조에 맞춰진 임시 해법이다. Opus 가격이 내려가면 사라질 패턴이고, 같은 시기 다른 11편의 논문도 결국 같은 방향으로 움직이고 있다. 시리즈의 앵커.
쪼갠 에이전트를 어떻게 조직할 것인가. 네 가지 구조를 살펴보면서 'LLM 스웜은 사실 스웜이 아니다'라는 회의적 논문 한 편을 함께 본다. 결국 구조 선택은 가격에 끌려간다는 게 결론. 시리즈 2편.
2026년 논문들이 에이전트를 쪼개는 다섯 가지 방식을 한자리에 놓고 본다. Role·Skill·Judge가 같은 개념을 다른 이름으로 부르고 있다는 점, 그리고 시간축 연구가 거의 비어 있다는 점이 따라 나오는 결론. 시리즈 1편.
Self-Tuning Loop 4단계(Generate → Capture → Analyze → Evolve)를 범용 모듈로 추출. Supabase DDL, diff 캡처 유틸, 분석/진화 프롬프트 전문, 이메일/블로그 적용 예시, GitHub 레퍼런스 구현.
1편에서 소개한 Self-Tuning Loop 패턴을 실제로 운영하는 시스템의 전체 아키텍처. 데이터 수집(35개 소스), AI 큐레이션, Telegram 입력 파이프라인, 주간 자동 리뷰, Syncthing 기반 무배포 프롬프트 진화까지.
AI 초안을 수정할 때마다 발생하는 implicit feedback(편집 diff)을 캡처하고, 주기적으로 패턴을 분석하여 프롬프트를 자동 진화시키는 Self-Tuning Loop 패턴. 학술 연구(DSPy, TextGrad, POHF)와의 gap 분석 포함.
Claude Code 소스 유출(512K줄 TS)에서 확인된 에이전트 시스템 설계의 6-Layer 캔버스와 8+4 핵심 패턴. 250K/일 API 낭비를 3줄로 해결한 Circuit Breaker부터, 23단계 bash AST 보안까지.
2026년 3월 31일 npm 소스맵 사고로 드러난 Claude Code 내부. 4단계 실행, 7가지 모드, 11단계 Agent Loop의 전체 구조를 분석
44개 Feature Flag 중 20개 비활성. KAIROS, Auto-Dream, UltraPlan, Coordinator, Bridge, Daemon, UDS Inbox, Buddy 분석과 경쟁사 비교
CC 내부 Memory System(4타입 영구 메모리, Auto-Dream, Auto-Compact)과 독립 구축한 3-Layer 시스템(문서→인덱스→시맨틱검색)의 구조적 대응. validate_placement()는 CC에 없는 차별점
52개 빌트인 도구의 공통 인터페이스, 10단계 실행 파이프라인, 안전=병렬/위험=순차 동시성 모델, 5단계 권한 파이프라인, 888KB 23단계 bash 보안
랄프루프의 한계(프롬프트 기반, 가중치 학습 불가)를 넘어 ALAS·Self-Evolving Agents의 자율 파라미터 업데이트, Multi-Agent Swarm + World Models까지. 한국 랄프톤 사례와 개발자 역할 전환 분석
while true + cat task.md에서 출발하여 Stop Hook, 파일 기반 상태 영속성, Cross-Model Worker-Reviewer 분리까지. 코딩·프롬프트 정제·테스트 확장 3가지 실전 예시와 오픈소스 생태계 분석
RLHF → ReAct → Reflexion → LangGraph/AutoGen → Context Rot → Ralph Loop. AI 에이전트 루프 아키텍처 6세대의 진화 과정과, 각 세대가 해결한 문제·남긴 한계를 실험 데이터와 함께 분석
AI 응답 품질을 다른 AI로 평가하는 LLM-as-Judge 패턴의 정의와 다차원 평가 지표 설계, 신뢰성 검증 방법 및 위치·장황함 편향 대응 전략 분석