두 발표를 나란히 놓고
이 글은 세 부분이다. 먼저 Benedict Evans가 Lenny’s Podcast에서 한 이야기를 정리하고, 그다음 Jensen Huang의 GTC Taipei 2026 키노트를 정리한다. 마지막으로 둘을 겹쳐서 어디서 생각이 같고 어디서 갈리는지 본다.
두 사람을 한 줄로 미리 요약하면 이렇다. 둘 다 모델 그 자체는 커머디티가 된다고 본다. 다른 건 그다음이다. Evans는 가치가 모델 위쪽, 그러니까 앱과 유통으로 간다고 보고, Jensen은 모델 아래쪽, 그러니까 인프라와 CUDA로 간다고 본다. 어느 쪽이 맞을지는 지금 예측하기 어렵다.
Evans가 본 그림: 모델은 커머디티, 가치는 위로
Evans는 6개월마다 “AI is eating the world”라는 발표를 낸다. 이번 세션에서 그가 붙든 질문은 하나다. 파운데이션 모델 회사가 가격 지배력(pricing power)을 가질 수 있나.
네트워크 효과가 없다
그의 답은 회의적이다. 출발점은 모델에 네트워크 효과가 없다는 관찰이다.
“the models don’t seem to have network effects. So there doesn’t seem to be a winner takes all effect… then why would you have pricing power?” - Benedict Evans
네트워크 효과가 없으니 한 회사가 앞서 달아나는 승자독식이 생기지 않는다. 경쟁이 계속 이어지고, 제품의 근본 차별화도 약하니 가격을 받을 근거가 없다는 것이다.
그래서 그는 모델을 그 위에 얹히는 제품들의 토대로 본다. 위에서 무엇을 만드느냐에 따라 전혀 다른 제품이 나오고, 모델은 그 밑에 공통으로 깔리는 베이스라는 것이다. 같은 Gemini가 안드로이드에서는 Gemini intelligence를, iOS에서는 Apple intelligence를 떠받치지만 제품은 전혀 다르게 나온다. 모델은 같은데 그 위에서 내려지는 결정과 유통이 다르다.
가치는 스택 위로
그러면 가치는 어디로 가나. 그가 던지는 비유는 Windows냐 클라우드냐다. 모델이 Windows처럼 스택 위를 지배할지, 아니면 클라우드처럼 어느 것이든 상관없는 교체 가능한 인프라가 될지.
그의 결론은 클라우드 쪽이다. 챗봇이 최종 화면이 아니고 수천 개의 서로 다른 앱이 필요한데, 그걸 모델 랩이 다 만들 수는 없다. 마이크로소프트가 모든 윈도우 앱을 만들지 않았듯이.
왜 위쪽인가. 그가 드는 이유는 직업에서 어려운 부분이 결과물을 만드는 일이 아니라는 데 있다. 그는 이걸 태스크(task)와 직업(job)의 구분으로 푼다. 하나의 직업은 여러 태스크의 묶음이고, AI가 자동화하는 건 그중 태스크다. 어려운 부분, 곧 무엇을 만들지 정하는 일은 그 위에 남는다.
가끔은 태스크가 곧 직업이기도 하다. 옛날 수동 엘리베이터 안내원은 레버로 층을 맞추는 일 하나가 전부였고, 버튼으로 자동화되자 그 직업은 사라졌다. 하지만 이건 예외다.
대부분은 아마존 같은 모습이다. 아마존이 하는 일은 품번(SKU)을 가져다주는 것이다. 어떤 마이크를 원하는지 품번을 알면 바로 살 수 있지만, 어떤 마이크를 사야 할지 모른다면 아마존에서 시작할 수 없다. 품번을 가져다주는 일은 자동화됐어도, 무엇을 원하는지 아는 일은 별개로 남는다. 클로드가 코드를 써줄 수 있다. 그런데 어떤 코드를, 어떤 기능을 원하는가. 고객은 누구이고 그에게 맞는 제품은 무엇인가. 이게 위층의 일이다.
컨설팅이 같은 예다. 클로드로 75장짜리 맥킨지 덱을 만들었다는 이야기가 나오지만, 애초에 맥킨지에 돈을 내는 이유는 그 덱이 아니다. 회사 곳곳을 들여다보며 왜 그동안 그걸 못 했는지, 조직의 정치가 어떻게 도는지, 진짜 고객이 무슨 생각을 하는지를 알아내는 일이다. 덱은 태스크이고 모델이 가져가는 건 그 태스크다. 무엇을 만들지 아는 일은 사람과 앱의 몫으로 남는다. 그래서 가치가 위층에 남는다는 것이다.
유통이 해자
제품이 커머디티가 되면 남는 건 유통이라고 그는 본다. 여기서 그가 말하는 유통은 소비자 유통, 브랜드와 디폴트다.
그는 브라우저 전쟁을 예로 든다. 기술적으로 보면 브라우저는 렌더링 엔진을 감싼 얇은 래퍼다. 입력창 하나와 출력창 하나가 거의 전부이고, 마지막으로 이렇다 할 혁신이 탭 브라우징이었는데 그게 20년도 더 됐다. 엔진은 더 좋거나 나쁠 수 있어도 사용자가 보는 제품은 사실상 비슷하다.
그런 커머디티 시장에서 마이크로소프트는 기술이 아니라 유통으로 이겼다. 인터넷 익스플로러를 윈도우에 끼워 기본값으로 깔았다. 새 PC를 켜면 이미 거기 있었으니 대부분의 사람은 그냥 그걸 썼다. 더 좋은 브라우저를 찾아 나설 이유가 없었다.
그런데 결과가 어땠나. 마이크로소프트는 5년에서 6년 동안 브라우저 점유율을 쥐고도 그걸로 얻은 게 거의 없었다. 가치가 브라우저가 아니라 그 위, 웹과 서비스에 있었기 때문이다. 유통으로 커머디티를 장악해도 가치가 윗단에 있으면 장악 자체가 돈이 되지 않는다는 이야기다.
지금은 같은 일이 모델에서 벌어진다고 그는 본다. 구글이 Gemini를 검색과 안드로이드 같은 자사 표면에 밀어 넣고, 메타가 충분히 괜찮은(adequate) 모델을 모든 서비스에 기본으로 얹는다. 일반 사용자에게 Gemini와 ChatGPT의 차이는 거의 없으니, 어느 게 먼저 깔려 있느냐가 사실상 승부를 가른다는 것이다.
인프라는 저마진 유틸리티
인프라 쪽은 어떻게 보나. 인프라의 대표 격은 전기 같은 유틸리티인데, 그는 자기가 오래 들여다본 통신을 예로 든다. 통신은 누구나 쓰는 유틸리티다. 망을 깔면 모두가 그 위에서 전화를 걸고 데이터를 쓴다.
지난 십수 년을 보면 그 위에서 도는 양은 폭발했다. 모바일 데이터 소비량은 2010년 대비 약 1,500배에서 2,000배로 늘었다. 거의 완벽한 지수 곡선이다. 산업 전체가 점점 더 그 위에서 돌아간다. 글로벌 모바일 산업의 연 매출은 약 1조 달러이고, 그 망을 떠받치느라 매년 매출의 15%에서 20%를 설비에 쏟아붓는다.
그런데 정작 통신사 주가는 어떻게 됐나. 25년 동안 사실상 제자리였다. 그 위에서 도는 모든 것이 바뀌고 폭발하는 동안, 망을 깐 회사의 주가는 움직이지 않았다. 저성장 저마진 커머디티 유틸리티이기 때문이다.
경이로운 인프라를 깔아도 돈은 그 위에서 벌렸다는 게 Evans가 인프라를 보는 자리다. 그리고 그는 같은 자리에 파운데이션 모델, 더 나아가 그걸 떠받치는 컴퓨트 인프라가 놓일 수 있다고 본다.
| Evans의 논지 사슬 | 내용 |
|---|---|
| 출발 | 모델에는 네트워크 효과가 없다 |
| 그래서 | 승자독식 없음, 경쟁 지속, 차별화 약함 |
| 결론 | 가격 지배력이 생길 근거가 없다 |
| 가치 행방 | 스택 위쪽(앱)으로 |
| 남는 해자 | 소비자 유통(브랜드, 디폴트) |
Jensen이 본 그림: 에이전트가 새 패턴, 가치는 아래로
Jensen의 키노트는 “쓸모 있는 AI가 도착했다”로 연다. 같은 모델 레이어를 두고 그는 Evans와 다른 곳을 본다.
컴퓨팅의 단위가 에이전트로
그가 정리하는 변화는 컴퓨팅의 단위가 바뀌었다는 것이다. 과거의 단위가 운영체제 위에서 도는 앱이었다면, 이제는 에이전트다.
에이전트는 모델(model), 하네스(harness), 도구와 스킬(tools/skills), 런타임(runtime)으로 이뤄진다. 입력이 들어오면 관찰하고, 추론하고, 계획을 세우고, 도구를 쓰고, 그 과정을 하네스가 조율한다. 단기 기억과 장기 기억을 관리하는 일도 여기 들어간다. 모델은 생각을 맡고, 하네스가 나머지를 묶는다.
모델은 오픈소스로 푼다
모델을 그는 어떻게 다루나. 자사 모델 Nemotron 3 Ultra와 피지컬 AI 모델 Cosmos 3를 가중치, 학습 데이터, 학습 스크립트까지 통째로 오픈소스로 공개한다. 그리고 NVL72의 강점으로 토큰 원가가 세계에서 가장 낮다는 점을 내세운다.
에이전트가 쓸 도구로는 NVIDIA의 CUDA-X 라이브러리 1,000여 개를 든다. 이제 그것을 에이전트가 읽고 쓸 수 있는 스킬, 곧 매뉴얼 형태로 제공한다. 모델이 싸고 흔할수록 그 위에서 도는 에이전트와 도구가 늘어난다는 그림이다.
compute is revenue
경제학은 한 줄로 못 박는다. 컴퓨트가 곧 매출이고, 와트당 처리량이 매출이며, 사면 살수록 번다는 것이다.
“compute is revenue now. Compute is profit… Performance per watt is your revenue. The more you buy, the more you make.” - Jensen Huang
1GW 팩토리 비용이 200억에서 300억 달러 수준이던 것이 800억에서 1,000억 달러로 올라가는 흐름도, 그는 비용이 아니라 매출 엔진으로 본다. 이 패턴을 돌리기 위해 차세대 시스템 Vera Rubin을 풀 양산하고, 사람이 아닌 에이전트용으로 설계한 Vera CPU를 내놓는다.
CUDA가 해자
그가 말하는 해자는 생태계의 전환비용이다. 모든 데이터센터와 클라우드, 기업이 이미 Grace를 검증(qualify)했고 모든 소프트웨어 스택이 CUDA에 최적화돼 있다는 것이다. 생태계가 두텁고 모두가 CUDA에서 시작하니 자산의 유효 수명이 길고, 그래서 총소유비용(TCO, Total Cost of Ownership)이 낮다는 논리로 이어진다.
그는 에이전트가 소프트웨어 회사를 죽인다는 통념도 뒤집는다. 에이전트가 사람보다 훨씬 많아져 도구를 더 쓰게 되니, 소프트웨어 회사에게는 오히려 좋은 시절이라는 것이다. Jensen의 그림에서 돈을 버는 자리는 모델이 아니라 그 아래 인프라다.
| Jensen의 논지 사슬 | 내용 |
|---|---|
| 출발 | 컴퓨팅 단위가 모델에서 에이전트로 |
| 모델 처리 | Nemotron / Cosmos 전체 오픈소스 |
| 그래서 | 토큰 수요 폭발, “compute is revenue” |
| 가치 행방 | 스택 아래쪽(인프라, CUDA)으로 |
| 남는 해자 | 개발자 생태계 lock-in(CUDA qualification) |
둘을 겹치면: 같은 곳, 다른 곳
같은 곳: 모델은 커머디티
두 사람이 합의하는 자리는 하나다. 모델 그 자체는 커머디티가 된다. Evans는 이걸 말로 하고, Jensen은 행동으로 한다. 모델을 통째로 오픈소스로 푸는 행위가 그 증거다.
모델을 공짜로 푸는 건 자선이 아니다. 보완재가 싸질수록 본재의 수요가 커진다. Jensen에게 모델은 그의 하드웨어, 곧 토큰을 찍는 AI 팩토리에 대한 수요를 끌어올리는 보완재다. 모델이 싸지고 흔해질수록 토큰을 더 찍게 되고, 토큰을 더 찍을수록 GPU가 더 팔린다. 그래서 Evans의 “모델은 커머디티”는 Jensen에게 반론거리가 아니라 영업 논리가 된다.
다만 합의는 여기까지다. Evans가 덧붙인 “네트워크 효과가 없다”는 그의 추가 논리이지 Jensen이 동의한 지점은 아니다. Jensen은 모델의 네트워크 효과를 따지는 대신, 토큰 수요와 인프라로 화제를 옮긴다.
다른 곳 1: 위로 가나 아래로 가나
합의가 끝나는 곳에서 두 그림이 달라진다. 같은 모델 위아래로 가치가 어디로 흐르느냐다.
---
config:
look: handDrawn
theme: neutral
---
flowchart TB
U["위층: 앱과 유통 (Evans)"]
M["가운데: 모델 = 커머디티"]
D["아래층: 인프라 (Jensen)"]
U --- M
M --- D
흥미로운 건 두 사람이 같은 역사적 비유를 쓰면서 다른 결론에 닿는다는 점이다.
| 비유 | Evans의 읽기 | Jensen의 읽기 |
|---|---|---|
| Windows vs 클라우드 | 모델은 AWS형 커머디티, 가치는 위로 | CUDA를 AI 시대의 Windows로 자리매김 |
| 전기 / 유틸리티 | 인프라는 저마진, 돈은 전기로 뭔가 만드는 쪽이 번다 | compute is revenue, 와트당 처리량이 매출 |
| 유통 | 소비자 브랜드와 디폴트 | 개발자 생태계 lock-in |
| 에이전트 / 하네스 | 앱 레이어 차별화의 자리 | 자사 런타임과 Vera CPU가 필요한 자리 |
한 가지 주의할 점은 두 사람이 말하는 레이어가 서로 다르다는 것이다. Evans가 커머디티라 보는 대상은 모델 레이어이고, Jensen이 Windows 자리를 노리는 대상은 모델 아래의 CUDA와 실리콘 레이어다. 그래서 모델은 AWS처럼 커머디티이면서, 동시에 CUDA는 Windows처럼 lock-in일 수 있다. 둘이 같은 물건을 두고 부딪히는 게 아니다.
다른 곳 2: 같은 단어, 다른 해자
가장 흥미로운 겹침은 유통이다. 두 사람 모두 제품이 커머디티가 되면 유통이 해자라고 말한다. 그런데 가리키는 유통이 다르다. Evans의 유통은 소비자 브랜드와 디폴트이고, Jensen의 유통은 개발자 생태계의 전환비용이다.
| Evans의 유통 | Jensen의 유통 | |
|---|---|---|
| 해자의 정체 | 소비자 브랜드 / 디폴트 | 개발자 생태계 lock-in |
| 작동 방식 | 모든 표면에 스프레이, 디폴트의 관성 | qualification과 CUDA 최적화의 전환비용 |
| 사례 | 브라우저 전쟁, Gemini / 메타 | Grace qualification, 긴 자산 수명 |
여기서 Evans 본인이 인정하는 함정이 있다. 유통이 해자라면 그 해자는 앱을 새로 만드는 스타트업이 아니라 이미 유통을 쥔 빅테크에게 유리하다. 구글, 애플, 메타, 아마존을 두고 그는 이 변화 속에서 이들에게 진짜 문제를 찾기는 어렵다고 말한다. 그러니 가치가 스택 위로 간다는 말이 곧 가치가 작은 빌더에게 간다는 뜻은 아니다. 위로 올라간 가치가 또 다른 과점으로 흡수될 수 있다.
다른 곳 3: 검증 가능한 한 지점, 인프라 마진
위의 비유들은 레이어가 달라 양립이 가능하다. 그런데 같은 물건을 두고 두 사람이 반대로 예측하는 지점이 하나 있다. 인프라의 마진이다.
출발점은 Sam Altman의 발언이다. 그는 지능을 전기나 수도처럼 미터로 팔겠다고 했다. Evans는 이 비유를 받아들이지 않는다.
“my dear sweet child you need me to explain the margin structure of the utility industry to you.” - Benedict Evans
TV를 볼 때 방송사가 전기료의 일부를 전력회사에 내지 않고, 세탁기를 돌릴 때 보쉬가 세탁기 값의 일부를 전력회사에 내지 않는다. 전기는 모든 것의 일부가 됐지만 돈은 전기로 뭔가 만드는 쪽이 벌었다는 것이다.
같은 전기 비유를 Jensen은 거꾸로 세운다. 와트당 처리량이 매출이고 사면 살수록 번다는 것이다. 여기에 작은 단서가 하나 붙는다. Jensen은 자사 Vera Rubin 시스템 안에 지연 특화 경쟁사 칩인 Groq LPU를 넣었다. NVL72는 최고 처리량으로 토큰을 찍고 Groq LPX 랙은 가장 낮은 지연으로 찍는다는 구성이다. 단일 아키텍처가 모든 워크로드를 영원히 가져가지는 못한다는 것을 자기 랙으로 보여준 셈이다.
| Evans의 예측 | Jensen의 예측 | |
|---|---|---|
| 인프라 마진 | 저마진 유틸리티로 수렴 | 고마진 매출 엔진 |
| 근거 | telco: 데이터 2,000배인데 주가 0 | co-design, 효율, 생태계 |
| 약한 신호 | 자기 랙 속 Groq LPU | 현재 75%대 총마진 유지 |
| 계측기 | NVIDIA 마진 곡선, 토큰 가격 곡선 | 토큰 수요 곡선 |
앞으로 2년에서 3년 동안 NVIDIA의 총마진과 토큰 가격이 어디로 가는지가 누구의 그림에 가까운지를 보여줄 단일 계측기다.
마무리: 둘 다 맞을 수 있고, 진짜 질문은 가운데에 있다
위층과 아래층은 동시에 이길 수 있다. 모델 랩이 위(앱과 유통)와 아래(인프라)에 가치를 내주고 가운데서 가격 지배력을 잃는 그림은 두 발언과 모두 들어맞는다. 그래서 이 둘은 모순이라기보다 같은 도넛의 위아래 반쪽을 각자 자기 위치에서 본 것에 가깝다.
진짜 풀리지 않은 질문은 가운데에 있다. 모델 랩 중 하나가 메모리와 개인화, 그리고 ChatGPT의 9억 사용자 같은 유통으로 가운데에서 빠져나와 스스로 플랫폼이 되면 어떻게 되나. 그 순간 Evans의 네트워크 효과 없음 전제가 깨지고, 가치는 다시 모델 레이어로 모인다. Jensen이 강조한 단기와 장기 메모리 관리가 바로 그 자리이기도 하다. 모델이 나를 알수록 갈아타기 어려워지는, 전환비용이 생기는 자리다.
---
config:
look: handDrawn
theme: neutral
---
flowchart LR
Q["커머디티가 된 모델"] --> U["가치가 위로 (Evans)"]
Q --> D["가치가 아래로 (Jensen)"]
Q --> E["모델 랩이 가운데서 탈출"]
Evans 본인이 자기 논지에 단서를 단다. 이 모든 게 결정론적 추론일 뿐이고, 1997년에 인터넷을, 2000년에 모바일을 이런 식으로 논했다면 거의 다 틀렸을 거라는 것이다.
“we should presume we don’t know.” - Benedict Evans
두 발표를 나란히 두고 얻는 건 정답이 아니라 좌표다. 모델은 커머디티라는 데서 출발해, Evans는 위를, Jensen은 아래를 가리킨다. 어느 화살표가 더 길지는 NVIDIA의 마진과 토큰 가격, 그리고 모델 랩의 유통 싸움이 앞으로 몇 년간 답할 문제다.
Sources
- Benedict Evans, “The most rational take on AI you’ll hear this year”, Lenny’s Podcast, 2026.
- Jensen Huang, “NVIDIA GTC Taipei 2026 Keynote (Full Replay)”, NVIDIA, 2026.
관련 글

AI eats the world 2026 - Benedict Evans 79장 deck 정리
Evans 2026 deck 79장 정리. 자본·도입·변화 3챕터 + 인프라 폭발이 가치 포착으로 안 이어진다는 한 가지 질문

NVIDIA Tax - GPU가 AI 이익의 대부분을 가져가는 구조
NVIDIA H100의 88% 마진 구조를 해부하고, AI 칩 독점이 생태계에 미치는 영향과 3가지 독점 해체 시나리오를 분석

AI 시장 3영역 해부 - $660B 시장의 실제 구성
AI 시장을 인프라($500B+), 플랫폼($18B+), 애플리케이션($80B+) 3개 영역으로 나눠 분석한 시리즈 첫 편