2025년 AI의 최전선 탐험: Grace Isford, Lux Capital
1. Lux Capital과 AI의 최전선
Grace Isford는 Lux Capital의 파트너로서, AI Engineer Summit에서 2025년 AI의 최전선과 이를 어떻게 탐험할 것인지에 대해 발표를 시작합니다. 그녀는 Lux Capital이 "다른 사람들이 이해하기 전에 믿는다"는 철학을 가지고 있으며, "공상과학(Sci-Fi)을 과학적 사실(Sci-Fact)로 바꾸는" Frontier Tech 아이디어에 투자한다고 소개합니다.
- Lux Capital은 초기 단계에서 Hugging Face(머신러닝의 GitHub), Together AI(오픈소스 AI 클라우드), Physical Intelligence(로봇 소프트웨어 브레인), S AI(진화적 자연 영감을 받은 알고리즘 연구소)와 같은 AI 기업들과 협력해 왔습니다.
- 뉴욕시를 AI의 중심지로 강조하며, Lux Capital의 AI 포트폴리오의 다수가 뉴욕에 본사를 두고 있거나 주요 허브로 활용하고 있다고 설명합니다.
"Lux는 뉴욕에서 시작되었고, 우리는 뉴욕의 AI 기회에 대해 매우 낙관적입니다."
2. AI의 폭발적 성장과 2025년의 현황
Grace는 2022년 8월의 Stable Diffusion부터 시작해 지난 몇 년간 AI의 폭발적인 성장을 돌아봅니다. 특히, 지난 18개월 동안의 발전은 "더 공격적이고, 더 인상적이며, 더 널리 퍼졌다"고 평가합니다.
- 2025년의 주요 AI 사건들:
- 5000억 달러 규모의 Stargate 프로젝트: 미국 정부, OpenAI, SoftBank, Oracle 간 협력.
- OpenAI의 GPT-4.03: 인간의 성능을 초과하며 AGI(인공지능 일반) 도전에 성공.
- DeepSeek의 R1 모델: Nvidia 주가에 영향을 미칠 정도로 큰 반향을 일으킴.
- 프랑스 AI 서밋: 마크롱 대통령이 유럽 AI 이니셔티브를 발표하며 유럽을 AI 경쟁에 다시 참여시킴.
"2025년은 AI 에이전트의 순간입니다. 완벽한 폭풍이 몰아치고 있지만, 아직 번개가 치지 않았습니다."
3. AI 에이전트의 현재 한계
Grace는 AI 에이전트가 아직 완전히 작동하지 않는 이유를 설명하며, 이를 "번개가 아직 치지 않았다"고 비유합니다. 그녀는 AI 에이전트를 "LLM(대규모 언어 모델)이 스스로 행동을 결정하는 완전 자율 시스템"으로 정의합니다.
- 실제 사례: 항공편 예약 실패
- Grace는 OpenAI Operator에게 뉴욕에서 샌프란시스코로 가는 항공편을 예약하도록 요청했지만, 여러 번 실패했습니다.
- 첫 번째 시도: Kayak에서 항공편을 찾지 못함.
- 두 번째 시도: Skyscanner에서 교통 체증 시간대의 항공편을 추천.
- 결과적으로 개인 선호도(좌석 위치, 항공사, 가격 등)를 제대로 반영하지 못함.
"AI는 작은 누적 오류들이 쌓이면서 제대로 작동하지 못합니다. 이는 단순한 '환각' 문제를 넘어서는 것입니다."
4. AI 에이전트의 주요 오류 유형
Grace는 AI 에이전트가 직면하는 주요 오류를 네 가지로 분류합니다.
- 결정 오류(Decision Error): 잘못된 사실을 선택.
- 예: 샌프란시스코 캘리포니아 대신 샌프란시스코 페루로 예약.
- 구현 오류(Implementation Error): 잘못된 접근 방식 또는 통합 문제.
- 예: CAPTCHA 문제로 데이터 흐름 중단.
- 휴리스틱 오류(Heuristic Error): 잘못된 기준 적용.
- 예: JFK 공항의 교통 상황을 고려하지 않음.
- 취향 오류(Taste Error): 개인 선호를 잘못 이해.
- 예: Grace가 싫어하는 Boeing 737 Max 항공기를 예약.
"AI는 마법 같은 일을 해내지만, 작은 실수들이 쌓이면서 인간의 기대를 충족시키지 못합니다."
5. 누적 오류의 영향
Grace는 누적 오류가 AI 에이전트의 성능에 미치는 영향을 시각적으로 설명합니다.
- 99% 정확도의 에이전트와 95% 정확도의 에이전트 비교:
- 50단계 작업 후, 99% 정확도의 에이전트는 60% 정확도로 떨어짐.
- 누적 오류는 단순한 작업에서도 복잡성을 증가시킴.
"단순한 항공편 예약조차도 누적 오류로 인해 매우 복잡해질 수 있습니다."
6. AI 에이전트 구축을 위한 5가지 전략
Grace는 누적 오류를 줄이고 AI 에이전트를 개선하기 위한 다섯 가지 전략을 제안합니다.
-
데이터 큐레이션(Data Curation):
- AI 에이전트가 필요한 정보를 확보하도록 데이터 품질을 관리.
- "데이터는 최고의 자산이며, 큐레이션이 이를 더 효과적으로 만듭니다."
- 예: Grace의 여행 선호 데이터를 수집해 실시간으로 반영.
-
평가 시스템(Evals):
- 모델의 응답을 측정하고 올바른 답을 선택.
- "비검증 가능한 시스템(예: 개인 선호도)에 대한 평가 기준을 설정하는 것이 중요합니다."
-
스캐폴딩 시스템(Scaffolding Systems):
- 하나의 오류가 전체 시스템에 영향을 미치지 않도록 방지.
- 예: Ramp의 인프라 논리를 통해 오류가 확산되지 않도록 설계.
-
사용자 경험(UX):
- AI 에이전트를 더 나은 협력자로 만들기 위해 UX를 개선.
- "UX는 AI 앱의 차별화 요소입니다. 아름답고 우아한 인간-기계 협력을 촉진해야 합니다."
-
멀티모달 설계(Multimodality):
- 텍스트를 넘어 음성, 이미지, 냄새, 촉각 등 새로운 모달리티를 통합.
- "챗봇 인터페이스를 넘어 AI를 더 인간적으로 만드는 방법을 고민해야 합니다."
7. 결론: AI 에이전트의 미래
Grace는 AI 에이전트가 아직 완벽하지 않지만, 데이터 큐레이션, 평가, 스캐폴딩, UX, 멀티모달 설계를 통해 개선할 수 있다고 강조합니다.
"우리는 AI 에이전트의 완벽한 폭풍 속에 있지만, 아직 번개가 치지 않았습니다. 여러분이 만들어갈 혁신적인 AI 제품이 기대됩니다."
이 발표는 AI 에이전트의 현재 한계와 이를 극복하기 위한 실질적인 전략을 제시하며, AI의 미래를 향한 비전을 공유하는 데 초점을 맞췄습니다. Grace의 통찰력 있는 제안은 AI 개발자와 리더들에게 큰 영감을 줄 것입니다.