Google DeepMind와 Gemini: 개발자를 위한 혁신의 미래 – I/O 2025 키노트 요약
1. 시작 인사와 AI의 현재
- 데미스 하사비스(Demis Hassabis)가 무대에 올라 인사하며 시작합니다.
- 주요 메시지:
"우리는 AI가 놀라운 미래를 가능하게 하는 역사적인 순간을 살고 있습니다."
- 지난 1년간 Gemini 2.5의 발전과, 사람들이 이를 활용해 게임, 앱, 과학 논문 해석, 유튜브 영상 이해 등 다양한 작업을 수행한 사례를 언급합니다.
- 강조:
"여러분이 Gemini를 사용하며 얼마나 협업적이고, 통찰력 있으며, 진정으로 도움이 된다고 느꼈는지 들었습니다."
2. Gemini 2.5 Pro와 Flash: 새로운 모델의 등장
- Gemini 2.5 Pro:
- "지금까지 만든 모델 중 가장 지능적이며, 세계 최고의 파운데이션 모델입니다."
- LearnLM(교육 전문가와 함께 만든 모델군) 통합으로 학습 분야에서도 1위.
- Gemini Flash:
- "가장 효율적인 워크호스 모델로, 개발자들이 속도와 저렴한 비용을 사랑합니다."
- 2.5 Flash의 업데이트 버전 발표:
"새로운 Flash는 거의 모든 면에서 더 좋아졌습니다. 추론, 코드, 롱 컨텍스트 등 주요 벤치마크에서 향상되었습니다."
- 6월 초 일반 공개 예정, Pro는 그 이후 곧 출시.
3. 개발자 경험 혁신: Tulsee Doshi의 발표
- 개발자 피드백을 바탕으로 Gemini 2.5의 사용성, 보안, 효율성, 제어력 강화.
- 텍스트-음성 변환(Text-to-Speech) 미리보기:
- "최초로 두 명의 목소리를 지원하는 멀티스피커 기능이 도입되었습니다."
- 24개 이상의 언어 지원, 언어 간 자연스러운 전환 가능.
- 예시 대사:
"모델이 영어로 말하다가, [다른 언어로 전환]... 그리고 다시 같은 목소리로 돌아올 수 있습니다."
- 보안 강화:
- "간접 프롬프트 인젝션 등 보안 위협에 대한 보호가 강화되어, Gemini 2.5는 지금까지 가장 안전한 모델입니다."
- 투명성 향상:
- Thought Summaries(생각 요약) 도입:
"모델의 생각을 명확한 형식으로 정리해, 헤더, 주요 세부 정보, 도구 호출 등 모델의 행동 정보를 제공합니다."
- 효율성:
- "2.5 Flash는 동일한 성능을 위해 사용하는 토큰 수를 줄여, 22% 효율성 향상을 달성했습니다."
- Thinking Budgets(생각 예산):
- "비용과 지연 시간, 품질을 조절할 수 있는 기능으로, 2.5 Pro에도 곧 도입됩니다."
-
"모델이 응답 전에 얼마나 많은 토큰을 사용할지 제어할 수 있습니다. 또는 아예 꺼버릴 수도 있죠."
4. 실제 데모: 아이디어에서 3D 앱까지
- 실제 예시:
- 뉴욕 자연사 박물관의 전시를 소개하는 웹앱을 Gemini 2.5 Pro로 코딩.
- "2D 웹디자인을 3D로 확장하고 싶었지만, 3D는 쉽지 않죠. 하지만 2.5 Pro가 도와줍니다."
- 스케치 이미지를 업로드하고, 2.5 Pro에 코드 업데이트를 요청
"거친 스케치에서 바로 코드로, 여러 파일이 업데이트되었습니다."
"Three.js 라이브러리나 복잡한 3D 수학을 몰라도, 스케치만으로 만들 수 있었습니다."
- 멀티모달리티:
- 2.5 Flash로 각 사진에 퀴즈 추가, Native Audio로 음성 설명까지 구현.
-
"이건 천산갑이고, 비늘은 손톱과 같은 케라틴으로 만들어졌어요."
- 코드 배포 및 확장:
- "AI Studio에서 바로 배포 가능, 누구나 시작 코드로 실습할 수 있습니다."
- Gemini 2.5 Pro의 통합:
- Android Studio, Firebase Studio, Gemini Code Assist, 비동기 코딩 에이전트 Jules 등 다양한 플랫폼에서 사용 가능.
-
"작업을 제출하면 Jules가 나머지를 처리합니다. 버그 수정, 업데이트, GitHub 연동까지 모두 자동으로!"
5. 혁신적인 텍스트 생성: Gemini Diffusion
-
Diffusion 기법을 텍스트 생성에 도입한 Gemini Diffusion 발표.
"디퓨전 모델은 노이즈를 점진적으로 정제해 결과물을 생성합니다."
- 기존 모델보다 5배 빠른 속도, 코드 성능은 동일.
-
"눈 깜짝할 사이에 답이 나옵니다. 만약 눈을 깜빡였다면, 이미 놓쳤을 거예요."
- 실시간 생성 과정 시연:
- "과정이 어떻게 답(39)에 도달하는지 천천히 보여줍니다."
- 향후 계획:
- "더 빠른 2.5 Flash-Lite도 곧 출시 예정."
6. Deep Think: 한계를 뛰어넘는 사고력
-
Deep Think 모드 도입:
"모델의 성능을 극한까지 끌어올리는 새로운 모드입니다."
- 병렬적 사고, 고난도 수학/코딩 벤치마크에서 최고 성능.
-
"USAMO 2025, LiveCodeBench, MMMU 등에서 놀라운 성과를 보였습니다."
- 안전성 평가:
- "신뢰할 수 있는 테스터에게 먼저 제공, 추가 안전성 검증 후 공개 예정."
-
AI의 미래 비전:
"우리는 AI가 세상을 시뮬레이션하고, 계획을 세우고, 새로운 경험을 상상할 수 있는 '월드 모델'로 확장하고 있습니다."
7. 월드 모델과 로보틱스
- 월드 모델:
- "AI가 실제 세계를 이해하고, 계획을 세우며, 새로운 경험을 시뮬레이션할 수 있도록 연구 중."
-
"Veo는 중력, 빛, 재질의 물리적 특성을 깊이 이해합니다."
- Gemini Robotics:
- "로봇이 물건을 집고, 지시를 따르고, 새로운 작업에 적응하도록 훈련."
-
"오늘 이곳에서 AI Sandbox에서 로봇을 직접 체험할 수 있습니다."
-
궁극적 목표:
"Gemini 앱을 개인적이고, 능동적이며, 강력한 범용 AI 어시스턴트로 진화시키는 것이 우리의 비전입니다."
8. Project Astra: 차세대 AI 어시스턴트
- Project Astra의 실제 시연 영상:
- 사용자가 자전거를 고치며 Astra에게 다양한 요청(매뉴얼 검색, 유튜브 영상 찾기, 이메일 확인, 전화 걸기 등)을 함.
-
"이 나사를 망가뜨린 것 같아. 유튜브에서 고치는 방법 찾아줄 수 있어?"
"네, 지금 유튜브를 열고 있습니다. 이 영상이 좋아 보이네요."
"이메일에서 필요한 육각 너트 크기 찾아줄래?"
"Bicycle Habitat에서 온 이메일에 따르면, 스프로킷에 3/8인치 육각 너트가 필요합니다."
- 일상 업무 자동화:
- "AI가 일상적인 업무를 대신 처리하고, 새로운 추천을 제공해 생산성과 삶의 질을 높입니다."
- 새로운 폼팩터:
- "Android XR 글래스 등 다양한 기기와 연동 예정."
9. 과학적 발견과 사회적 임팩트
-
AI를 통한 과학 혁신:
"AlphaProof는 수학 올림피아드 문제를 은메달 수준으로 풉니다."
"AlphaFold 3는 모든 생명체 분자의 구조와 상호작용을 예측합니다."
"Isomorphic Labs는 신약 개발을 혁신하고, 전 세계 질병 해결에 기여할 것입니다."
-
"AlphaFold는 이미 250만 명 이상의 연구자들이 사용하며, 생물학과 의학 연구의 표준 도구가 되었습니다."
-
책임감 있는 AI:
"안전하고 책임감 있게 개발한다면, AGI는 인류에게 가장 이로운 기술이 될 것입니다."
10. AI의 사회적 가치: 시각장애인 지원 사례
-
Aira와의 협업:
"Aira는 시각장애인들이 세상을 탐험할 수 있도록 영상으로 인간 해설자와 연결해줍니다."
- Astra 기술을 활용해 더 많은 사람들이 도움을 받을 수 있도록 프로토타입 개발.
-
실제 사용자 이야기:
"어릴 때부터 시력이 점점 나빠졌지만, 음악은 계속할 수 있었어요."
"Project Astra가 저를 더 독립적으로 만들어줄 수 있다면, 그건 정말 최고의 일이 될 거예요."
"이 초록색 방에서 보이는 걸 말해줄 수 있나요?"
"당신이 바라보는 방향에 Wi-Fi 네트워크와 비밀번호가 적힌 표지판이 있습니다."
"마이크 스탠드를 찾아줄 수 있나요?"
"비디오 오른쪽 상단에 여러 개의 감긴 케이블과 마이크 스탠드가 보입니다."
"무대에 올라 기타를 들고 연주하는 게 제가 할 수 있는 가장 강력한 일입니다. Project Astra가 저를 도와줄 수 있다면, 저는 언제든 환영입니다."
11. 마무리: 새로운 발견과 경이의 시대
-
데미스 하사비스의 마무리:
"불과 몇 년 전만 해도 오늘 보는 기술은 마법과도 같았을 것입니다."
"AI는 우리의 삶을 풍요롭게 하고, 과학적 진보를 가속화하며, 새로운 발견과 경이의 시대를 열고 있습니다."
핵심 키워드 요약
- Gemini 2.5 Pro / Flash / Deep Think
- 멀티모달리티
- 텍스트-음성 변환, Native Audio
- 보안, 투명성, 효율성, Thinking Budgets
- AI Studio, Jules, 코드 자동화
- Diffusion 모델, Gemini Diffusion
- 월드 모델, Veo, Gemini Robotics
- Project Astra, 범용 AI 어시스턴트
- AlphaFold, AlphaProof, AlphaEvolve, Isomorphic Labs
- 사회적 임팩트, 시각장애인 지원, Aira 협업
"AI가 우리 삶을 더 풍요롭게, 더 생산적으로, 더 독립적으로 만들어줄 수 있다면, 그것이야말로 진정한 혁신입니다." 🚀