
Claude 개발자 플랫폼이 공개한 고급 도구 사용(Advanced Tool Use)은 AI 에이전트가 수백에서 수천 개의 도구를 빠르고 효율적이면서도 정확하게 이용할 수 있도록 하는 세 가지 핵심 기능을 제공합니다. 이 기능들은 에이전트의 생산성과 정확성을 크게 높이고, 대규모의 실제 업무 흐름을 자동화하는 데 중요한 전환점을 마련합니다. 주요 결론은 도구 검색, 코드 기반의 도구 호출, 도구 사용 예제 제공이 함께 작동할 때 컨텍스트 효율과 정확성, 확장성이 크게 향상된다는 것입니다.
미래의 AI 에이전트는 수많은 도구를 자연스럽게 연결하며, IDE의 git, 파일 조작, 패키지 매니저, 테스팅 프레임워크, 배포 파이프라인 등 여러 작업을 동시에 처리할 수 있게 됩니다. 실제 기업 업무에서는 Slack, GitHub, Google Drive, Jira, 그리고 사내 데이터베이스까지 한 번에 활용하는 복잡한 에이전트가 필요합니다.
그러나 기존 방식은 여러 문제점을 안고 있습니다.
"에이전트는 언제 선택적 매개변수를 사용해야 하는지, 어떤 조합이 의미 있는지, API에서 기대하는 관례가 무엇인지 예시를 통해 배워야 합니다."
Anthropic는 2025년 다음의 세 가지 주요 기능을 출시했다고 발표했습니다:
"도구 검색 도구 덕분에 컨텍스트 토큰 사용량을 기존 122,800개에서 191,300개까지 절감할 수 있습니다."
이 기능들은 Claude for Excel에서 사용되어 수천 행에 달하는 스프레드시트를 빠르게 읽고 수정하는 등 기존 한계를 극복했습니다.
서버와 도구가 늘어날수록 컨텍스트 창이 금방 가득 찹니다.
예를 들어, GitHub(35개 도구), Slack(11개), Sentry(5개), Grafana(5개), Splunk(2개)만 합쳐도 5만 5천 토큰 이상이 소모되어 대화가 시작되기도 전에 컨텍스트가 절반 넘게 사라집니다.
"Jira 서버 하나만 추가해도 약 17,000 토큰이 더해집니다. 저희는 한 번에 13만 토큰이 도구 정의로만 사용되는 사례를 실제로 보았습니다."
게다가 비슷한 이름을 가진 도구가 여럿 있을 경우, 잘못된 선택이나 파라미터 오류 발생 확률이 높아집니다.
도구 검색 도구는 필수 도구 몇 개만 미리 로딩하고, 나머지는 필요할 때 검색해서 불러오는 방식을 지원합니다.

"기존 방식은 72,000개 토큰이 도구 정의에 쓰였습니다. 도구 검색 도구는 단 8,700개 토큰만 사용하여 컨텍스트 절감률이 85%에 달합니다."
이는 엔지니어링 벤치마크에서 Claude Opus 4의 도구 선택 정확률을 49%에서 74%, Opus 4.5는 **79.5%에서 88.1%**까지 대폭 끌어올렸습니다.
defer_loading: true 표시로 필요시만 사용할 도구를 지정합니다."Deferred tools(지연 로딩되는 도구) 덕분에 대규모 MCP 시스템에서 불필요한 컨텍스트 낭비를 막을 수 있습니다."
"에이전트가 10MB 로그 파일에서 에러 패턴을 분석할 때 전체 파일이 컨텍스트 창을 채웁니다. 필요한 것은 에러 빈도 요약뿐인데 말이죠."
Claude가 요청받은 작업을 파이썬 코드로 구현해서, 직접 여러 개의 도구를 오케스트레이션합니다. 중간 결과와 반복 작업은 샌드박스 환경에서 처리되고, 최종 결과물만 컨텍스트로 전달됩니다.

"팀원 중 Q3 출장비 예산을 초과한 사람을 알려주세요."
Claude는 아래와 같이 코드를 작성해서,
"2,000개가 넘는 세부 지출 항목과 총계, 예산 조회의 중간 과정은 Claude가 직접 보는 대신 코드 실행 환경에서 처리되어, 컨텍스트는 1KB 결과만 받게 됩니다."
프로그래밍 방식 도구 호출은 일반적으로 토큰 사용량 37% 절감, 오작동 감소, 정확률 상승 등의 이점을 보였습니다.
"due_date(종료일)은 '2024-11-06'처럼 써야 하나, 'Nov 6, 2024', '2024-11-06T00:00:00Z' 중 어떤 형식인지 알 수 없습니다."
도구 정의에 input_examples를 추가해, 실제 입력 데이터 형태와 관례를 Claude가 학습하도록 합니다.
예)
"예제를 통해 클로드는 날짜 포맷, 사용자 ID 패턴, 중첩 구조 작성법, 우선순위에 따른 필드 활용법까지 자연스럽게 익힙니다."
내부 벤치마크에서는 이런 예제 추가만으로 **복잡한 파라미터 처리 정확률이 72%에서 90%**로 크게 올랐습니다.
현실적인 대규모 업무에서는 세 가지 기능을 상황에 맞게 조합하는 것이 효과적입니다.
"도구 정의 때문에 컨텍스트가 부족하다면 도구 검색 도구를, 대량의 중간 결과가 오염된다면 프로그래밍 호줄을, 파라미터 실수나 오용이 많다면 사용 예제 추가가 답입니다."
세 기능 모두 베타로 제공 중이며, beta 헤더와 함께 원하는 도구 옵션(검색, 코드호출, 예시 등)을 명시하면 바로 사용할 수 있습니다.
관련 문서와 실습 예시는 아래에서 확인할 수 있습니다:
이러한 기능들은 단순 함수 호출 단계를 넘어 지능적 오케스트레이션의 토대를 마련하며, 앞으로의 AI 자동화와 복잡 업무 처리의 방향을 제시합니다.
이 글은 Bin Wu가 집필하고, 다수의 Anthropic 팀원이 기여하였으며, Joel Pobar, Cloudflare Code Mode, Code Execution as MCP 등 다양한 AI 커뮤니티의 연구에서 영감을 받았습니다.
고급 도구 사용의 세 가지 기능은 AI 에이전트가 복잡하면서도 대규모의 현실 업무 흐름을 효율적이고 정확하게 처리할 수 있도록 해줍니다.
도구 검색, 코드 기반 실행, 사용 예시를 필요에 맞게 조합하면, 그 어떤 환경에서도 Claude 에이전트의 활용도를 극대화할 수 있습니다. Anthropic는 앞으로도 다양한 혁신적 기능 개발을 계속 이어갈 것이며, 여러분이 이 기능으로 무엇을 만들지 기대하고 있습니다! 🚀