본문 바로가기
AI.IT

Claude 4.6 써봤는데, Adaptive Thinking이 생각보다 의미 있더라

by bamsik 2026. 4. 2.
반응형

Claude 4.6 써봤는데, 솔직히 이번엔 좀 달랐다.

Anthropic이 Claude Opus 4.6과 Sonnet 4.6을 출시했다. 버전 업그레이드마다 "가장 강력한 모델"이라는 말이 따라붙으니까 처음엔 그냥 그런가보다 했는데, 이번에 실제로 쓰다 보니 체감이 좀 다른 부분이 있었다. 특히 Adaptive Thinking 방식이 바뀐 게 생각보다 의미 있었다.

Claude 4.6이 뭐가 달라진 건지

이번 버전에서 핵심은 두 가지다. 하나는 Adaptive Thinking Mode, 다른 하나는 Effort 파라미터가 정식 출시됐다는 거다.

기존에 Claude를 API로 쓸 때는 thinking: {type: "enabled"}budget_tokens를 직접 지정해야 했다. 얼마나 깊이 생각할지 개발자가 숫자로 넣어야 했던 거다. 근데 솔직히 이게 적정값을 찾기가 어려웠다. 너무 낮으면 단순한 추론, 너무 높으면 비용 폭탄.

Claude 4.6부터는 thinking: {type: "adaptive"}로 바뀌었다. 이제 Claude가 알아서 판단한다. 간단한 질문이면 그냥 빠르게 답하고, 복잡한 문제면 더 깊이 생각하는 방식으로. 기존 budget_tokens 방식은 공식 deprecated 처리됐다.

response = client.messages.create(
    model="claude-opus-4-6",
    max_tokens=16000,
    thinking={"type": "adaptive"},
    messages=[{"role": "user", "content": "복잡한 문제를 여기에..."}],
)

개발자 입장에서 이게 편리한 건 분명한데, 반대로 "얼마나 깊이 생각하는지 예측이 어려워진다"는 단점도 있다. 비용 예측이 까다로워질 수 있는 부분이다.

Effort 파라미터 정식 출시

Effort 파라미터는 이번에 베타 딱지를 떼고 정식 출시됐다. low, medium, high에 이번에 max가 새로 추가됐다. Opus 4.6에서 max를 쓰면 현재 제공 가능한 최고 성능으로 동작한다.

Sonnet 4.6에는 처음으로 Effort 파라미터가 적용됐다. Anthropic이 직접 권장하는 건 Sonnet 4.6 기본 사용은 medium 설정. 속도, 비용, 성능 사이에서 균형 잡기 좋다고 한다.

코드 실행 도구가 웹 도구와 함께 쓰면 무료

이건 개발자한테 꽤 반가운 변화다. 웹 서치나 웹 페치 도구를 API 요청에 포함시키면, 코드 실행 도구를 추가 비용 없이 쓸 수 있게 됐다.

실용적으로 어떤 의미냐면 — 웹에서 데이터를 긁어온 뒤 Claude가 코드를 실행해서 필요한 정보만 필터링해서 컨텍스트 창에 넣어준다. 불필요한 토큰 낭비가 줄고, 정확도도 올라간다는 게 Anthropic 측 설명이다. 웹 서치 결과를 그냥 통째로 넣는 방식보다 훨씬 효율적인 구조다.

Memory Tool, Compaction API도 정식으로

이번 릴리즈에서 정식 출시된 도구 목록을 보면 꽤 많다. 코드 실행, 웹 페치, 프로그래매틱 도구 호출, 도구 검색, 메모리 툴이 전부 GA 처리됐다.

메모리 툴은 에이전트 구축할 때 상태 유지 문제를 Claude가 스스로 해결하게 해주는 기능이다. Compaction API(베타)는 긴 대화를 압축해서 컨텍스트 창을 효율적으로 관리하는 기능이다.

에이전트 개발을 생각하는 사람한테는 이번 릴리즈가 특히 의미 있을 것 같다. Opus 4.6 자체가 "에이전트 구축과 코딩에 최적화된 모델"이라는 포지셔닝을 전면에 내세우고 있으니까.

쓸 만한가? 솔직한 인상

Adaptive Thinking은 단순히 사용 편의성 문제가 아니다. Claude가 추론 깊이를 상황에 맞게 조절한다는 건, 같은 API 콜이라도 결과 품질 편차가 커질 수 있다는 뜻이기도 하다. 예측 가능성을 중요하게 생각하는 프로덕션 환경에서는 오히려 Effort 파라미터를 명시적으로 설정하는 게 나을 수 있다.

Sonnet 4.6은 속도와 가성비를 노린 포지셔닝이 확실하다. Opus 4.6은 에이전트와 복잡한 코딩 작업용. 이번 릴리즈는 모델 성능 자체보다 API 생태계를 정비한 느낌이 강하다. 베타 딱지들을 정리하고, 에이전트 개발 흐름을 더 매끄럽게 만들려는 방향.

어차피 쓸 거라면 지금 바꿔보는 게 낫다. budget_tokens 방식은 deprecated 됐으니까, 기존 코드 업데이트도 서두르는 편이 좋겠다.


📎 참고 자료

반응형