Skip to content
푸땡로그
Go back

Claude Sonnet 5 가격 할인: 8월 31일까지 무엇을 검증해야 할까

Anthropic이 Claude Sonnet 5를 공개하면서 가격 프로모션을 함께 걸었습니다. 공식 발표에 따르면 Claude Sonnet 5는 2026년 8월 31일까지 입력 100만 토큰당 2달러, 출력 100만 토큰당 10달러로 제공됩니다. 이후에는 입력 3달러, 출력 15달러가 표준 가격입니다.

먼저 결론부터 말하면, 이번 할인은 단순한 출시 기념 쿠폰이라기보다 Sonnet 5를 실제 에이전트 워크로드에 넣어보라는 벤치마크 기간에 가깝습니다. 8월 31일까지 확인해야 할 것은 “답변이 좋아졌는가”가 아니라 “우리 작업을 정가 기준으로도 더 싸게 끝내는가”입니다.

기준 작성 시점 2026-07-02 · Anthropic 공식 발표, Claude pricing 문서, effort 문서 스냅숏 기준입니다.

이 글에서 다루는 내용:


가격은 33% 낮게 시작합니다

Claude pricing 문서는 Claude Sonnet 5 가격을 두 구간으로 나눕니다. 2026년 8월 31일까지는 introductory pricing이 적용되고, 2026년 9월 1일부터 표준 가격이 적용됩니다.

구분입력 100만 토큰출력 100만 토큰5분 cache write1시간 cache writecache hit
2026-08-31까지$2$10$2.50$4$0.20
2026-09-01부터$3$15$3.75$6$0.30

입력과 출력 모두 표준 가격 대비 약 33% 낮습니다. cache write와 cache hit 가격도 같은 비율로 낮게 시작합니다.

flowchart LR
    A["2026-07~08<br/>할인 가격으로 실측"] --> B["작업별 성공률<br/>재시도 횟수 기록"]
    B --> C["정가 기준으로<br/>비용 재계산"]
    C --> D{"ROI 유지?"}
    D -->|예| E["프로덕션 기본 모델 후보"]
    D -->|아니오| F["작업 범위·effort<br/>모델 라우팅 조정"]

할인율 자체는 이해하기 쉽습니다. 문제는 실제 청구 비용이 토큰당 가격만으로 결정되지 않는다는 점입니다.


할인은 tokenizer 변화를 흡수하는 장치이기도 합니다

가격표에서 가장 중요한 주석은 tokenizer입니다. Claude pricing 문서는 Claude Sonnet 5가 Claude Opus 4.7 이후 Opus 모델, Fable 5, Mythos 5와 함께 새로운 tokenizer를 사용한다고 설명합니다. 같은 텍스트가 이전 tokenizer보다 대략 30% 더 많은 토큰으로 계산될 수 있다는 설명도 붙어 있습니다.

그래서 Sonnet 5의 introductory pricing은 단순히 33% 할인으로만 보면 부족합니다. 같은 입력이 더 많은 토큰으로 잡히는 변화를 일정 부분 상쇄하는 가격 완충 장치로도 봐야 합니다.

주의 Sonnet 5 도입 비용은 "입력 $2, 출력 $10"만 보고 판단하면 안 됩니다. 같은 프롬프트와 파일 묶음을 Sonnet 4.6과 Sonnet 5에 각각 넣어 실제 청구 토큰 수를 비교해야 합니다.

예를 들어 같은 작업이 Sonnet 4.6에서 입력 100만 토큰으로 계산되던 경우, Sonnet 5에서 tokenizer 영향으로 입력 130만 토큰에 가까워질 수 있습니다. 이때 8월 31일까지는 입력 단가가 낮아서 비용 충격이 작지만, 9월 1일부터는 표준 가격으로 다시 계산해야 합니다.


effort가 실제 비용을 더 크게 흔듭니다

Sonnet 5가 일반 채팅 모델이 아니라 에이전트 실행 모델로 쓰일수록 effort의 영향이 커집니다. effort는 Claude가 응답에 얼마나 많은 토큰과 작업량을 쓸지 조절하는 파라미터입니다. 문서에 따르면 텍스트 응답뿐 아니라 tool call, function argument, thinking 관련 토큰에도 영향을 줍니다.

effort 문서는 Claude Sonnet 5의 기본값을 high로 설명합니다. xhigh는 어려운 코딩·에이전트 작업에, medium은 비용을 줄이고 싶은 일반 에이전트 작업에, low는 대량 처리나 지연 시간에 민감한 작업에 어울립니다.

effortSonnet 5에서 먼저 테스트할 작업
low짧은 요약, 단순 분류, 대량 서브태스크
medium비용을 줄이고 싶은 일반 자동화 작업
high기본값. 코드 수정, 복잡한 추론, 도구 사용 작업
xhigh장시간 코딩, 복잡한 디버깅, 긴 에이전트 작업
max비용보다 최고 성능이 중요한 검증 작업

같은 Sonnet 5라도 mediumxhigh는 작업당 비용이 크게 달라질 수 있습니다. 따라서 할인 기간의 목표는 “Sonnet 5가 좋은가”를 확인하는 것이 아니라, 작업 유형별로 어떤 effort가 충분한지 찾는 것입니다.

Tip 팀에서 Sonnet 5를 평가할 때는 모델 이름만 로그에 남기지 말고 effort, 입력 토큰, 출력 토큰, tool call 수, 재시도 횟수를 같이 남기는 편이 좋습니다.

8월 31일까지는 벤치마크 창입니다

Anthropic은 공식 발표에서 Sonnet 5가 Sonnet 4.6보다 reasoning, tool use, coding, knowledge work에서 개선됐고, Opus 4.8에 가까운 성능을 더 낮은 가격으로 제공한다고 설명합니다. 또 BrowseComp와 OSWorld-Verified 차트에서 Sonnet 5가 effort 수준에 따라 넓은 비용-성능 선택지를 제공한다고 소개합니다.

이 설명이 맞는지 확인하려면 팀의 실제 작업으로 봐야 합니다. 특히 Claude Code, 코드 리뷰 자동화, 리서치 에이전트, CRM·문서 자동화처럼 도구 호출이 많은 작업은 벤치마크 점수보다 완료율과 재시도 비용이 더 중요합니다.

할인 기간에는 다음 지표를 남기는 것이 좋습니다.

  1. 같은 작업을 Sonnet 4.6, Sonnet 5, Opus 4.8에 나눠 실행했을 때 완료율
  2. 성공한 작업 기준 총 입력 토큰, 출력 토큰, cache hit 비율
  3. 실패 후 재시도까지 포함한 작업당 총비용
  4. medium, high, xhigh effort별 품질 차이
  5. 2026년 9월 1일 이후 표준 가격으로 재계산한 예상 월 비용

이렇게 보면 introductory pricing은 할인이라기보다 실험 비용을 낮춰주는 기간입니다. 좋은 모델을 싸게 쓰는 것보다, 정가 전환 후에도 남길 워크로드를 고르는 것이 더 중요합니다.


기존 Sonnet 5 글과 어떻게 나눠 읽을까

Sonnet 5의 전체 포지셔닝, benchmark, 안전성 평가는 Claude Sonnet 5 출시 글에서 이미 다뤘습니다. 이 글은 그중 가격 구간과 비용 검증만 따로 떼어 본 보완 포스트입니다.

비교 기준을 넓히려면 Claude Sonnet 4.6 심층 분석도 함께 보면 좋습니다. Sonnet 4.6이 “중간 모델이 Opus급 성능에 접근한다”는 흐름을 만들었다면, Sonnet 5는 그 흐름을 에이전트 실행과 effort 조절로 더 밀어붙입니다.

Claude Opus 4.8 글은 상위 모델을 어디에 남겨둘지 판단할 때 참고할 수 있습니다. 모든 작업을 Sonnet 5로 내리는 것보다, 실패 비용이 큰 판단 작업은 Opus급에 남기고 반복 실행은 Sonnet 5로 보내는 식의 모델 라우팅이 더 현실적입니다.


마무리

Claude Sonnet 5의 가격 할인은 입력 $2, 출력 $10이라는 숫자보다 “지금 실제 워크로드로 측정해보라”는 신호에 가깝습니다. 8월 31일까지는 할인 가격이 tokenizer 변화와 에이전트 실험 비용을 어느 정도 흡수해줍니다.

하지만 9월 1일부터는 입력 $3, 출력 $15가 표준 가격입니다. 그래서 지금 해야 할 일은 Sonnet 5를 막연히 기본 모델로 바꾸는 것이 아니라, 작업별 성공률과 재시도 비용을 남기고 정가 기준으로 다시 계산하는 것입니다.

Sonnet 5가 에이전트 작업을 더 끝까지 처리한다면 토큰당 가격이 아니라 작업당 총비용에서 이길 수 있습니다. 할인 기간의 진짜 목적은 그 지점을 찾는 데 있습니다.


참고 자료


Share this post on:

Previous Post
OpenUsage: AI 코딩 사용량을 메뉴바에서 한눈에 보기 — 유사 도구 4종 비교
Next Post
Claude Fable 5 재배포: 모델 접근권은 어떻게 다시 열렸나