OpenClaw을 설치하고 나면 가장 먼저 마주치는 질문이 있습니다. “어떤 모델을 써야 하지?” Claude, ChatGPT, Grok, Gemini, 심지어 로컬 모델까지. 선택지가 너무 많아 오히려 결정이 어렵습니다.
이 글에서는 OpenClaw이 지원하는 주요 AI 모델의 가격과 성능을 비교하고, 사용 패턴별 월 예상 비용을 계산한 뒤, 실전에서 바로 적용할 수 있는 비용 절감 전략을 정리합니다.
OpenClaw 설치가 아직 안 되어 있다면 맥에서 OpenClaw 설치 및 설정 가이드를 먼저 참고하세요.
지원 모델 한눈에 보기
OpenClaw은 다양한 AI 프로바이더를 지원합니다. 하나의 모델에 고정되지 않고, 작업 성격에 따라 모델을 전환할 수 있다는 점이 핵심입니다.
| 프로바이더 | 대표 모델 | 특징 |
|---|---|---|
| Anthropic (Claude) | Opus 4.6, Sonnet 4.5, Haiku 4.5 | 코딩·추론 최강, 최대 1M 컨텍스트 |
| OpenAI (GPT) | GPT-5, GPT-4.1 | 넓은 생태계, 1.05M 컨텍스트 |
| xAI (Grok) | Grok 4, Grok 4.1 Fast | 2M 컨텍스트, 초저가 |
| Google (Gemini) | Gemini 2.5 Pro, 2.5 Flash | 1M 컨텍스트, 무료 티어 |
| Ollama (로컬) | Llama 3.2, Qwen 2.5, EXAONE 3.5 | 완전 무료, 오프라인 |
OpenClaw 설정에서 모델을 지정하는 방식은 직관적입니다.
{
agent: {
model: { primary: "anthropic/claude-sonnet-4-5" },
models: {
"anthropic/claude-sonnet-4-5": { alias: "Sonnet" },
"anthropic/claude-opus-4-6": { alias: "Opus" },
},
},
}
가격 비교
2026년 2월 기준, 1M(백만) 토큰당 USD 가격입니다. 토큰이 낯설다면, 1M 토큰 ≈ 영어 약 75만 단어 ≈ A4 용지 약 1,500장 분량이라고 생각하면 됩니다.
Claude (Anthropic)
| 모델 | 입력 | 출력 | 컨텍스트 |
|---|---|---|---|
| Opus 4.6 | $5 | $25 | 1M (베타) |
| Sonnet 4.5 | $3 | $15 | 200K |
| Haiku 4.5 | $1 | $5 | 200K |
Claude는 코딩과 추론 성능이 가장 뛰어납니다. 프롬프트 캐싱을 적용하면 입력 가격의 10%만 과금되어, 반복 작업에서 비용을 크게 절감할 수 있습니다.
OpenAI (GPT)
| 모델 | 입력 | 출력 | 컨텍스트 |
|---|---|---|---|
| GPT-5 | $1.25 | $10 | 128K |
| GPT-4.1 | $2 | $8 | 1.05M |
| GPT-4.1-nano | $0.10 | $0.40 | 1.05M |
GPT-4.1 시리즈는 1.05M 컨텍스트 윈도우를 제공합니다. GPT-4.1-nano는 $0.10/$0.40으로 업계 최저가 수준이며, 가벼운 작업에 적합합니다.
xAI (Grok)
| 모델 | 입력 | 출력 | 컨텍스트 |
|---|---|---|---|
| Grok 4 | $3 | $15 | 256K |
| Grok 4.1 Fast | $0.20 | $0.50 | 2M |
Grok 4.1 Fast가 눈에 띕니다. 2M 컨텍스트에 입력 $0.20이면 대용량 문서 처리에서 압도적인 가성비를 제공합니다. 신규 가입 시 $25 무료 크레딧도 제공됩니다.
Google (Gemini)
| 모델 | 입력 | 출력 | 컨텍스트 | 무료 티어 |
|---|---|---|---|---|
| Gemini 2.5 Pro | $1.25 | $10 | 1M | 있음 |
| Gemini 2.5 Flash | $0.30 | $2.50 | 1M | 있음 |
| Gemini 2.5 Flash-Lite | $0.10 | $0.40 | 1M | 있음 |
Gemini의 강점은 무료 티어입니다. 일 1,000 요청까지 무료로 사용할 수 있어, 경량 사용자에게 매력적입니다. Flash-Lite는 $0.10 입력에 1M 컨텍스트를 지원합니다.
Ollama (로컬 모델)
| 모델 | 파라미터 | RAM 요구 | 특징 |
|---|---|---|---|
| Llama 3.2 | 8B | 8GB | 가벼운 범용 모델 |
| Qwen 2.5 | 7B | 8GB | 코딩 특화, 다국어 |
| EXAONE 3.5 | 7.8B | 8GB | 한국어 특화, LG AI 연구원 |
로컬 모델의 비용은 $0입니다. 7~8B 모델은 속도와 품질의 밸런스가 좋으며, 8GB RAM만 있으면 충분히 실용적입니다.
성능 비교
가격만으로 모델을 고르면 후회합니다. 작업에 맞는 성능을 갖추고 있는지 확인해야 합니다.
컨텍스트 윈도우
긴 문서나 대규모 코드베이스를 다룰 때 컨텍스트 윈도우 크기가 중요합니다.
| 순위 | 모델 | 컨텍스트 |
|---|---|---|
| 1 | Grok 4.1 Fast | 2M |
| 2 | GPT-4.1 | 1.05M |
| 3 | Gemini 2.5 Pro/Flash | 1M |
| 4 | Claude Opus 4.6 | 1M (베타) |
| 5 | Claude Sonnet 4.5 | 200K |
Opus 4.6는 2026년 2월 출시와 함께 1M 베타 컨텍스트를 지원합니다. 대용량 문서 처리가 필요하다면 Grok 4.1 Fast나 GPT-4.1이 적합합니다.
코딩 성능 (SWE-bench Verified)
코딩 에이전트로 OpenClaw을 사용한다면 이 벤치마크가 가장 중요합니다.
| 순위 | 모델 | SWE-bench 점수 |
|---|---|---|
| 1 | Claude Opus 4.6 | 80.8% |
| 2 | Claude Sonnet 4.5 | 77.2% |
| 3 | Gemini 2.5 Pro | ~73% |
Claude Opus가 최고 성능을 보여주며, Sonnet 4.5도 77.2%로 가격 대비 성능이 뛰어납니다.
모델별 강점 요약
| 모델 | 가장 잘하는 것 |
|---|---|
| Claude | 코드 생성, 디버깅, 복잡한 추론 |
| GPT-5 | 범용 작업, 넓은 생태계 |
| Gemini 2.5 Pro | 멀티모달, 무료 티어 |
| Grok 4.1 Fast | 2M 컨텍스트 + 초저가 |
| Ollama 로컬 | 프라이버시, 무료, 오프라인 |
사용 패턴별 월 예상 비용
실제로 얼마나 나올지 궁금하시죠? 세 가지 사용 시나리오별로 월 비용을 계산했습니다.
계산 공식:
일간 요청 수 × 30일 × (입력 토큰 × 입력 가격 + 출력 토큰 × 출력 가격) ÷ 1,000,000
경량 사용 (일 10회, 2K 입력 / 500 출력)
간단한 질문, 메모 정리, 일정 관리 등 가벼운 용도입니다.
| 모델 | 월간 토큰 (입력/출력) | 월 비용 |
|---|---|---|
| Claude Opus 4.6 | 600K / 150K | $6.75 |
| Claude Sonnet 4.5 | 600K / 150K | $4.05 |
| Claude Haiku 4.5 | 600K / 150K | $1.35 |
| GPT-4.1 | 600K / 150K | $2.40 |
| GPT-4.1-nano | 600K / 150K | $0.12 |
| Grok 4.1 Fast | 600K / 150K | $0.20 |
| Gemini 2.5 Flash | 600K / 150K | $0.56 |
| Gemini 2.5 Flash-Lite | 600K / 150K | $0.12 |
| Ollama (로컬) | 600K / 150K | $0 |
경량 사용이라면 어떤 모델을 골라도 월 $10 이하입니다. Nano, Flash-Lite, Grok Fast 같은 경량 모델은 사실상 무시할 수 있는 수준입니다.
중간 사용 (일 50회, 5K 입력 / 1K 출력)
코드 리뷰, 문서 작성, 이메일 초안 등 업무 보조 용도입니다.
| 모델 | 월간 토큰 (입력/출력) | 월 비용 |
|---|---|---|
| Claude Opus 4.6 | 7.5M / 1.5M | $75.00 |
| Claude Sonnet 4.5 | 7.5M / 1.5M | $45.00 |
| Claude Haiku 4.5 | 7.5M / 1.5M | $15.00 |
| GPT-4.1 | 7.5M / 1.5M | $27.00 |
| GPT-4.1-nano | 7.5M / 1.5M | $1.35 |
| Grok 4.1 Fast | 7.5M / 1.5M | $2.25 |
| Gemini 2.5 Flash | 7.5M / 1.5M | $6.00 |
| Gemini 2.5 Flash-Lite | 7.5M / 1.5M | $1.35 |
| Ollama (로컬) | 7.5M / 1.5M | $0 |
중간 사용부터 모델 간 비용 차이가 확 벌어집니다. Opus는 월 $75인데 Grok Fast는 $2.25. 같은 작업량에서 33배 차이가 납니다.
헤비 사용 (일 200회, 10K 입력 / 2K 출력)
개발 에이전트, 대규모 코드 분석, 자동화 파이프라인 등 고강도 용도입니다.
| 모델 | 월간 토큰 (입력/출력) | 월 비용 |
|---|---|---|
| Claude Opus 4.6 | 60M / 12M | $600 |
| Claude Sonnet 4.5 | 60M / 12M | $360 |
| Claude Haiku 4.5 | 60M / 12M | $120 |
| GPT-4.1 | 60M / 12M | $216 |
| GPT-4.1-nano | 60M / 12M | $10.80 |
| Grok 4.1 Fast | 60M / 12M | $18 |
| Gemini 2.5 Flash | 60M / 12M | $48 |
| Gemini 2.5 Flash-Lite | 60M / 12M | $10.80 |
| Ollama (로컬) | 60M / 12M | $0 |
헤비 사용에서 Opus $600 vs Ollama $0. 물론 품질 차이가 있지만, 모든 작업에 Opus가 필요한 건 아닙니다. 작업 성격에 맞는 모델을 선택하는 것이 중요합니다.
비용 절감 전략
OpenClaw의 진짜 장점은 여러 모델을 조합해서 쓸 수 있다는 점입니다. 아래 전략을 적용하면 비용을 크게 줄일 수 있습니다.
1. 프롬프트 캐싱 활용
OpenClaw은 매 메시지마다 동일한 시스템 프롬프트를 AI에게 전송합니다. 캐싱이 적용되면 이 반복 비용을 대폭 줄일 수 있습니다.
| 프로바이더 | 캐시 할인율 |
|---|---|
| Claude | 90% 할인 |
| Grok | 75% 할인 |
| OpenAI | 50-75% 할인 |
Claude 기준으로 Sonnet 4.5의 입력 가격 $3가 캐시 적중 시 $0.30으로 떨어집니다. 시스템 프롬프트가 입력의 대부분을 차지하므로, 실질 입력 비용을 크게 절감할 수 있습니다.
2. 무료 옵션 최대 활용
돈을 아예 안 쓰는 방법도 있습니다.
| 무료 옵션 | 내용 |
|---|---|
| Ollama 로컬 | 모든 추론 무료 |
| Gemini 무료 티어 | 일 1,000 요청 |
| Grok 신규 크레딧 | $25 무료 |
Ollama + Gemini 무료 티어를 조합하면 완전 무료로 OpenClaw을 운영할 수 있습니다. 가벼운 용도에는 충분합니다.
3. 간단한 모델 선택 팁
모든 작업에 비싼 모델을 쓸 필요는 없습니다. 작업 성격에 따라 모델을 선택하세요.
- 코딩, 복잡한 추론 → Claude Sonnet 4.5 또는 Opus 4.6
- 가성비 중시, 대용량 문서 → Grok 4.1 Fast 또는 Gemini Flash
- 완전 무료 → Ollama (Llama 3.2, Qwen 2.5, EXAONE 3.5)
시나리오별 추천 모델
결국 “어떤 모델을 써야 하나?”에 대한 답은 용도에 따라 다르다입니다. 아래 추천을 참고하세요.
| 용도 | 추천 모델 | 월 예상 비용 |
|---|---|---|
| 개인 자동화 (경량) | Haiku 4.5 | $5~10 |
| 소규모 비즈니스 | Sonnet 4.5 | $20~40 |
| 개발자 (코딩 중심) | Sonnet 4.5 | $30~50 |
| 최고 품질 | Opus 4.6 | $50~100+ |
| 예산 최소화 | Grok 4.1 Fast 또는 Gemini Flash | $2~10 |
| 완전 무료 | Ollama (Llama 3.2, Qwen 2.5, EXAONE 3.5) | $0 |
마무리
OpenClaw의 모델 선택은 “최고의 모델”을 찾는 것이 아니라, “내 사용 패턴에 맞는 최적 모델”을 찾는 것입니다.
핵심 포인트를 정리하면:
- 코딩 품질이 최우선 → Claude Sonnet 4.5 (가성비) 또는 Opus 4.6 (최고 품질)
- 대용량 컨텍스트 필요 → Grok 4.1 Fast (2M) 또는 GPT-4.1 (1.05M)
- 비용 최소화 → Grok 4.1 Fast 또는 Gemini Flash + 프롬프트 캐싱
- 무료로 시작 → Ollama + Gemini 무료 티어
모델 가격은 계속 변동하고, 새로운 모델도 빠르게 등장합니다. 이 글의 가격 정보는 2026년 2월 기준이니, 최신 가격은 각 프로바이더의 공식 페이지에서 확인하세요.
참고 자료: