Guia de Otimização de Custo
Como combinar ferramentas para maximizar qualidade e minimizar custo — economia de 60-70% em média.
Arquitetura de Custo
Claude Code
Claude Code — Sonnet/Opus via assinatura. Front-end, UI, criatividade, decisões arquiteturais.
Codex
Codex — GPT-5-Codex via assinatura. Code review, adversarial review, rescue em background.
OpenRouter
OpenRouter (Qwen/GLM) ou Ollama (local). Tarefas determinísticas, boilerplate, refatoração.
Princípios
- 1
Claude Code é o orquestrador — use onde é insubstituível: UI, UX, criatividade, decisões complexas
- 2
Codex é o revisor — use para code review, adversarial review e delegação de tarefas
- 3
OpenRouter é o executor barato — use Qwen 3.6 ou GLM 5.1 para tarefas determinísticas
- 4
OpenCode + Ollama é o executor gratuito — use quando quiser custo zero absoluto
Configuração Passo a Passo
1. OpenRouter como provedor barato
Obtenha API key em openrouter.ai e configure no .codex/config.toml com model_providers.openrouter.
[model_providers.openrouter]
name = "OpenRouter"
base_url = "https://openrouter.ai/api/v1"
env_key = "OPENROUTER_API_KEY"
wire_api = "responses" 2. Custom agent com modelo barato
Crie .codex/agents/qwen-worker.toml com model = "qwen/qwen-3.6-plus" e model_provider = "openrouter".
name = "qwen-worker"
description = "Executor de baixo custo para tarefas determinísticas."
model = "qwen/qwen-3.6-plus"
model_provider = "openrouter"
sandbox_mode = "workspace-write"