Guia de Otimização de Custo

Como combinar ferramentas para maximizar qualidade e minimizar custo — economia de 60-70% em média.

Arquitetura de Custo

Orquestrador (caro)

Claude Code

Claude Code — Sonnet/Opus via assinatura. Front-end, UI, criatividade, decisões arquiteturais.

Review (custo fixo)

Codex

Codex — GPT-5-Codex via assinatura. Code review, adversarial review, rescue em background.

Execução (barato/grátis)

OpenRouter

OpenRouter (Qwen/GLM) ou Ollama (local). Tarefas determinísticas, boilerplate, refatoração.

Princípios

  • 1

    Claude Code é o orquestrador — use onde é insubstituível: UI, UX, criatividade, decisões complexas

  • 2

    Codex é o revisor — use para code review, adversarial review e delegação de tarefas

  • 3

    OpenRouter é o executor barato — use Qwen 3.6 ou GLM 5.1 para tarefas determinísticas

  • 4

    OpenCode + Ollama é o executor gratuito — use quando quiser custo zero absoluto

Configuração Passo a Passo

1. OpenRouter como provedor barato

Obtenha API key em openrouter.ai e configure no .codex/config.toml com model_providers.openrouter.

[model_providers.openrouter]
name = "OpenRouter"
base_url = "https://openrouter.ai/api/v1"
env_key = "OPENROUTER_API_KEY"
wire_api = "responses"

2. Custom agent com modelo barato

Crie .codex/agents/qwen-worker.toml com model = "qwen/qwen-3.6-plus" e model_provider = "openrouter".

name = "qwen-worker"
description = "Executor de baixo custo para tarefas determinísticas."
model = "qwen/qwen-3.6-plus"
model_provider = "openrouter"
sandbox_mode = "workspace-write"