Nunca pare de codificar. Roteamento inteligente para modelos de IA GRATUITOS e de baixo custo com fallback automático.
Seu proxy de API universal — um endpoint, mais de 36 provedores, tempo de inatividade zero.
Conclusões de bate-papo • Incorporações • Geração de imagem • Áudio • Reclassificação • 100% TypeScript
Conecte qualquer ferramenta IDE ou CLI com tecnologia de IA por meio do OmniRoute - gateway de API gratuito para codificação ilimitada.
|
OpenClaw ⭐ 205K |
NanoBot ⭐ 20.9K |
PicoClaw ⭐ 14.6K |
ZeroClaw ⭐ 9.9K |
IronClaw ⭐ 2.1K |
|
OpenCode ⭐ 106K |
Codex CLI ⭐ 60.8K |
Claude Code ⭐ 67.3K |
Gemini CLI ⭐ 94.7K |
Kilo Code ⭐ 15.5K |
📡 Todos os agentes se conectam via http://localhost:20128/v1 ou http://cloud.omniroute.online/v1 — uma configuração, modelos ilimitados e cota
🌐 Website • 🚀 Quick Start • 💡 Features • 📖 Docs • 💰 Pricing • 💬 WhatsApp
🌐 Available in: 🇺🇸 English | 🇧🇷 Português (Brasil) | 🇪🇸 Español | 🇫🇷 Français | 🇮🇹 Italiano | 🇷🇺 Русский | 🇨🇳 中文 (简体) | 🇩🇪 Deutsch | 🇮🇳 हिन्दी | 🇹🇭 ไทย | 🇺🇦 Українська | 🇸🇦 العربية | 🇯🇵 日本語 | 🇻🇳 Tiếng Việt | 🇧🇬 Български | 🇩🇰 Dansk | 🇫🇮 Suomi | 🇮🇱 עברית | 🇭🇺 Magyar | 🇮🇩 Bahasa Indonesia | 🇰🇷 한국어 | 🇲🇾 Bahasa Melayu | 🇳🇱 Nederlands | 🇳🇴 Norsk | 🇵🇹 Português (Portugal) | 🇷🇴 Română | 🇵🇱 Polski | 🇸🇰 Slovenčina | 🇸🇪 Svenska | 🇵🇭 Filipino
Pare de desperdiçar dinheiro e atingir limites:
A cota de assinatura expira sem ser utilizada todos os meses
Os limites de taxa impedem você no meio da codificação
APIs caras (US$ 20-50/mês por provedor)
Troca manual entre provedores
OmniRoute resolve isso:
- ✅ Maximize as assinaturas - Rastreie a cota, use cada bit antes de redefinir
- ✅ Fullback automático - Assinatura → Chave de API → Barato → Gratuito, tempo de inatividade zero
- ✅ Múltiplas contas - Round-robin entre contas por provedor
- ✅ Universal - Funciona com Claude Code, Codex, Gemini CLI, Cursor, Cline, OpenClaw, qualquer ferramenta CLI
┌─────────────┐
│ Your CLI │ (Claude Code, Codex, Gemini CLI, OpenClaw, Cursor, Cline...)
│ Tool │
└──────┬──────┘
│ http://localhost:20128/v1
↓
┌─────────────────────────────────────────┐
│ OmniRoute (Smart Router) │
│ • Format translation (OpenAI ↔ Claude) │
│ • Quota tracking + Embeddings + Images │
│ • Auto token refresh │
└──────┬──────────────────────────────────┘
│
├─→ [Tier 1: SUBSCRIPTION] Claude Code, Codex, Gemini CLI
│ ↓ quota exhausted
├─→ [Tier 2: API KEY] DeepSeek, Groq, xAI, Mistral, NVIDIA NIM, etc.
│ ↓ budget limit
├─→ [Tier 3: CHEAP] GLM ($0.6/1M), MiniMax ($0.2/1M)
│ ↓ budget limit
└─→ [Tier 4: FREE] iFlow, Qwen, Kiro (unlimited)
Result: Never stop coding, minimal cost1. Instale globalmente:
npm install -g omniroute
omniroute🎉 O painel abre às http://localhost:20128
| Comando | Descrição |
|---|---|
omniroute |
Iniciar servidor (porta padrão 20128) |
omniroute --port 3000 |
Usar porta personalizada |
omniroute --no-open |
Não abra o navegador automaticamente |
omniroute --help |
Mostrar ajuda |
2. Conecte um provedor GRATUITO:
Painel → Provedores → Conectar Claude Code ou Antigravidade → Login OAuth → Concluído!
3. Use em sua ferramenta CLI:
Claude Code/Codex/Gemini CLI/OpenClaw/Cursor/Cline Settings:
Endpoint: http://localhost:20128/v1
API Key: [copy from dashboard]
Model: if/kimi-k2-thinkingÉ isso aí! Comece a codificar com modelos de IA GRATUITOS.
Alternativa – execute a partir da fonte:
cp .env.example .env
npm install
PORT=20128 NEXT_PUBLIC_BASE_URL=http://localhost:20128 npm run devOmniRoute está disponível como uma imagem pública do Docker em Docker Hub.
Execução rápida:
docker run -d \
--name omniroute \
--restart unless-stopped \
-p 20128:20128 \
-v omniroute-data:/app/data \
diegosouzapw/omniroute:latestCom arquivo de ambiente:
# Copy and edit .env first
cp .env.example .env
docker run -d \
--name omniroute \
--restart unless-stopped \
--env-file .env \
-p 20128:20128 \
-v omniroute-data:/app/data \
diegosouzapw/omniroute:latestUsando Docker Compose:
# Base profile (no CLI tools)
docker compose --profile base up -d
# CLI profile (Claude Code, Codex, OpenClaw built-in)
docker compose --profile cli up -d| Imagem | Etiqueta | Tamanho | Descrição |
|---|---|---|---|
diegosouzapw/omniroute |
latest |
~250 MB | Última versão estável |
diegosouzapw/omniroute |
1.0.3 |
~250 MB | Versão atual |
| Nível | Provedor | Custo | Redefinição de cota | Melhor para |
|---|---|---|---|---|
| 💳 ASSINATURA | Código Claude (Pro) | $ 20/mês | 5h + semanalmente | Já inscrito |
| Códice (Plus/Pro) | US$ 20-200/mês | 5h + semanalmente | Usuários OpenAI | |
| Gêmeos CLI | GRÁTIS | 180 mil/mês + 1 mil/dia | Todos! | |
| Copiloto GitHub | US$ 10-19/mês | Mensalmente | Usuários do GitHub | |
| 🔑 CHAVE DE API | NVIDIA NIM | GRÁTIS (1000 créditos) | Único | Teste de nível gratuito |
| DeepSeek | Pagamento conforme uso | Nenhum | Melhor preço/qualidade | |
| Groq | Nível gratuito + pago | Taxa limitada | Inferência ultrarrápida | |
| xAI (Groque) | Pagamento conforme uso | Nenhum | Modelos Grok | |
| Mistral | Nível gratuito + pago | Taxa limitada | IA Europeia | |
| OpenRouter | Pagamento conforme uso | Nenhum | Mais de 100 modelos | |
| 💰 BARATO | GLM-4.7 | US$ 0,6/1 milhão | Diariamente 10h | Backup de orçamento |
| MiniMax M2.1 | US$ 0,2/1 milhão | Rolamento de 5 horas | Opção mais barata | |
| Kimi K2 | $ 9 / mês fixo | 10 milhões de tokens/mês | Custo previsível | |
| 🆓 GRÁTIS | iFlow | $0 | Ilimitado | 8 modelos grátis |
| Qwen | $0 | Ilimitado | 3 modelos grátis | |
| Kiro | $0 | Ilimitado | Cláudio grátis |
💡 Dica profissional: Comece com Gemini CLI (180 mil grátis/mês) + combo iFlow (gratuito ilimitado) = custo de $ 0!
Problema: A cota expira sem ser utilizada, limites de taxa durante codificação pesada
Combo: "maximize-claude"
1. cc/claude-opus-4-6 (use subscription fully)
2. glm/glm-4.7 (cheap backup when quota out)
3. if/kimi-k2-thinking (free emergency fallback)
Monthly cost: $20 (subscription) + ~$5 (backup) = $25 total
vs. $20 + hitting limits = frustrationProblema: Não posso pagar assinaturas, preciso de codificação de IA confiável
Combo: "free-forever"
1. gc/gemini-3-flash (180K free/month)
2. if/kimi-k2-thinking (unlimited free)
3. qw/qwen3-coder-plus (unlimited free)
Monthly cost: $0
Quality: Production-ready modelsProblema: Prazos, não podemos arcar com o tempo de inatividade
Combo: "always-on"
1. cc/claude-opus-4-6 (best quality)
2. cx/gpt-5.2-codex (second subscription)
3. glm/glm-4.7 (cheap, resets daily)
4. minimax/MiniMax-M2.1 (cheapest, 5h reset)
5. if/kimi-k2-thinking (free unlimited)
Result: 5 layers of fallback = zero downtimeProblema: Precisa de assistente de IA em aplicativos de mensagens, totalmente gratuito
Combo: "openclaw-free"
1. if/glm-4.7 (unlimited free)
2. if/minimax-m2.1 (unlimited free)
3. if/kimi-k2-thinking (unlimited free)
Monthly cost: $0
Access via: WhatsApp, Telegram, Slack, Discord, iMessage, Signal...| Recurso | O que faz |
|---|---|
| 🎯 Fullback inteligente de 4 camadas | Roteamento automático: Assinatura → Chave de API → Barato → Grátis |
| 📊 Acompanhamento de cotas em tempo real | Contagem de tokens ativos + contagem regressiva redefinida por provedor |
| 🔄 Tradução de formato | OpenAI ↔ Claude ↔ Gemini ↔ Cursor ↔ Kiro sem costura + higienização de resposta |
| 👥 Suporte para múltiplas contas | Múltiplas contas por provedor com seleção inteligente |
| 🔄 Atualização automática de token | Os tokens OAuth são atualizados automaticamente com nova tentativa |
| 🎨 Combos Personalizados | 6 estratégias: preencher primeiro, round-robin, p2c, aleatório, menos usado, otimizado para custos |
| 🧩 Modelos Personalizados | Adicione qualquer ID de modelo a qualquer provedor |
| 🌐 Roteador curinga | Rotear padrões provider/* para qualquer provedor dinamicamente |
| 🧠 Pensando no Orçamento | Modos de passagem, automático, personalizado e adaptativo para modelos de raciocínio |
| 💬 Injeção imediata do sistema | Prompt de sistema global aplicado em todas as solicitações |
| 📄 API de respostas | Suporte completo à API de respostas OpenAI (/v1/responses) para Codex |
| Recurso | O que faz |
|---|---|
| 🖼️ Geração de imagens | /v1/images/generations — 4 provedores, mais de 9 modelos |
| 📐 Incorporações | /v1/embeddings — 6 provedores, mais de 9 modelos |
| 🎤 Transcrição de áudio | /v1/audio/transcriptions — Compatível com sussurro |
| 🔊 Conversão de texto em fala | /v1/audio/speech — Síntese de áudio multiprovedor |
| 🛡️ Moderações | /v1/moderations — Verificações de segurança de conteúdo |
| 🔀 Reclassificação | /v1/rerank — Reclassificação da relevância dos documentos |
| Recurso | O que faz |
|---|---|
| 🔌 Disjuntor | Abertura/fechamento automático por provedor com limites configuráveis |
| 🛡️ Rebanho Anti-Trovão | Mutex + limite de taxa de semáforo para provedores de chaves de API |
| 🧠 Cache Semântico | Cache de duas camadas (assinatura + semântica) reduz custo e latência |
| ⚡ Solicitar Idempotência | Janela de desduplicação 5s para solicitações duplicadas |
| 🔒 Falsificação de impressão digital TLS | Ignore a detecção de bot baseada em TLS via wreq-js |
| 🌐 Filtragem de IP | Lista de permissões/lista de bloqueio para controle de acesso à API |
| 📊 Limites de taxas editáveis | RPM configurável, intervalo mínimo e simultâneo máximo no nível do sistema |
| 🛡 Proteção de endpoint de API | Autenticação + bloqueio de provedor para o endpoint /models |
| 🔒 Visibilidade do proxy | Crachás codificados por cores: 🟢 global, 🟡 provedor, 🔵 por conexão com display IP |
| 🌐 Configuração de proxy de 3 níveis | Configurar proxies em nível global, por provedor ou por conexão |
| Recurso | O que faz |
|---|---|
| 📝 Solicitar registro | Modo de depuração com logs completos de solicitação/resposta |
| 💾 Logs de proxy SQLite | Logs de proxy persistentes sobrevivem às reinicializações do servidor |
| 📊 Painel de análise | Alimentado por recargas: cartões de estatísticas, gráfico de uso de modelo, tabela de provedores |
| 📈 Acompanhamento do progresso | Eventos de progresso SSE opcionais para streaming |
| 🧪 Avaliações LLM | Teste de Golden Set com 4 estratégias de jogo |
| 🔍 Solicitar Telemetria | Agregação de latência p50/p95/p99 + rastreamento X-Request-Id |
| 📋 Painel de registros | Página unificada de 4 guias: Logs de solicitação, Logs de proxy, Logs de auditoria, Console |
| 🖥️ Visualizador de registros do console | Visualizador em estilo terminal em tempo real com filtro de nível, pesquisa, rolagem automática |
| 📑 Registro baseado em arquivo | O interceptor do console captura toda a saída para o arquivo de log JSON com rotação |
| 🏥 Painel de saúde | Tempo de atividade do sistema, estados de disjuntores, bloqueios, estatísticas de cache |
| 💰 Acompanhamento de custos | Gestão orçamentária + configuração de preços por modelo |
| Recurso | O que faz |
|---|---|
| 💾 Sincronização na nuvem | Sincronize a configuração entre dispositivos por meio do Cloudflare Workers |
| 🌐 Implante em qualquer lugar | Localhost, VPS, Docker, Cloudflare Workers |
| 🔑 Gerenciamento de chaves de API | Gerar, alternar e definir o escopo de chaves de API por provedor |
| 🧙 Assistente de integração | Configuração guiada em 4 etapas para usuários iniciantes |
| 🔧 Painel de Ferramentas CLI | Configurar com um clique Claude, Codex, Cline, OpenClaw, Kilo, Antigravity |
| 🔄 Backups de banco de dados | Backup, restauração, exportação e importação automáticos para todas as configurações |
| 🌐 Internacionalização | i18n completo com next-intl — Suporte Inglês + Português (Brasil) |
| 🌍 Seletor de idioma | Ícone de globo no cabeçalho para troca de idioma em tempo real (🇺🇸/🇧🇷) |
| 📂 Diretório de dados personalizado | DATA_DIR env var para substituir o caminho de armazenamento padrão ~/.omniroute |
📖 Detalhes do recurso
Crie combos com fallback automático:
Combo: "my-coding-stack"
1. cc/claude-opus-4-6 (your subscription)
2. nvidia/llama-3.3-70b (free NVIDIA API)
3. glm/glm-4.7 (cheap backup, $0.6/1M)
4. if/kimi-k2-thinking (free fallback)
→ Auto switches when quota runs out or errors occur- Consumo de token por provedor
- Redefinir contagem regressiva (5 horas, diariamente, semanalmente)
- Estimativa de custos para níveis pagos
- Relatórios mensais de gastos
Tradução perfeita entre formatos:
- OpenAI ↔ Claude ↔ Gêmeos ↔ Respostas OpenAI
- Sua ferramenta CLI envia o formato OpenAI → OmniRoute traduz → O provedor recebe o formato nativo
- Funciona com qualquer ferramenta que suporte endpoints OpenAI personalizados
- Higienização de resposta — Remove campos não padrão para compatibilidade estrita com o OpenAI SDK
- Normalização de funções —
developer→systempara não-OpenAI;system→userpara modelos GLM/ERNIE - ** Extração de tags Think ** —
<think>blocos →reasoning_contentpara modelos de pensamento - Saída estruturada —
json_schema→responseMimeType/responseSchemade Gêmeos
- Adicione várias contas por provedor
- Round-robin automático ou roteamento baseado em prioridade
- Fallback para a próxima conta quando alguém atingir a cota
- Os tokens OAuth são atualizados automaticamente antes da expiração
- Não é necessária reautenticação manual
- Experiência perfeita em todos os provedores
- Crie combinações ilimitadas de modelos
- 6 estratégias: preencher primeiro, round-robin, poder de duas escolhas, aleatório, menos usado, otimizado para custos
- Compartilhe combos entre dispositivos com Cloud Sync
- Status do sistema (tempo de atividade, versão, uso de memória)
- Estados do disjuntor por provedor (Fechado/Aberto/Meio-Aberto)
- Status do limite de taxa e bloqueios ativos
- Estatísticas de cache de assinatura
- Telemetria de latência (p50/p95/p99) + cache de prompt
- Redefinir o status de saúde com um clique
OmniRoute inclui um poderoso Translator Playground integrado com 4 modos para depuração, teste e monitoramento de traduções de API:
| Modo | Descrição |
|---|---|
| 💻 Parque Infantil | Tradução direta de formato — cole qualquer corpo de solicitação de API e veja instantaneamente como o OmniRoute o traduz entre formatos de provedor (OpenAI ↔ Claude ↔ Gemini ↔ API de respostas). Inclui modelos de exemplo e detecção automática de formato. |
| 💬 Testador de bate-papo | Envie solicitações de chat reais por meio do OmniRoute e veja o percurso completo: sua entrada, a solicitação traduzida, a resposta do provedor e a resposta traduzida de volta. Inestimável para validar o roteamento combinado. |
| 🧪 Bancada de testes | Modo de teste em lote — defina vários casos de teste com diferentes entradas e resultados esperados, execute-os todos de uma vez e compare os resultados entre provedores e modelos. |
| 📱Monitoramento ao vivo | Monitoramento de solicitações em tempo real: observe as solicitações recebidas conforme elas fluem pelo OmniRoute, veja as traduções de formato acontecendo ao vivo e identifique problemas instantaneamente. |
Acesso: Painel → Tradutor (barra lateral)
- Sincronize provedores, combos e configurações entre dispositivos
- Sincronização automática em segundo plano
- Armazenamento criptografado seguro
💳 Provedores de assinatura
Dashboard → Providers → Connect Claude Code
→ OAuth login → Auto token refresh
→ 5-hour + weekly quota tracking
Models:
cc/claude-opus-4-6
cc/claude-sonnet-4-5-20250929
cc/claude-haiku-4-5-20251001Dica profissional: Use o Opus para tarefas complexas e o Sonnet para velocidade. OmniRoute rastreia cota por modelo!
Dashboard → Providers → Connect Codex
→ OAuth login (port 1455)
→ 5-hour + weekly reset
Models:
cx/gpt-5.2-codex
cx/gpt-5.1-codex-maxDashboard → Providers → Connect Gemini CLI
→ Google OAuth
→ 180K completions/month + 1K/day
Models:
gc/gemini-3-flash-preview
gc/gemini-2.5-proMelhor valor: Grande nível gratuito! Use isso antes dos níveis pagos.
Dashboard → Providers → Connect GitHub
→ OAuth via GitHub
→ Monthly reset (1st of month)
Models:
gh/gpt-5
gh/claude-4.5-sonnet
gh/gemini-3-pro🔑 Provedores de chave de API
- Inscreva-se: build.nvidia.com
- Obtenha uma chave de API gratuita (1.000 créditos de inferência incluídos)
- Painel → Adicionar Provedor → NVIDIA NIM:
- Chave API:
nvapi-your-key
- Chave API:
Modelos: nvidia/llama-3.3-70b-instruct, nvidia/mistral-7b-instruct e mais de 50
Dica profissional: API compatível com OpenAI — funciona perfeitamente com a tradução de formato do OmniRoute!
- Inscreva-se: platform.deepseek.com
- Obtenha a chave API
- Painel → Adicionar provedor → DeepSeek
Modelos: deepseek/deepseek-chat, deepseek/deepseek-coder
- Inscreva-se: console.groq.com
- Obtenha a chave API (nível gratuito incluído)
- Painel → Adicionar Provedor → Groq
Modelos: groq/llama-3.3-70b, groq/mixtral-8x7b
Dica profissional: Inferência ultrarrápida — melhor para codificação em tempo real!
- Inscreva-se: openrouter.ai
- Obtenha a chave API
- Painel → Adicionar Provedor → OpenRouter
Modelos: acesse mais de 100 modelos de todos os principais fornecedores por meio de uma única chave de API.
💰 Provedores baratos (backup)
- Inscreva-se: Zhipu AI
- Obtenha a chave API do plano de codificação
- Painel → Adicionar chave API:
- Provedor:
glm - Chave API:
your-key
- Provedor:
Usar: glm/glm-4.7
Dica profissional: O plano de codificação oferece cota 3× com custo de 1/7! Redefinir diariamente às 10h.
- Inscreva-se: MiniMax
- Obtenha a chave API
- Painel → Adicionar chave API
Usar: minimax/MiniMax-M2.1
Dica profissional: Opção mais barata para contexto longo (1 milhão de tokens)!
- Inscreva-se: Moonshot AI
- Obtenha a chave API
- Painel → Adicionar chave API
Usar: kimi/kimi-latest
Dica profissional: $9 fixos/mês para 10 milhões de tokens = $0,90/custo efetivo de 1 milhão!
🆓 Provedores GRATUITOS (backup de emergência)
Dashboard → Connect iFlow
→ iFlow OAuth login
→ Unlimited usage
Models:
if/kimi-k2-thinking
if/qwen3-coder-plus
if/glm-4.7
if/minimax-m2
if/deepseek-r1Dashboard → Connect Qwen
→ Device code authorization
→ Unlimited usage
Models:
qw/qwen3-coder-plus
qw/qwen3-coder-flashDashboard → Connect Kiro
→ AWS Builder ID or Google/GitHub
→ Unlimited usage
Models:
kr/claude-sonnet-4.5
kr/claude-haiku-4.5🎨 Criar Combos
Dashboard → Combos → Create New
Name: premium-coding
Models:
1. cc/claude-opus-4-6 (Subscription primary)
2. glm/glm-4.7 (Cheap backup, $0.6/1M)
3. minimax/MiniMax-M2.1 (Cheapest fallback, $0.20/1M)
Use in CLI: premium-codingName: free-combo
Models:
1. gc/gemini-3-flash-preview (180K free/month)
2. if/kimi-k2-thinking (unlimited)
3. qw/qwen3-coder-plus (unlimited)
Cost: $0 forever!🔧 Integração CLI
Settings → Models → Advanced:
OpenAI API Base URL: http://localhost:20128/v1
OpenAI API Key: [from OmniRoute dashboard]
Model: cc/claude-opus-4-6Use a página Ferramentas CLI no painel para configuração com um clique ou edite ~/.claude/settings.json manualmente.
export OPENAI_BASE_URL="http://localhost:20128"
export OPENAI_API_KEY="your-omniroute-api-key"
codex "your prompt"###OpenClaw
Opção 1 — Painel (recomendado):
Dashboard → CLI Tools → OpenClaw → Select Model → ApplyOpção 2 — Manual: Editar ~/.openclaw/openclaw.json:
{
"models": {
"providers": {
"omniroute": {
"baseUrl": "http://127.0.0.1:20128/v1",
"apiKey": "sk_omniroute",
"api": "openai-completions"
}
}
}
}Observação: OpenClaw só funciona com OmniRoute local. Use
127.0.0.1em vez delocalhostpara evitar problemas de resolução de IPv6.
Settings → API Configuration:
Provider: OpenAI Compatible
Base URL: http://localhost:20128/v1
API Key: [from OmniRoute dashboard]
Model: if/kimi-k2-thinkingVer todos os modelos disponíveis
Código Claude (cc/) - Pro/Máx:
cc/claude-opus-4-6cc/claude-sonnet-4-5-20250929cc/claude-haiku-4-5-20251001
Códice (cx/) - Plus/Pro:
cx/gpt-5.2-codexcx/gpt-5.1-codex-max
Gemini CLI (gc/) - GRATUITO:
gc/gemini-3-flash-previewgc/gemini-2.5-pro
Copiloto do GitHub (gh/):
gh/gpt-5gh/claude-4.5-sonnet
NVIDIA NIM (nvidia/) - Créditos GRATUITOS:
nvidia/llama-3.3-70b-instructnvidia/mistral-7b-instruct- Mais de 50 modelos em build.nvidia.com
GLM (glm/) - US$ 0,6/1 milhão:
glm/glm-4.7
MiniMax (minimax/) - US$ 0,2/1 milhão:
minimax/MiniMax-M2.1
iFlow (if/) - GRATUITO:
if/kimi-k2-thinkingif/qwen3-coder-plusif/deepseek-r1if/glm-4.7if/minimax-m2
Qwen (qw/) - GRATUITO:
qw/qwen3-coder-plusqw/qwen3-coder-flash
Kiro (kr/) - GRATUITO:
kr/claude-sonnet-4.5kr/claude-haiku-4.5
OpenRouter (or/) - mais de 100 modelos:
or/anthropic/claude-4-sonnetor/google/gemini-2.5-pro- Qualquer modelo de openrouter.ai/models
OmniRoute inclui uma estrutura de avaliação integrada para testar a qualidade da resposta do LLM em relação a um conjunto dourado. Acesse-o em Analytics → Evals no painel.
O "OmniRoute Golden Set" pré-carregado contém 10 casos de teste cobrindo:
- Saudações, matemática, geografia, geração de código
- Conformidade com o formato JSON, tradução, remarcação
- Recusa de segurança (conteúdo prejudicial), contagem, lógica booleana
| Estratégia | Descrição | Exemplo |
|---|---|---|
exact |
A saída deve corresponder exatamente | "4" |
contains |
A saída deve conter substring (sem distinção entre maiúsculas e minúsculas) | "Paris" |
regex |
A saída deve corresponder ao padrão regex | "1.*2.*3" |
custom |
Função JS personalizada retorna verdadeiro/falso | (output) => output.length > 10 |
⚠️ IMPORTANTE para usuários com OmniRoute em VPS/Docker/servidor remoto
Os provedores Antigravity e Gemini CLI usam Google OAuth 2.0 para autenticação. O Google exige que um redirect_uri usado no fluxo OAuth seja exatamente uma das URIs pré-cadastradas no Google Cloud Console do aplicativo.
As credenciais OAuth incorporadas no OmniRoute estão cadastradas apenas para localhost. Quando você acessa o OmniRoute em um servidor remoto (ex: https://omniroute.meuservidor.com), o Google rejeita a autenticação com:
Error 400: redirect_uri_mismatchVocê precisa criar um OAuth 2.0 Client ID no Google Cloud Console com o URI do seu servidor.
####Passo a passo
1. Acesse o Console do Google Cloud
Abra: https://console.cloud.google.com/apis/credentials
2. Crie um novo ID de cliente OAuth 2.0
- Clique em "+ Criar credenciais" → "ID do cliente OAuth"
- Tipo de aplicativo: "Aplicativo Web"
- Nome: escolha qualquer nome (ex:
OmniRoute Remote)
3. Adicionar como URIs de redirecionamento autorizados
No campo "URIs de redirecionamento autorizados", adicionado:
https://seu-servidor.com/callbackSubstitua
seu-servidor.compelo domínio ou IP do seu servidor (inclua a porta se necessário, ex:http://45.33.32.156:20128/callback).
4. Salve e copie as credenciais
Após criar, o Google mostrará o Client ID e o Client Secret.
5. Configurar como variáveis de ambiente
No seu .env (ou nas variáveis de ambiente do Docker):
# Para Antigravity:
ANTIGRAVITY_OAUTH_CLIENT_ID=seu-client-id.apps.googleusercontent.com
ANTIGRAVITY_OAUTH_CLIENT_SECRET=GOCSPX-seu-secret
# Para Gemini CLI:
GEMINI_OAUTH_CLIENT_ID=seu-client-id.apps.googleusercontent.com
GEMINI_OAUTH_CLIENT_SECRET=GOCSPX-seu-secret
GEMINI_CLI_OAUTH_CLIENT_SECRET=GOCSPX-seu-secret6. Reinicie o OmniRoute
# Se usando npm:
npm run dev
# Se usando Docker:
docker restart omniroute7. Tente conectar novamente
Painel → Provedores → Antigravidade (ou Gemini CLI) → OAuth
Agora o Google redirecionará corretamente para https://seu-servidor.com/callback e a autenticação funcionará.
Se não quiser criar credenciais próprias agora, ainda é possível usar o fluxo manual de URL:
- O OmniRoute abrirá uma URL de autorização do Google
- Após você autorizar, o Google tentará redirecionar para
localhost(que falha no servidor remoto) - Copie a URL completa da barra de endereço do seu navegador (mesmo que a página não carregue)
- Cole essa URL no campo que aparece no modal de conexão do OmniRoute
- Clique em "Conectar"
Esta solução alternativa funciona porque o código de autorização na URL é válido, independentemente do redirecionamento ter sido carregado ou não.
Clique para expandir o guia de solução de problemas
"O modelo de linguagem não forneceu mensagens"
- Cota do provedor esgotada → Verifique o rastreador de cota do painel
- Solução: use o combo substituto ou mude para um nível mais barato
** Limitação de taxa **
- Cota de assinatura esgotada → Fallback para GLM/MiniMax
- Adicionar combinação:
cc/claude-opus-4-6 → glm/glm-4.7 → if/kimi-k2-thinking
O token OAuth expirou
- Atualizado automaticamente pelo OmniRoute
- Se os problemas persistirem: Painel → Provedor → Reconectar
Custos elevados
- Verifique as estatísticas de uso em Painel → Custos
- Mude o modelo primário para GLM/MiniMax
- Use o nível gratuito (Gemini CLI, iFlow) para tarefas não críticas
Painel abre na porta errada
- Definir
PORT=20128eNEXT_PUBLIC_BASE_URL=http://localhost:20128
Erros de sincronização na nuvem
- Verifique
BASE_URLaponta para sua instância em execução - Verifique os pontos
CLOUD_URLpara o endpoint de nuvem esperado - Mantenha os valores
NEXT_PUBLIC_*alinhados com os valores do lado do servidor
Primeiro login não funciona
- Verifique
INITIAL_PASSWORDem.env - Se não definida, a senha substituta é
123456
Sem registros de solicitação
- Definir
ENABLE_REQUEST_LOGS=trueem.env
O teste de conexão mostra "Inválido" para provedores compatíveis com OpenAI
- Muitos provedores não expõem um endpoint
/models - OmniRoute v1.0.6+ inclui validação de fallback por meio de conclusões de chat
- Certifique-se de que o URL base inclua o sufixo
/v1
- Tempo de execução: Node.js 18–22 LTS (
⚠️ Node.js 24+ não é compatível —better-sqlite3binários nativos são incompatíveis) - Idioma: TypeScript 5.9 — 100% TypeScript em
src/eopen-sse/(v1.0.6) - Estrutura: Next.js 16 + React 19 + Tailwind CSS 4
- Banco de dados: LowDB (JSON) + SQLite (estado do domínio + logs de proxy)
- Streaming: eventos enviados pelo servidor (SSE)
- Autenticação: OAuth 2.0 (PKCE) + JWT + chaves de API
- Testes: executor de testes Node.js (mais de 368 testes de unidade)
- CI/CD: GitHub Actions (publicação automática de npm + Docker Hub no lançamento)
- Site: omniroute.online
- Pacote: npmjs.com/package/omniroute
- Docker: hub.docker.com/r/diegosouzapw/omniroute
- Resiliência: Disjuntor, espera exponencial, rebanho anti-trovão, falsificação de TLS
| Documento | Descrição |
|---|---|
| User Guide | Provedores, combos, integração CLI, implantação |
| API Reference | Todos os endpoints com exemplos |
| Troubleshooting | Problemas e soluções comuns |
| Architecture | Arquitetura do sistema e componentes internos |
| Contributing | Configuração e diretrizes de desenvolvimento |
| OpenAPI Spec | Especificação OpenAPI 3.0 |
| Security Policy | Relatórios de vulnerabilidades e práticas de segurança |
| VM Deployment | Guia completo: configuração de VM + nginx + Cloudflare |
| Features Gallery | Tour visual do painel com capturas de tela |
Clique para ver as capturas de tela do painel
| Página | Captura de tela |
|---|---|
| Fornecedores | ![]() |
| Combos | ![]() |
| Análise | ![]() |
| Saúde | ![]() |
| Tradutor | ![]() |
| Configurações | ![]() |
| Ferramentas CLI | ![]() |
| Registros de uso | ![]() |
| Ponto final | ![]() |
OmniRoute tem 210+ recursos planejados em diversas fases de desenvolvimento. Aqui estão as principais áreas:
| Categoria | Recursos planejados | Destaques |
|---|---|---|
| 🧠 Roteamento e Inteligência | 25+ | Roteamento de menor latência, roteamento baseado em tags, simulação de cota, seleção de conta P2C |
| 🔒 Segurança e Conformidade | 20+ | Proteção SSRF, camuflagem de credenciais, limite de taxa por endpoint, escopo de chave de gerenciamento |
| 📊 Observabilidade | 15+ | Integração OpenTelemetry, monitoramento de cotas em tempo real, rastreamento de custos por modelo |
| 🔄 Integrações com Provedores | 20+ | Registro de modelo dinâmico, resfriamento de provedor, Codex multicontas, análise de cotas do Copilot |
| ⚡ Desempenho | 15+ | Camada de cache dupla, cache de prompt, cache de resposta, manutenção de atividade de streaming, API em lote |
| 🌐 Ecossistema | 10+ | API WebSocket, configuração hot-reload, armazenamento de configuração distribuído, modo comercial |
- 🔗 Integração OpenCode — Suporte de provedor nativo para o IDE de codificação OpenCode AI
- 🔗 Integração TRAE — Suporte total para a estrutura de desenvolvimento TRAE AI
- 📦 API Batch — Processamento assíncrono em lote para solicitações em massa
- 🎯 Roteamento baseado em tags — Roteie solicitações com base em tags personalizadas e metadados
- 💰 Estratégia de custo mais baixo — Selecione automaticamente o provedor mais barato disponível
📝 Especificações completas de recursos disponíveis em OMNI_TOKEN_147 (217 especificações detalhadas)
💬 Junte-se à nossa comunidade! WhatsApp Group — Obtenha ajuda, compartilhe dicas e fique atualizado.
- Site: omniroute.online
- GitHub: github.com/diegosouzapw/OmniRoute
- Problemas: github.com/diegosouzapw/OmniRoute/issues
- WhatsApp: Community Group
- Projeto Original: 9router by decolua
- Bifurque o repositório
- Crie sua ramificação de recursos (
git checkout -b feature/amazing-feature) - Confirme suas alterações (
git commit -m 'Add amazing feature') - Envie para a ramificação (
git push origin feature/amazing-feature) - Abra uma solicitação pull
Consulte CONTRIBUTING.md para obter diretrizes detalhadas.
# Create a release — npm publish happens automatically
gh release create v1.0.6 --title "v1.0.6" --generate-notesAgradecimentos especiais a 9router de decolua — o projeto original que inspirou este fork. OmniRoute se baseia nessa base incrível com recursos adicionais, APIs multimodais e uma reescrita completa do TypeScript.
Agradecimentos especiais a CLIProxyAPI — a implementação Go original que inspirou esta versão JavaScript.
Licença MIT - consulte LICENSE para obter detalhes.
Nunca pare de codificar. Roteamento inteligente para modelos de IA GRATUITOS e de baixo custo com fallback automático.
Seu proxy universal de API — um endpoint, mais de 36 provedores, tempo de inatividade zero.
O painel do OmniRoute suporta múltiplos idiomas. Atualmente disponível em:
| Idioma | Código | Estado |
|---|---|---|
| 🇺🇸 Inglês | en |
✅ Completo |
| 🇧🇷 Português (Brasil) | pt-BR |
✅ Completo |
Para alterar o idioma: Clique no seletor de idioma (🇺🇸 PT) no cabeçalho do painel → selecione o idioma desejado.
Para adicionar um novo idioma:
- Crie
src/i18n/messages/{codigo}.jsonbaseado emen.json - Adicione o código em
src/i18n/config.ts→LOCALESeLANGUAGES - Reinicie o servidor
# Instalar via npm
npx omniroute@latest
# Ou rodar do código-fonte
cp .env.example .env
npm install
PORT=20128 NEXT_PUBLIC_BASE_URL=http://localhost:20128 npm run devdocker run -d --name omniroute -p 20128:20128 diegosouzapw/omniroute:latest- 36+ provedores de IA — Claude, GPT, Gemini, Llama, Qwen, DeepSeek, e mais
- Roteamento inteligente — Fallback automático entre provedores
- Tradução de formato — OpenAI ↔ Claude ↔ Gemini automaticamente
- Multi-conta — Múltiplas contas por provedor com seleção inteligente
- Cache semântico — Reduz custos e latência
- OAuth automático — Tokens renovam automaticamente
- Combos personalizados — 6 estratégias de roteamento
- Dashboard completo — Monitoramento, logs, análises, configurações
- Ferramentas CLI — Configure Claude Code, Codex, Cursor, Cline com um clique
- 100% TypeScript — Código limpo e digitado
| Documento | Descrição |
|---|---|
| Guia do Usuário | Provedores, combos, CLI, implantar |
| Referência da API | Todos os endpoints com exemplos |
| Solução de Problemas | Problemas comuns e soluções |
| Arquitetura | Arquitetura e portas do sistema |
| Contribuição | Configuração de desenvolvimento e diretrizes |
| Deploy em VM | Guia completo: VM + nginx + Cloudflare |
💬 Entre para a comunidade! Grupo WhatsApp — Tire dúvidas, compartilhe dicas e fique atualizado.
- Site: omniroute.online
- GitHub: github.com/diegosouzapw/OmniRoute
- Problemas: github.com/diegosouzapw/OmniRoute/issues
omniroute.online








