🚀 OmniRoute — O gateway de IA gratuito

Nunca pare de codificar. Roteamento inteligente para modelos de IA GRATUITOS e de baixo custo com fallback automático.

Seu proxy de API universal — um endpoint, mais de 36 provedores, tempo de inatividade zero.

Conclusões de bate-papo • Incorporações • Geração de imagem • Áudio • Reclassificação • 100% TypeScript

🤖 Provedor de IA gratuito para seus agentes de codificação favoritos

Conecte qualquer ferramenta IDE ou CLI com tecnologia de IA por meio do OmniRoute - gateway de API gratuito para codificação ilimitada.

OpenClaw _{⭐ 205K}	NanoBot _{⭐ 20.9K}	PicoClaw _{⭐ 14.6K}	ZeroClaw _{⭐ 9.9K}	IronClaw _{⭐ 2.1K}
OpenCode _{⭐ 106K}	Codex CLI _{⭐ 60.8K}	Claude Code _{⭐ 67.3K}	Gemini CLI _{⭐ 94.7K}	Kilo Code _{⭐ 15.5K}

_{📡 Todos os agentes se conectam via http://localhost:20128/v1 ou http://cloud.omniroute.online/v1 — uma configuração, modelos ilimitados e cota}

🌐 Website • 🚀 Quick Start • 💡 Features • 📖 Docs • 💰 Pricing • 💬 WhatsApp

🤔 Por que OmniRoute?

Pare de desperdiçar dinheiro e atingir limites:

A cota de assinatura expira sem ser utilizada todos os meses
Os limites de taxa impedem você no meio da codificação
APIs caras (US$ 20-50/mês por provedor)
Troca manual entre provedores

OmniRoute resolve isso:

✅ Maximize as assinaturas - Rastreie a cota, use cada bit antes de redefinir
✅ Fullback automático - Assinatura → Chave de API → Barato → Gratuito, tempo de inatividade zero
✅ Múltiplas contas - Round-robin entre contas por provedor
✅ Universal - Funciona com Claude Code, Codex, Gemini CLI, Cursor, Cline, OpenClaw, qualquer ferramenta CLI

🔄 Como funciona

┌─────────────┐
│  Your CLI   │  (Claude Code, Codex, Gemini CLI, OpenClaw, Cursor, Cline...)
│   Tool      │
└──────┬──────┘
       │ http://localhost:20128/v1
       ↓
┌─────────────────────────────────────────┐
│           OmniRoute (Smart Router)        │
│  • Format translation (OpenAI ↔ Claude) │
│  • Quota tracking + Embeddings + Images │
│  • Auto token refresh                   │
└──────┬──────────────────────────────────┘
       │
       ├─→ [Tier 1: SUBSCRIPTION] Claude Code, Codex, Gemini CLI
       │   ↓ quota exhausted
       ├─→ [Tier 2: API KEY] DeepSeek, Groq, xAI, Mistral, NVIDIA NIM, etc.
       │   ↓ budget limit
       ├─→ [Tier 3: CHEAP] GLM ($0.6/1M), MiniMax ($0.2/1M)
       │   ↓ budget limit
       └─→ [Tier 4: FREE] iFlow, Qwen, Kiro (unlimited)

Result: Never stop coding, minimal cost

⚡ Início rápido

1. Instale globalmente:

npm install -g omniroute
omniroute

🎉 O painel abre às http://localhost:20128

Comando	Descrição
`omniroute`	Iniciar servidor (porta padrão 20128)
`omniroute --port 3000`	Usar porta personalizada
`omniroute --no-open`	Não abra o navegador automaticamente
`omniroute --help`	Mostrar ajuda

2. Conecte um provedor GRATUITO:

Painel → Provedores → Conectar Claude Code ou Antigravidade → Login OAuth → Concluído!

3. Use em sua ferramenta CLI:

Claude Code/Codex/Gemini CLI/OpenClaw/Cursor/Cline Settings:
  Endpoint: http://localhost:20128/v1
  API Key: [copy from dashboard]
  Model: if/kimi-k2-thinking

É isso aí! Comece a codificar com modelos de IA GRATUITOS.

Alternativa – execute a partir da fonte:

cp .env.example .env
npm install
PORT=20128 NEXT_PUBLIC_BASE_URL=http://localhost:20128 npm run dev

🐳 Docker

OmniRoute está disponível como uma imagem pública do Docker em Docker Hub.

Execução rápida:

docker run -d \
  --name omniroute \
  --restart unless-stopped \
  -p 20128:20128 \
  -v omniroute-data:/app/data \
  diegosouzapw/omniroute:latest

Com arquivo de ambiente:

# Copy and edit .env first
cp .env.example .env

docker run -d \
  --name omniroute \
  --restart unless-stopped \
  --env-file .env \
  -p 20128:20128 \
  -v omniroute-data:/app/data \
  diegosouzapw/omniroute:latest

Usando Docker Compose:

# Base profile (no CLI tools)
docker compose --profile base up -d

# CLI profile (Claude Code, Codex, OpenClaw built-in)
docker compose --profile cli up -d

Imagem	Etiqueta	Tamanho	Descrição
`diegosouzapw/omniroute`	`latest`	~250 MB	Última versão estável
`diegosouzapw/omniroute`	`1.0.3`	~250 MB	Versão atual

💰 Visão geral dos preços

Nível	Provedor	Custo	Redefinição de cota	Melhor para
💳 ASSINATURA	Código Claude (Pro)	$ 20/mês	5h + semanalmente	Já inscrito
	Códice (Plus/Pro)	US$ 20-200/mês	5h + semanalmente	Usuários OpenAI
	Gêmeos CLI	GRÁTIS	180 mil/mês + 1 mil/dia	Todos!
	Copiloto GitHub	US$ 10-19/mês	Mensalmente	Usuários do GitHub
🔑 CHAVE DE API	NVIDIA NIM	GRÁTIS (1000 créditos)	Único	Teste de nível gratuito
	DeepSeek	Pagamento conforme uso	Nenhum	Melhor preço/qualidade
	Groq	Nível gratuito + pago	Taxa limitada	Inferência ultrarrápida
	xAI (Groque)	Pagamento conforme uso	Nenhum	Modelos Grok
	Mistral	Nível gratuito + pago	Taxa limitada	IA Europeia
	OpenRouter	Pagamento conforme uso	Nenhum	Mais de 100 modelos
💰 BARATO	GLM-4.7	US$ 0,6/1 milhão	Diariamente 10h	Backup de orçamento
	MiniMax M2.1	US$ 0,2/1 milhão	Rolamento de 5 horas	Opção mais barata
	Kimi K2	$ 9 / mês fixo	10 milhões de tokens/mês	Custo previsível
🆓 GRÁTIS	iFlow	$0	Ilimitado	8 modelos grátis
	Qwen	$0	Ilimitado	3 modelos grátis
	Kiro	$0	Ilimitado	Cláudio grátis

💡 Dica profissional: Comece com Gemini CLI (180 mil grátis/mês) + combo iFlow (gratuito ilimitado) = custo de $ 0!

🎯 Casos de uso

Caso 1: "Tenho assinatura do Claude Pro"

Problema: A cota expira sem ser utilizada, limites de taxa durante codificação pesada

Combo: "maximize-claude"
  1. cc/claude-opus-4-6        (use subscription fully)
  2. glm/glm-4.7               (cheap backup when quota out)
  3. if/kimi-k2-thinking       (free emergency fallback)

Monthly cost: $20 (subscription) + ~$5 (backup) = $25 total
vs. $20 + hitting limits = frustration

Caso 2: "Quero custo zero"

Problema: Não posso pagar assinaturas, preciso de codificação de IA confiável

Combo: "free-forever"
  1. gc/gemini-3-flash         (180K free/month)
  2. if/kimi-k2-thinking       (unlimited free)
  3. qw/qwen3-coder-plus       (unlimited free)

Monthly cost: $0
Quality: Production-ready models

Caso 3: "Preciso de codificação 24 horas por dia, 7 dias por semana, sem interrupções"

Problema: Prazos, não podemos arcar com o tempo de inatividade

Combo: "always-on"
  1. cc/claude-opus-4-6        (best quality)
  2. cx/gpt-5.2-codex          (second subscription)
  3. glm/glm-4.7               (cheap, resets daily)
  4. minimax/MiniMax-M2.1      (cheapest, 5h reset)
  5. if/kimi-k2-thinking       (free unlimited)

Result: 5 layers of fallback = zero downtime

Caso 4: "Quero IA GRATUITA no OpenClaw"

Problema: Precisa de assistente de IA em aplicativos de mensagens, totalmente gratuito

Combo: "openclaw-free"
  1. if/glm-4.7                (unlimited free)
  2. if/minimax-m2.1           (unlimited free)
  3. if/kimi-k2-thinking       (unlimited free)

Monthly cost: $0
Access via: WhatsApp, Telegram, Slack, Discord, iMessage, Signal...

💡 Principais recursos

🧠 Roteamento e inteligência central

Recurso	O que faz
🎯 Fullback inteligente de 4 camadas	Roteamento automático: Assinatura → Chave de API → Barato → Grátis
📊 Acompanhamento de cotas em tempo real	Contagem de tokens ativos + contagem regressiva redefinida por provedor
🔄 Tradução de formato	OpenAI ↔ Claude ↔ Gemini ↔ Cursor ↔ Kiro sem costura + higienização de resposta
👥 Suporte para múltiplas contas	Múltiplas contas por provedor com seleção inteligente
🔄 Atualização automática de token	Os tokens OAuth são atualizados automaticamente com nova tentativa
🎨 Combos Personalizados	6 estratégias: preencher primeiro, round-robin, p2c, aleatório, menos usado, otimizado para custos
🧩 Modelos Personalizados	Adicione qualquer ID de modelo a qualquer provedor
🌐 Roteador curinga	Rotear padrões `provider/*` para qualquer provedor dinamicamente
🧠 Pensando no Orçamento	Modos de passagem, automático, personalizado e adaptativo para modelos de raciocínio
💬 Injeção imediata do sistema	Prompt de sistema global aplicado em todas as solicitações
📄 API de respostas	Suporte completo à API de respostas OpenAI (`/v1/responses`) para Codex

🎵 APIs multimodais

Recurso	O que faz
🖼️ Geração de imagens	`/v1/images/generations` — 4 provedores, mais de 9 modelos
📐 Incorporações	`/v1/embeddings` — 6 provedores, mais de 9 modelos
🎤 Transcrição de áudio	`/v1/audio/transcriptions` — Compatível com sussurro
🔊 Conversão de texto em fala	`/v1/audio/speech` — Síntese de áudio multiprovedor
🛡️ Moderações	`/v1/moderations` — Verificações de segurança de conteúdo
🔀 Reclassificação	`/v1/rerank` — Reclassificação da relevância dos documentos

🛡️ Resiliência e segurança

Recurso	O que faz
🔌 Disjuntor	Abertura/fechamento automático por provedor com limites configuráveis
🛡️ Rebanho Anti-Trovão	Mutex + limite de taxa de semáforo para provedores de chaves de API
🧠 Cache Semântico	Cache de duas camadas (assinatura + semântica) reduz custo e latência
⚡ Solicitar Idempotência	Janela de desduplicação 5s para solicitações duplicadas
🔒 Falsificação de impressão digital TLS	Ignore a detecção de bot baseada em TLS via wreq-js
🌐 Filtragem de IP	Lista de permissões/lista de bloqueio para controle de acesso à API
📊 Limites de taxas editáveis	RPM configurável, intervalo mínimo e simultâneo máximo no nível do sistema
🛡 Proteção de endpoint de API	Autenticação + bloqueio de provedor para o endpoint `/models`
🔒 Visibilidade do proxy	Crachás codificados por cores: 🟢 global, 🟡 provedor, 🔵 por conexão com display IP
🌐 Configuração de proxy de 3 níveis	Configurar proxies em nível global, por provedor ou por conexão

📊 Observabilidade e análise

Recurso	O que faz
📝 Solicitar registro	Modo de depuração com logs completos de solicitação/resposta
💾 Logs de proxy SQLite	Logs de proxy persistentes sobrevivem às reinicializações do servidor
📊 Painel de análise	Alimentado por recargas: cartões de estatísticas, gráfico de uso de modelo, tabela de provedores
📈 Acompanhamento do progresso	Eventos de progresso SSE opcionais para streaming
🧪 Avaliações LLM	Teste de Golden Set com 4 estratégias de jogo
🔍 Solicitar Telemetria	Agregação de latência p50/p95/p99 + rastreamento X-Request-Id
📋 Painel de registros	Página unificada de 4 guias: Logs de solicitação, Logs de proxy, Logs de auditoria, Console
🖥️ Visualizador de registros do console	Visualizador em estilo terminal em tempo real com filtro de nível, pesquisa, rolagem automática
📑 Registro baseado em arquivo	O interceptor do console captura toda a saída para o arquivo de log JSON com rotação
🏥 Painel de saúde	Tempo de atividade do sistema, estados de disjuntores, bloqueios, estatísticas de cache
💰 Acompanhamento de custos	Gestão orçamentária + configuração de preços por modelo

☁️ Implantação e sincronização

Recurso	O que faz
💾 Sincronização na nuvem	Sincronize a configuração entre dispositivos por meio do Cloudflare Workers
🌐 Implante em qualquer lugar	Localhost, VPS, Docker, Cloudflare Workers
🔑 Gerenciamento de chaves de API	Gerar, alternar e definir o escopo de chaves de API por provedor
🧙 Assistente de integração	Configuração guiada em 4 etapas para usuários iniciantes
🔧 Painel de Ferramentas CLI	Configurar com um clique Claude, Codex, Cline, OpenClaw, Kilo, Antigravity
🔄 Backups de banco de dados	Backup, restauração, exportação e importação automáticos para todas as configurações
🌐 Internacionalização	i18n completo com next-intl — Suporte Inglês + Português (Brasil)
🌍 Seletor de idioma	Ícone de globo no cabeçalho para troca de idioma em tempo real (🇺🇸/🇧🇷)
📂 Diretório de dados personalizado	`DATA_DIR` env var para substituir o caminho de armazenamento padrão `~/.omniroute`

📖 Detalhes do recurso

🎯 Fallback inteligente de 4 camadas

Crie combos com fallback automático:

Combo: "my-coding-stack"
  1. cc/claude-opus-4-6        (your subscription)
  2. nvidia/llama-3.3-70b      (free NVIDIA API)
  3. glm/glm-4.7               (cheap backup, $0.6/1M)
  4. if/kimi-k2-thinking       (free fallback)

→ Auto switches when quota runs out or errors occur

📊 Rastreamento de cotas em tempo real

Consumo de token por provedor
Redefinir contagem regressiva (5 horas, diariamente, semanalmente)
Estimativa de custos para níveis pagos
Relatórios mensais de gastos

🔄 Tradução de formato

Tradução perfeita entre formatos:

OpenAI ↔ Claude ↔ Gêmeos ↔ Respostas OpenAI
Sua ferramenta CLI envia o formato OpenAI → OmniRoute traduz → O provedor recebe o formato nativo
Funciona com qualquer ferramenta que suporte endpoints OpenAI personalizados
Higienização de resposta — Remove campos não padrão para compatibilidade estrita com o OpenAI SDK
Normalização de funções — developer → system para não-OpenAI; system → user para modelos GLM/ERNIE
** Extração de tags Think ** — <think> blocos → reasoning_content para modelos de pensamento
Saída estruturada — json_schema → responseMimeType/responseSchema de Gêmeos

👥 Suporte para múltiplas contas

Adicione várias contas por provedor
Round-robin automático ou roteamento baseado em prioridade
Fallback para a próxima conta quando alguém atingir a cota

🔄 Atualização automática de token

Os tokens OAuth são atualizados automaticamente antes da expiração
Não é necessária reautenticação manual
Experiência perfeita em todos os provedores

🎨 Combos Personalizados

Crie combinações ilimitadas de modelos
6 estratégias: preencher primeiro, round-robin, poder de duas escolhas, aleatório, menos usado, otimizado para custos
Compartilhe combos entre dispositivos com Cloud Sync

🏥 Painel de saúde

Status do sistema (tempo de atividade, versão, uso de memória)
Estados do disjuntor por provedor (Fechado/Aberto/Meio-Aberto)
Status do limite de taxa e bloqueios ativos
Estatísticas de cache de assinatura
Telemetria de latência (p50/p95/p99) + cache de prompt
Redefinir o status de saúde com um clique

🔧 Parque do Tradutor

OmniRoute inclui um poderoso Translator Playground integrado com 4 modos para depuração, teste e monitoramento de traduções de API:

Modo	Descrição
💻 Parque Infantil	Tradução direta de formato — cole qualquer corpo de solicitação de API e veja instantaneamente como o OmniRoute o traduz entre formatos de provedor (OpenAI ↔ Claude ↔ Gemini ↔ API de respostas). Inclui modelos de exemplo e detecção automática de formato.
💬 Testador de bate-papo	Envie solicitações de chat reais por meio do OmniRoute e veja o percurso completo: sua entrada, a solicitação traduzida, a resposta do provedor e a resposta traduzida de volta. Inestimável para validar o roteamento combinado.
🧪 Bancada de testes	Modo de teste em lote — defina vários casos de teste com diferentes entradas e resultados esperados, execute-os todos de uma vez e compare os resultados entre provedores e modelos.
📱Monitoramento ao vivo	Monitoramento de solicitações em tempo real: observe as solicitações recebidas conforme elas fluem pelo OmniRoute, veja as traduções de formato acontecendo ao vivo e identifique problemas instantaneamente.

Acesso: Painel → Tradutor (barra lateral)

💾 Sincronização na nuvem

Sincronize provedores, combos e configurações entre dispositivos
Sincronização automática em segundo plano
Armazenamento criptografado seguro

📖 Guia de configuração

💳 Provedores de assinatura

Código Claude (Pro/Max)

Dashboard → Providers → Connect Claude Code
→ OAuth login → Auto token refresh
→ 5-hour + weekly quota tracking

Models:
  cc/claude-opus-4-6
  cc/claude-sonnet-4-5-20250929
  cc/claude-haiku-4-5-20251001

Dica profissional: Use o Opus para tarefas complexas e o Sonnet para velocidade. OmniRoute rastreia cota por modelo!

Codex OpenAI (Plus/Pro)

Dashboard → Providers → Connect Codex
→ OAuth login (port 1455)
→ 5-hour + weekly reset

Models:
  cx/gpt-5.2-codex
  cx/gpt-5.1-codex-max

Gemini CLI (GRÁTIS 180K/mês!)

Dashboard → Providers → Connect Gemini CLI
→ Google OAuth
→ 180K completions/month + 1K/day

Models:
  gc/gemini-3-flash-preview
  gc/gemini-2.5-pro

Melhor valor: Grande nível gratuito! Use isso antes dos níveis pagos.

GitHub Copiloto

Dashboard → Providers → Connect GitHub
→ OAuth via GitHub
→ Monthly reset (1st of month)

Models:
  gh/gpt-5
  gh/claude-4.5-sonnet
  gh/gemini-3-pro

🔑 Provedores de chave de API

NVIDIA NIM (1000 créditos GRÁTIS!)

Inscreva-se: build.nvidia.com
Obtenha uma chave de API gratuita (1.000 créditos de inferência incluídos)
Painel → Adicionar Provedor → NVIDIA NIM:
- Chave API: nvapi-your-key

Modelos: nvidia/llama-3.3-70b-instruct, nvidia/mistral-7b-instruct e mais de 50

Dica profissional: API compatível com OpenAI — funciona perfeitamente com a tradução de formato do OmniRoute!

DeepSeek

Inscreva-se: platform.deepseek.com
Obtenha a chave API
Painel → Adicionar provedor → DeepSeek

Modelos: deepseek/deepseek-chat, deepseek/deepseek-coder

Groq (nível gratuito disponível!)

Inscreva-se: console.groq.com
Obtenha a chave API (nível gratuito incluído)
Painel → Adicionar Provedor → Groq

Modelos: groq/llama-3.3-70b, groq/mixtral-8x7b

Dica profissional: Inferência ultrarrápida — melhor para codificação em tempo real!

OpenRouter (mais de 100 modelos)

Inscreva-se: openrouter.ai
Obtenha a chave API
Painel → Adicionar Provedor → OpenRouter

Modelos: acesse mais de 100 modelos de todos os principais fornecedores por meio de uma única chave de API.

💰 Provedores baratos (backup)

GLM-4.7 (redefinição diária, US$ 0,6/1 milhão)

Inscreva-se: Zhipu AI
Obtenha a chave API do plano de codificação
Painel → Adicionar chave API:
- Provedor: glm
- Chave API: your-key

Usar: glm/glm-4.7

Dica profissional: O plano de codificação oferece cota 3× com custo de 1/7! Redefinir diariamente às 10h.

MiniMax M2.1 (redefinição de 5h, US$ 0,20/1 milhão)

Inscreva-se: MiniMax
Obtenha a chave API
Painel → Adicionar chave API

Usar: minimax/MiniMax-M2.1

Dica profissional: Opção mais barata para contexto longo (1 milhão de tokens)!

Kimi K2 (US$ 9/mês fixo)

Inscreva-se: Moonshot AI
Obtenha a chave API
Painel → Adicionar chave API

Usar: kimi/kimi-latest

Dica profissional: $9 fixos/mês para 10 milhões de tokens = $0,90/custo efetivo de 1 milhão!

🆓 Provedores GRATUITOS (backup de emergência)

iFlow (8 modelos GRATUITOS)

Dashboard → Connect iFlow
→ iFlow OAuth login
→ Unlimited usage

Models:
  if/kimi-k2-thinking
  if/qwen3-coder-plus
  if/glm-4.7
  if/minimax-m2
  if/deepseek-r1

Qwen (3 modelos GRATUITOS)

Dashboard → Connect Qwen
→ Device code authorization
→ Unlimited usage

Models:
  qw/qwen3-coder-plus
  qw/qwen3-coder-flash

Kiro (Claude GRÁTIS)

Dashboard → Connect Kiro
→ AWS Builder ID or Google/GitHub
→ Unlimited usage

Models:
  kr/claude-sonnet-4.5
  kr/claude-haiku-4.5

🎨 Criar Combos

Exemplo 1: Maximize a assinatura → Backup barato

Dashboard → Combos → Create New

Name: premium-coding
Models:
  1. cc/claude-opus-4-6 (Subscription primary)
  2. glm/glm-4.7 (Cheap backup, $0.6/1M)
  3. minimax/MiniMax-M2.1 (Cheapest fallback, $0.20/1M)

Use in CLI: premium-coding

Exemplo 2: somente gratuito (custo zero)

Name: free-combo
Models:
  1. gc/gemini-3-flash-preview (180K free/month)
  2. if/kimi-k2-thinking (unlimited)
  3. qw/qwen3-coder-plus (unlimited)

Cost: $0 forever!

🔧 Integração CLI

Cursor IDE

Settings → Models → Advanced:
  OpenAI API Base URL: http://localhost:20128/v1
  OpenAI API Key: [from OmniRoute dashboard]
  Model: cc/claude-opus-4-6

Código Cláudio

Use a página Ferramentas CLI no painel para configuração com um clique ou edite ~/.claude/settings.json manualmente.

CLI do Codex

export OPENAI_BASE_URL="http://localhost:20128"
export OPENAI_API_KEY="your-omniroute-api-key"

codex "your prompt"

###OpenClaw

Opção 1 — Painel (recomendado):

Dashboard → CLI Tools → OpenClaw → Select Model → Apply

Opção 2 — Manual: Editar ~/.openclaw/openclaw.json:

{
  "models": {
    "providers": {
      "omniroute": {
        "baseUrl": "http://127.0.0.1:20128/v1",
        "apiKey": "sk_omniroute",
        "api": "openai-completions"
      }
    }
  }
}

Observação: OpenClaw só funciona com OmniRoute local. Use 127.0.0.1 em vez de localhost para evitar problemas de resolução de IPv6.

Cline / Continuar / RooCode

Settings → API Configuration:
  Provider: OpenAI Compatible
  Base URL: http://localhost:20128/v1
  API Key: [from OmniRoute dashboard]
  Model: if/kimi-k2-thinking

📊 Modelos Disponíveis

Ver todos os modelos disponíveis

Código Claude (cc/) - Pro/Máx:

cc/claude-opus-4-6
cc/claude-sonnet-4-5-20250929
cc/claude-haiku-4-5-20251001

Códice (cx/) - Plus/Pro:

cx/gpt-5.2-codex
cx/gpt-5.1-codex-max

Gemini CLI (gc/) - GRATUITO:

gc/gemini-3-flash-preview
gc/gemini-2.5-pro

Copiloto do GitHub (gh/):

gh/gpt-5
gh/claude-4.5-sonnet

NVIDIA NIM (nvidia/) - Créditos GRATUITOS:

nvidia/llama-3.3-70b-instruct
nvidia/mistral-7b-instruct
Mais de 50 modelos em build.nvidia.com

GLM (glm/) - US$ 0,6/1 milhão:

glm/glm-4.7

MiniMax (minimax/) - US$ 0,2/1 milhão:

minimax/MiniMax-M2.1

iFlow (if/) - GRATUITO:

if/kimi-k2-thinking
if/qwen3-coder-plus
if/deepseek-r1
if/glm-4.7
if/minimax-m2

Qwen (qw/) - GRATUITO:

qw/qwen3-coder-plus
qw/qwen3-coder-flash

Kiro (kr/) - GRATUITO:

kr/claude-sonnet-4.5
kr/claude-haiku-4.5

OpenRouter (or/) - mais de 100 modelos:

or/anthropic/claude-4-sonnet
or/google/gemini-2.5-pro
Qualquer modelo de openrouter.ai/models

🧪 Avaliações (Evals)

OmniRoute inclui uma estrutura de avaliação integrada para testar a qualidade da resposta do LLM em relação a um conjunto dourado. Acesse-o em Analytics → Evals no painel.

Conjunto Dourado Integrado

O "OmniRoute Golden Set" pré-carregado contém 10 casos de teste cobrindo:

Saudações, matemática, geografia, geração de código
Conformidade com o formato JSON, tradução, remarcação
Recusa de segurança (conteúdo prejudicial), contagem, lógica booleana

Estratégias de Avaliação

Estratégia	Descrição	Exemplo
`exact`	A saída deve corresponder exatamente	`"4"`
`contains`	A saída deve conter substring (sem distinção entre maiúsculas e minúsculas)	`"Paris"`
`regex`	A saída deve corresponder ao padrão regex	`"1.2.3"`
`custom`	Função JS personalizada retorna verdadeiro/falso	`(output) => output.length > 10`

🔐 OAuth em Servidor Remoto (Remote OAuth Setup)

⚠️ IMPORTANTE para usuários com OmniRoute em VPS/Docker/servidor remoto

Por que o OAuth do Antigravity / Gemini CLI falha em servidores remotos?

Os provedores Antigravity e Gemini CLI usam Google OAuth 2.0 para autenticação. O Google exige que um redirect_uri usado no fluxo OAuth seja exatamente uma das URIs pré-cadastradas no Google Cloud Console do aplicativo.

As credenciais OAuth incorporadas no OmniRoute estão cadastradas apenas para localhost. Quando você acessa o OmniRoute em um servidor remoto (ex: https://omniroute.meuservidor.com), o Google rejeita a autenticação com:

Error 400: redirect_uri_mismatch

Solução: Configure suas próprias credenciais OAuth

Você precisa criar um OAuth 2.0 Client ID no Google Cloud Console com o URI do seu servidor.

####Passo a passo

1. Acesse o Console do Google Cloud

Abra: https://console.cloud.google.com/apis/credentials

2. Crie um novo ID de cliente OAuth 2.0

Clique em "+ Criar credenciais" → "ID do cliente OAuth"
Tipo de aplicativo: "Aplicativo Web"
Nome: escolha qualquer nome (ex: OmniRoute Remote)

3. Adicionar como URIs de redirecionamento autorizados

No campo "URIs de redirecionamento autorizados", adicionado:

https://seu-servidor.com/callback

Substitua seu-servidor.com pelo domínio ou IP do seu servidor (inclua a porta se necessário, ex: http://45.33.32.156:20128/callback).

4. Salve e copie as credenciais

Após criar, o Google mostrará o Client ID e o Client Secret.

5. Configurar como variáveis de ambiente

No seu .env (ou nas variáveis de ambiente do Docker):

# Para Antigravity:
ANTIGRAVITY_OAUTH_CLIENT_ID=seu-client-id.apps.googleusercontent.com
ANTIGRAVITY_OAUTH_CLIENT_SECRET=GOCSPX-seu-secret

# Para Gemini CLI:
GEMINI_OAUTH_CLIENT_ID=seu-client-id.apps.googleusercontent.com
GEMINI_OAUTH_CLIENT_SECRET=GOCSPX-seu-secret
GEMINI_CLI_OAUTH_CLIENT_SECRET=GOCSPX-seu-secret

6. Reinicie o OmniRoute

# Se usando npm:
npm run dev

# Se usando Docker:
docker restart omniroute

7. Tente conectar novamente

Painel → Provedores → Antigravidade (ou Gemini CLI) → OAuth

Agora o Google redirecionará corretamente para https://seu-servidor.com/callback e a autenticação funcionará.

Solução alternativa temporária (sem configurar credenciais próprias)

Se não quiser criar credenciais próprias agora, ainda é possível usar o fluxo manual de URL:

O OmniRoute abrirá uma URL de autorização do Google
Após você autorizar, o Google tentará redirecionar para localhost (que falha no servidor remoto)
Copie a URL completa da barra de endereço do seu navegador (mesmo que a página não carregue)
Cole essa URL no campo que aparece no modal de conexão do OmniRoute
Clique em "Conectar"

Esta solução alternativa funciona porque o código de autorização na URL é válido, independentemente do redirecionamento ter sido carregado ou não.

🐛 Solução de problemas

Clique para expandir o guia de solução de problemas

"O modelo de linguagem não forneceu mensagens"

Cota do provedor esgotada → Verifique o rastreador de cota do painel
Solução: use o combo substituto ou mude para um nível mais barato

** Limitação de taxa **

Cota de assinatura esgotada → Fallback para GLM/MiniMax
Adicionar combinação: cc/claude-opus-4-6 → glm/glm-4.7 → if/kimi-k2-thinking

O token OAuth expirou

Atualizado automaticamente pelo OmniRoute
Se os problemas persistirem: Painel → Provedor → Reconectar

Custos elevados

Verifique as estatísticas de uso em Painel → Custos
Mude o modelo primário para GLM/MiniMax
Use o nível gratuito (Gemini CLI, iFlow) para tarefas não críticas

Painel abre na porta errada

Definir PORT=20128 e NEXT_PUBLIC_BASE_URL=http://localhost:20128

Erros de sincronização na nuvem

Verifique BASE_URL aponta para sua instância em execução
Verifique os pontos CLOUD_URL para o endpoint de nuvem esperado
Mantenha os valores NEXT_PUBLIC_* alinhados com os valores do lado do servidor

Primeiro login não funciona

Verifique INITIAL_PASSWORD em .env
Se não definida, a senha substituta é 123456

Sem registros de solicitação

Definir ENABLE_REQUEST_LOGS=true em .env

O teste de conexão mostra "Inválido" para provedores compatíveis com OpenAI

Muitos provedores não expõem um endpoint /models
OmniRoute v1.0.6+ inclui validação de fallback por meio de conclusões de chat
Certifique-se de que o URL base inclua o sufixo /v1

🛠️ Pilha de tecnologia

Tempo de execução: Node.js 18–22 LTS (⚠️ Node.js 24+ não é compatível — better-sqlite3 binários nativos são incompatíveis)
Idioma: TypeScript 5.9 — 100% TypeScript em src/ e open-sse/ (v1.0.6)
Estrutura: Next.js 16 + React 19 + Tailwind CSS 4
Banco de dados: LowDB (JSON) + SQLite (estado do domínio + logs de proxy)
Streaming: eventos enviados pelo servidor (SSE)
Autenticação: OAuth 2.0 (PKCE) + JWT + chaves de API
Testes: executor de testes Node.js (mais de 368 testes de unidade)
CI/CD: GitHub Actions (publicação automática de npm + Docker Hub no lançamento)
Site: omniroute.online
Pacote: npmjs.com/package/omniroute
Docker: hub.docker.com/r/diegosouzapw/omniroute
Resiliência: Disjuntor, espera exponencial, rebanho anti-trovão, falsificação de TLS

📖 Documentação

Documento	Descrição
User Guide	Provedores, combos, integração CLI, implantação
API Reference	Todos os endpoints com exemplos
Troubleshooting	Problemas e soluções comuns
Architecture	Arquitetura do sistema e componentes internos
Contributing	Configuração e diretrizes de desenvolvimento
OpenAPI Spec	Especificação OpenAPI 3.0
Security Policy	Relatórios de vulnerabilidades e práticas de segurança
VM Deployment	Guia completo: configuração de VM + nginx + Cloudflare
Features Gallery	Tour visual do painel com capturas de tela

📸 Visualização do painel

Clique para ver as capturas de tela do painel

Página	Captura de tela
Fornecedores
Combos
Análise
Saúde
Tradutor
Configurações
Ferramentas CLI
Registros de uso
Ponto final

🗺️ Roteiro

OmniRoute tem 210+ recursos planejados em diversas fases de desenvolvimento. Aqui estão as principais áreas:

Categoria	Recursos planejados	Destaques
🧠 Roteamento e Inteligência	25+	Roteamento de menor latência, roteamento baseado em tags, simulação de cota, seleção de conta P2C
🔒 Segurança e Conformidade	20+	Proteção SSRF, camuflagem de credenciais, limite de taxa por endpoint, escopo de chave de gerenciamento
📊 Observabilidade	15+	Integração OpenTelemetry, monitoramento de cotas em tempo real, rastreamento de custos por modelo
🔄 Integrações com Provedores	20+	Registro de modelo dinâmico, resfriamento de provedor, Codex multicontas, análise de cotas do Copilot
⚡ Desempenho	15+	Camada de cache dupla, cache de prompt, cache de resposta, manutenção de atividade de streaming, API em lote
🌐 Ecossistema	10+	API WebSocket, configuração hot-reload, armazenamento de configuração distribuído, modo comercial

🔜 Em breve

🔗 Integração OpenCode — Suporte de provedor nativo para o IDE de codificação OpenCode AI
🔗 Integração TRAE — Suporte total para a estrutura de desenvolvimento TRAE AI
📦 API Batch — Processamento assíncrono em lote para solicitações em massa
🎯 Roteamento baseado em tags — Roteie solicitações com base em tags personalizadas e metadados
💰 Estratégia de custo mais baixo — Selecione automaticamente o provedor mais barato disponível

📝 Especificações completas de recursos disponíveis em OMNI_TOKEN_147 (217 especificações detalhadas)

📧 Suporte

💬 Junte-se à nossa comunidade! WhatsApp Group — Obtenha ajuda, compartilhe dicas e fique atualizado.

Site: omniroute.online
GitHub: github.com/diegosouzapw/OmniRoute
Problemas: github.com/diegosouzapw/OmniRoute/issues
WhatsApp: Community Group
Projeto Original: 9router by decolua

👥 Colaboradores

Como contribuir

Bifurque o repositório
Crie sua ramificação de recursos (git checkout -b feature/amazing-feature)
Confirme suas alterações (git commit -m 'Add amazing feature')
Envie para a ramificação (git push origin feature/amazing-feature)
Abra uma solicitação pull

Consulte CONTRIBUTING.md para obter diretrizes detalhadas.

Lançando uma nova versão

# Create a release — npm publish happens automatically
gh release create v1.0.6 --title "v1.0.6" --generate-notes

📊 História das Estrelas

🙏 Agradecimentos

Agradecimentos especiais a 9router de decolua — o projeto original que inspirou este fork. OmniRoute se baseia nessa base incrível com recursos adicionais, APIs multimodais e uma reescrita completa do TypeScript.

Agradecimentos especiais a CLIProxyAPI — a implementação Go original que inspirou esta versão JavaScript.

📄 Licença

Licença MIT - consulte LICENSE para obter detalhes.

🇧🇷 OmniRoute — Gateway de IA Gratuito

Nunca pare de codificar. Roteamento inteligente para modelos de IA GRATUITOS e de baixo custo com fallback automático.

Seu proxy universal de API — um endpoint, mais de 36 provedores, tempo de inatividade zero.

🌐 Internacionalização (i18n)

O painel do OmniRoute suporta múltiplos idiomas. Atualmente disponível em:

Idioma	Código	Estado
🇺🇸 Inglês	`en`	✅ Completo
🇧🇷 Português (Brasil)	`pt-BR`	✅ Completo

Para alterar o idioma: Clique no seletor de idioma (🇺🇸 PT) no cabeçalho do painel → selecione o idioma desejado.

Para adicionar um novo idioma:

Crie src/i18n/messages/{codigo}.json baseado em en.json
Adicione o código em src/i18n/config.ts → LOCALES e LANGUAGES
Reinicie o servidor

⚡ Início Rápido

# Instalar via npm
npx omniroute@latest

# Ou rodar do código-fonte
cp .env.example .env
npm install
PORT=20128 NEXT_PUBLIC_BASE_URL=http://localhost:20128 npm run dev

🐳 Docker

docker run -d --name omniroute -p 20128:20128 diegosouzapw/omniroute:latest

🔑 Funcionalidades Principais

36+ provedores de IA — Claude, GPT, Gemini, Llama, Qwen, DeepSeek, e mais
Roteamento inteligente — Fallback automático entre provedores
Tradução de formato — OpenAI ↔ Claude ↔ Gemini automaticamente
Multi-conta — Múltiplas contas por provedor com seleção inteligente
Cache semântico — Reduz custos e latência
OAuth automático — Tokens renovam automaticamente
Combos personalizados — 6 estratégias de roteamento
Dashboard completo — Monitoramento, logs, análises, configurações
Ferramentas CLI — Configure Claude Code, Codex, Cursor, Cline com um clique
100% TypeScript — Código limpo e digitado

📖 Documentação

Documento	Descrição
Guia do Usuário	Provedores, combos, CLI, implantar
Referência da API	Todos os endpoints com exemplos
Solução de Problemas	Problemas comuns e soluções
Arquitetura	Arquitetura e portas do sistema
Contribuição	Configuração de desenvolvimento e diretrizes
Deploy em VM	Guia completo: VM + nginx + Cloudflare

📧Suporte

💬 Entre para a comunidade! Grupo WhatsApp — Tire dúvidas, compartilhe dicas e fique atualizado.

Site: omniroute.online
GitHub: github.com/diegosouzapw/OmniRoute
Problemas: github.com/diegosouzapw/OmniRoute/issues

_{Construído com ❤️ para desenvolvedores que codificam 24 horas por dia, 7 dias por semana}
_{omniroute.online}

FilesExpand file tree

README.pt.md

Latest commit

History

README.pt.md

File metadata and controls

🚀 OmniRoute — O gateway de IA gratuito

Nunca pare de codificar. Roteamento inteligente para modelos de IA GRATUITOS e de baixo custo com fallback automático.

🤖 Provedor de IA gratuito para seus agentes de codificação favoritos

🤔 Por que OmniRoute?

🔄 Como funciona

⚡ Início rápido

🐳 Docker

💰 Visão geral dos preços

🎯 Casos de uso

Caso 1: "Tenho assinatura do Claude Pro"

Caso 2: "Quero custo zero"

Caso 3: "Preciso de codificação 24 horas por dia, 7 dias por semana, sem interrupções"

Caso 4: "Quero IA GRATUITA no OpenClaw"

💡 Principais recursos

🧠 Roteamento e inteligência central

🎵 APIs multimodais

🛡️ Resiliência e segurança

📊 Observabilidade e análise

☁️ Implantação e sincronização

🎯 Fallback inteligente de 4 camadas

📊 Rastreamento de cotas em tempo real

🔄 Tradução de formato

👥 Suporte para múltiplas contas

🔄 Atualização automática de token

🎨 Combos Personalizados

🏥 Painel de saúde

🔧 Parque do Tradutor

💾 Sincronização na nuvem

📖 Guia de configuração

Código Claude (Pro/Max)

Codex OpenAI (Plus/Pro)

Gemini CLI (GRÁTIS 180K/mês!)

GitHub Copiloto

NVIDIA NIM (1000 créditos GRÁTIS!)

DeepSeek

Groq (nível gratuito disponível!)

OpenRouter (mais de 100 modelos)

GLM-4.7 (redefinição diária, US$ 0,6/1 milhão)

MiniMax M2.1 (redefinição de 5h, US$ 0,20/1 milhão)

Kimi K2 (US$ 9/mês fixo)

iFlow (8 modelos GRATUITOS)

Qwen (3 modelos GRATUITOS)

Kiro (Claude GRÁTIS)

Exemplo 1: Maximize a assinatura → Backup barato

Exemplo 2: somente gratuito (custo zero)

Cursor IDE

Código Cláudio

CLI do Codex

Cline / Continuar / RooCode

📊 Modelos Disponíveis

🧪 Avaliações (Evals)

Conjunto Dourado Integrado

Estratégias de Avaliação

🔐 OAuth em Servidor Remoto (Remote OAuth Setup)

Por que o OAuth do Antigravity / Gemini CLI falha em servidores remotos?

Solução: Configure suas próprias credenciais OAuth

Solução alternativa temporária (sem configurar credenciais próprias)

🐛 Solução de problemas

🛠️ Pilha de tecnologia

📖 Documentação

📸 Visualização do painel

🗺️ Roteiro

🔜 Em breve

📧 Suporte

👥 Colaboradores

Como contribuir

Lançando uma nova versão

📊 História das Estrelas

🙏 Agradecimentos

📄 Licença

🇧🇷 OmniRoute — Gateway de IA Gratuito

Nunca pare de codificar. Roteamento inteligente para modelos de IA GRATUITOS e de baixo custo com fallback automático.

🌐 Internacionalização (i18n)

⚡ Início Rápido