Skip to content

Latest commit

 

History

History
1238 lines (887 loc) · 51.4 KB

File metadata and controls

1238 lines (887 loc) · 51.4 KB
OmniRoute Dashboard

🚀 OmniRoute — O gateway de IA gratuito

🌐 English | Português (BR)

Nunca pare de codificar. Roteamento inteligente para modelos de IA GRATUITOS e de baixo custo com fallback automático.

Seu proxy de API universal — um endpoint, mais de 36 provedores, tempo de inatividade zero.

Conclusões de bate-papo • Incorporações • Geração de imagem • Áudio • Reclassificação • 100% TypeScript


🤖 Provedor de IA gratuito para seus agentes de codificação favoritos

Conecte qualquer ferramenta IDE ou CLI com tecnologia de IA por meio do OmniRoute - gateway de API gratuito para codificação ilimitada.

OpenClaw
OpenClaw

⭐ 205K
NanoBot
NanoBot

⭐ 20.9K
PicoClaw
PicoClaw

⭐ 14.6K
ZeroClaw
ZeroClaw

⭐ 9.9K
IronClaw
IronClaw

⭐ 2.1K
OpenCode
OpenCode

⭐ 106K
Codex CLI
Codex CLI

⭐ 60.8K
Claude Code
Claude Code

⭐ 67.3K
Gemini CLI
Gemini CLI

⭐ 94.7K
Kilo Code
Kilo Code

⭐ 15.5K

📡 Todos os agentes se conectam via http://localhost:20128/v1 ou http://cloud.omniroute.online/v1 — uma configuração, modelos ilimitados e cota


npm version Docker Hub License Website WhatsApp

🌐 Website🚀 Quick Start💡 Features📖 Docs💰 Pricing💬 WhatsApp

🌐 Available in: 🇺🇸 English | 🇧🇷 Português (Brasil) | 🇪🇸 Español | 🇫🇷 Français | 🇮🇹 Italiano | 🇷🇺 Русский | 🇨🇳 中文 (简体) | 🇩🇪 Deutsch | 🇮🇳 हिन्दी | 🇹🇭 ไทย | 🇺🇦 Українська | 🇸🇦 العربية | 🇯🇵 日本語 | 🇻🇳 Tiếng Việt | 🇧🇬 Български | 🇩🇰 Dansk | 🇫🇮 Suomi | 🇮🇱 עברית | 🇭🇺 Magyar | 🇮🇩 Bahasa Indonesia | 🇰🇷 한국어 | 🇲🇾 Bahasa Melayu | 🇳🇱 Nederlands | 🇳🇴 Norsk | 🇵🇹 Português (Portugal) | 🇷🇴 Română | 🇵🇱 Polski | 🇸🇰 Slovenčina | 🇸🇪 Svenska | 🇵🇭 Filipino


🤔 Por que OmniRoute?

Pare de desperdiçar dinheiro e atingir limites:

  • A cota de assinatura expira sem ser utilizada todos os meses
  • Os limites de taxa impedem você no meio da codificação
  • APIs caras (US$ 20-50/mês por provedor)
  • Troca manual entre provedores

OmniRoute resolve isso:

  • Maximize as assinaturas - Rastreie a cota, use cada bit antes de redefinir
  • Fullback automático - Assinatura → Chave de API → Barato → Gratuito, tempo de inatividade zero
  • Múltiplas contas - Round-robin entre contas por provedor
  • Universal - Funciona com Claude Code, Codex, Gemini CLI, Cursor, Cline, OpenClaw, qualquer ferramenta CLI

🔄 Como funciona

┌─────────────┐
│  Your CLI   │  (Claude Code, Codex, Gemini CLI, OpenClaw, Cursor, Cline...)
│   Tool      │
└──────┬──────┘
       │ http://localhost:20128/v1
       ↓
┌─────────────────────────────────────────┐
│           OmniRoute (Smart Router)        │
│  • Format translation (OpenAI ↔ Claude) │
│  • Quota tracking + Embeddings + Images │
│  • Auto token refresh                   │
└──────┬──────────────────────────────────┘
       │
       ├─→ [Tier 1: SUBSCRIPTION] Claude Code, Codex, Gemini CLI
       │   ↓ quota exhausted
       ├─→ [Tier 2: API KEY] DeepSeek, Groq, xAI, Mistral, NVIDIA NIM, etc.
       │   ↓ budget limit
       ├─→ [Tier 3: CHEAP] GLM ($0.6/1M), MiniMax ($0.2/1M)
       │   ↓ budget limit
       └─→ [Tier 4: FREE] iFlow, Qwen, Kiro (unlimited)

Result: Never stop coding, minimal cost

⚡ Início rápido

1. Instale globalmente:

npm install -g omniroute
omniroute

🎉 O painel abre às http://localhost:20128

Comando Descrição
omniroute Iniciar servidor (porta padrão 20128)
omniroute --port 3000 Usar porta personalizada
omniroute --no-open Não abra o navegador automaticamente
omniroute --help Mostrar ajuda

2. Conecte um provedor GRATUITO:

Painel → Provedores → Conectar Claude Code ou Antigravidade → Login OAuth → Concluído!

3. Use em sua ferramenta CLI:

Claude Code/Codex/Gemini CLI/OpenClaw/Cursor/Cline Settings:
  Endpoint: http://localhost:20128/v1
  API Key: [copy from dashboard]
  Model: if/kimi-k2-thinking

É isso aí! Comece a codificar com modelos de IA GRATUITOS.

Alternativa – execute a partir da fonte:

cp .env.example .env
npm install
PORT=20128 NEXT_PUBLIC_BASE_URL=http://localhost:20128 npm run dev

🐳 Docker

OmniRoute está disponível como uma imagem pública do Docker em Docker Hub.

Execução rápida:

docker run -d \
  --name omniroute \
  --restart unless-stopped \
  -p 20128:20128 \
  -v omniroute-data:/app/data \
  diegosouzapw/omniroute:latest

Com arquivo de ambiente:

# Copy and edit .env first
cp .env.example .env

docker run -d \
  --name omniroute \
  --restart unless-stopped \
  --env-file .env \
  -p 20128:20128 \
  -v omniroute-data:/app/data \
  diegosouzapw/omniroute:latest

Usando Docker Compose:

# Base profile (no CLI tools)
docker compose --profile base up -d

# CLI profile (Claude Code, Codex, OpenClaw built-in)
docker compose --profile cli up -d
Imagem Etiqueta Tamanho Descrição
diegosouzapw/omniroute latest ~250 MB Última versão estável
diegosouzapw/omniroute 1.0.3 ~250 MB Versão atual

💰 Visão geral dos preços

Nível Provedor Custo Redefinição de cota Melhor para
💳 ASSINATURA Código Claude (Pro) $ 20/mês 5h + semanalmente Já inscrito
Códice (Plus/Pro) US$ 20-200/mês 5h + semanalmente Usuários OpenAI
Gêmeos CLI GRÁTIS 180 mil/mês + 1 mil/dia Todos!
Copiloto GitHub US$ 10-19/mês Mensalmente Usuários do GitHub
🔑 CHAVE DE API NVIDIA NIM GRÁTIS (1000 créditos) Único Teste de nível gratuito
DeepSeek Pagamento conforme uso Nenhum Melhor preço/qualidade
Groq Nível gratuito + pago Taxa limitada Inferência ultrarrápida
xAI (Groque) Pagamento conforme uso Nenhum Modelos Grok
Mistral Nível gratuito + pago Taxa limitada IA Europeia
OpenRouter Pagamento conforme uso Nenhum Mais de 100 modelos
💰 BARATO GLM-4.7 US$ 0,6/1 milhão Diariamente 10h Backup de orçamento
MiniMax M2.1 US$ 0,2/1 milhão Rolamento de 5 horas Opção mais barata
Kimi K2 $ 9 / mês fixo 10 milhões de tokens/mês Custo previsível
🆓 GRÁTIS iFlow $0 Ilimitado 8 modelos grátis
Qwen $0 Ilimitado 3 modelos grátis
Kiro $0 Ilimitado Cláudio grátis

💡 Dica profissional: Comece com Gemini CLI (180 mil grátis/mês) + combo iFlow (gratuito ilimitado) = custo de $ 0!


🎯 Casos de uso

Caso 1: "Tenho assinatura do Claude Pro"

Problema: A cota expira sem ser utilizada, limites de taxa durante codificação pesada

Combo: "maximize-claude"
  1. cc/claude-opus-4-6        (use subscription fully)
  2. glm/glm-4.7               (cheap backup when quota out)
  3. if/kimi-k2-thinking       (free emergency fallback)

Monthly cost: $20 (subscription) + ~$5 (backup) = $25 total
vs. $20 + hitting limits = frustration

Caso 2: "Quero custo zero"

Problema: Não posso pagar assinaturas, preciso de codificação de IA confiável

Combo: "free-forever"
  1. gc/gemini-3-flash         (180K free/month)
  2. if/kimi-k2-thinking       (unlimited free)
  3. qw/qwen3-coder-plus       (unlimited free)

Monthly cost: $0
Quality: Production-ready models

Caso 3: "Preciso de codificação 24 horas por dia, 7 dias por semana, sem interrupções"

Problema: Prazos, não podemos arcar com o tempo de inatividade

Combo: "always-on"
  1. cc/claude-opus-4-6        (best quality)
  2. cx/gpt-5.2-codex          (second subscription)
  3. glm/glm-4.7               (cheap, resets daily)
  4. minimax/MiniMax-M2.1      (cheapest, 5h reset)
  5. if/kimi-k2-thinking       (free unlimited)

Result: 5 layers of fallback = zero downtime

Caso 4: "Quero IA GRATUITA no OpenClaw"

Problema: Precisa de assistente de IA em aplicativos de mensagens, totalmente gratuito

Combo: "openclaw-free"
  1. if/glm-4.7                (unlimited free)
  2. if/minimax-m2.1           (unlimited free)
  3. if/kimi-k2-thinking       (unlimited free)

Monthly cost: $0
Access via: WhatsApp, Telegram, Slack, Discord, iMessage, Signal...

💡 Principais recursos

🧠 Roteamento e inteligência central

Recurso O que faz
🎯 Fullback inteligente de 4 camadas Roteamento automático: Assinatura → Chave de API → Barato → Grátis
📊 Acompanhamento de cotas em tempo real Contagem de tokens ativos + contagem regressiva redefinida por provedor
🔄 Tradução de formato OpenAI ↔ Claude ↔ Gemini ↔ Cursor ↔ Kiro sem costura + higienização de resposta
👥 Suporte para múltiplas contas Múltiplas contas por provedor com seleção inteligente
🔄 Atualização automática de token Os tokens OAuth são atualizados automaticamente com nova tentativa
🎨 Combos Personalizados 6 estratégias: preencher primeiro, round-robin, p2c, aleatório, menos usado, otimizado para custos
🧩 Modelos Personalizados Adicione qualquer ID de modelo a qualquer provedor
🌐 Roteador curinga Rotear padrões provider/* para qualquer provedor dinamicamente
🧠 Pensando no Orçamento Modos de passagem, automático, personalizado e adaptativo para modelos de raciocínio
💬 Injeção imediata do sistema Prompt de sistema global aplicado em todas as solicitações
📄 API de respostas Suporte completo à API de respostas OpenAI (/v1/responses) para Codex

🎵 APIs multimodais

Recurso O que faz
🖼️ Geração de imagens /v1/images/generations — 4 provedores, mais de 9 modelos
📐 Incorporações /v1/embeddings — 6 provedores, mais de 9 modelos
🎤 Transcrição de áudio /v1/audio/transcriptions — Compatível com sussurro
🔊 Conversão de texto em fala /v1/audio/speech — Síntese de áudio multiprovedor
🛡️ Moderações /v1/moderations — Verificações de segurança de conteúdo
🔀 Reclassificação /v1/rerank — Reclassificação da relevância dos documentos

🛡️ Resiliência e segurança

Recurso O que faz
🔌 Disjuntor Abertura/fechamento automático por provedor com limites configuráveis ​​
🛡️ Rebanho Anti-Trovão Mutex + limite de taxa de semáforo para provedores de chaves de API
🧠 Cache Semântico Cache de duas camadas (assinatura + semântica) reduz custo e latência
Solicitar Idempotência Janela de desduplicação 5s para solicitações duplicadas
🔒 Falsificação de impressão digital TLS Ignore a detecção de bot baseada em TLS via wreq-js
🌐 Filtragem de IP Lista de permissões/lista de bloqueio para controle de acesso à API
📊 Limites de taxas editáveis RPM configurável, intervalo mínimo e simultâneo máximo no nível do sistema
🛡 Proteção de endpoint de API Autenticação + bloqueio de provedor para o endpoint /models
🔒 Visibilidade do proxy Crachás codificados por cores: 🟢 global, 🟡 provedor, 🔵 por conexão com display IP
🌐 Configuração de proxy de 3 níveis Configurar proxies em nível global, por provedor ou por conexão

📊 Observabilidade e análise

Recurso O que faz
📝 Solicitar registro Modo de depuração com logs completos de solicitação/resposta
💾 Logs de proxy SQLite Logs de proxy persistentes sobrevivem às reinicializações do servidor
📊 Painel de análise Alimentado por recargas: cartões de estatísticas, gráfico de uso de modelo, tabela de provedores
📈 Acompanhamento do progresso Eventos de progresso SSE opcionais para streaming
🧪 Avaliações LLM Teste de Golden Set com 4 estratégias de jogo
🔍 Solicitar Telemetria Agregação de latência p50/p95/p99 + rastreamento X-Request-Id
📋 Painel de registros Página unificada de 4 guias: Logs de solicitação, Logs de proxy, Logs de auditoria, Console
🖥️ Visualizador de registros do console Visualizador em estilo terminal em tempo real com filtro de nível, pesquisa, rolagem automática
📑 Registro baseado em arquivo O interceptor do console captura toda a saída para o arquivo de log JSON com rotação
🏥 Painel de saúde Tempo de atividade do sistema, estados de disjuntores, bloqueios, estatísticas de cache
💰 Acompanhamento de custos Gestão orçamentária + configuração de preços por modelo

☁️ Implantação e sincronização

Recurso O que faz
💾 Sincronização na nuvem Sincronize a configuração entre dispositivos por meio do Cloudflare Workers
🌐 Implante em qualquer lugar Localhost, VPS, Docker, Cloudflare Workers
🔑 Gerenciamento de chaves de API Gerar, alternar e definir o escopo de chaves de API por provedor
🧙 Assistente de integração Configuração guiada em 4 etapas para usuários iniciantes
🔧 Painel de Ferramentas CLI Configurar com um clique Claude, Codex, Cline, OpenClaw, Kilo, Antigravity
🔄 Backups de banco de dados Backup, restauração, exportação e importação automáticos para todas as configurações
🌐 Internacionalização i18n completo com next-intl — Suporte Inglês + Português (Brasil)
🌍 Seletor de idioma Ícone de globo no cabeçalho para troca de idioma em tempo real (🇺🇸/🇧🇷)
📂 Diretório de dados personalizado DATA_DIR env var para substituir o caminho de armazenamento padrão ~/.omniroute
📖 Detalhes do recurso

🎯 Fallback inteligente de 4 camadas

Crie combos com fallback automático:

Combo: "my-coding-stack"
  1. cc/claude-opus-4-6        (your subscription)
  2. nvidia/llama-3.3-70b      (free NVIDIA API)
  3. glm/glm-4.7               (cheap backup, $0.6/1M)
  4. if/kimi-k2-thinking       (free fallback)

→ Auto switches when quota runs out or errors occur

📊 Rastreamento de cotas em tempo real

  • Consumo de token por provedor
  • Redefinir contagem regressiva (5 horas, diariamente, semanalmente)
  • Estimativa de custos para níveis pagos
  • Relatórios mensais de gastos

🔄 Tradução de formato

Tradução perfeita entre formatos:

  • OpenAIClaudeGêmeosRespostas OpenAI
  • Sua ferramenta CLI envia o formato OpenAI → OmniRoute traduz → O provedor recebe o formato nativo
  • Funciona com qualquer ferramenta que suporte endpoints OpenAI personalizados
  • Higienização de resposta — Remove campos não padrão para compatibilidade estrita com o OpenAI SDK
  • Normalização de funçõesdevelopersystem para não-OpenAI; systemuser para modelos GLM/ERNIE
  • ** Extração de tags Think ** — <think> blocos → reasoning_content para modelos de pensamento
  • Saída estruturadajson_schemaresponseMimeType/responseSchema de Gêmeos

👥 Suporte para múltiplas contas

  • Adicione várias contas por provedor
  • Round-robin automático ou roteamento baseado em prioridade
  • Fallback para a próxima conta quando alguém atingir a cota

🔄 Atualização automática de token

  • Os tokens OAuth são atualizados automaticamente antes da expiração
  • Não é necessária reautenticação manual
  • Experiência perfeita em todos os provedores

🎨 Combos Personalizados

  • Crie combinações ilimitadas de modelos
  • 6 estratégias: preencher primeiro, round-robin, poder de duas escolhas, aleatório, menos usado, otimizado para custos
  • Compartilhe combos entre dispositivos com Cloud Sync

🏥 Painel de saúde

  • Status do sistema (tempo de atividade, versão, uso de memória)
  • Estados do disjuntor por provedor (Fechado/Aberto/Meio-Aberto)
  • Status do limite de taxa e bloqueios ativos
  • Estatísticas de cache de assinatura
  • Telemetria de latência (p50/p95/p99) + cache de prompt
  • Redefinir o status de saúde com um clique

🔧 Parque do Tradutor

OmniRoute inclui um poderoso Translator Playground integrado com 4 modos para depuração, teste e monitoramento de traduções de API:

Modo Descrição
💻 Parque Infantil Tradução direta de formato — cole qualquer corpo de solicitação de API e veja instantaneamente como o OmniRoute o traduz entre formatos de provedor (OpenAI ↔ Claude ↔ Gemini ↔ API de respostas). Inclui modelos de exemplo e detecção automática de formato.
💬 Testador de bate-papo Envie solicitações de chat reais por meio do OmniRoute e veja o percurso completo: sua entrada, a solicitação traduzida, a resposta do provedor e a resposta traduzida de volta. Inestimável para validar o roteamento combinado.
🧪 Bancada de testes Modo de teste em lote — defina vários casos de teste com diferentes entradas e resultados esperados, execute-os todos de uma vez e compare os resultados entre provedores e modelos.
📱Monitoramento ao vivo Monitoramento de solicitações em tempo real: observe as solicitações recebidas conforme elas fluem pelo OmniRoute, veja as traduções de formato acontecendo ao vivo e identifique problemas instantaneamente.

Acesso: Painel → Tradutor (barra lateral)

💾 Sincronização na nuvem

  • Sincronize provedores, combos e configurações entre dispositivos
  • Sincronização automática em segundo plano
  • Armazenamento criptografado seguro

📖 Guia de configuração

💳 Provedores de assinatura

Código Claude (Pro/Max)

Dashboard → Providers → Connect Claude Code
→ OAuth login → Auto token refresh
→ 5-hour + weekly quota tracking

Models:
  cc/claude-opus-4-6
  cc/claude-sonnet-4-5-20250929
  cc/claude-haiku-4-5-20251001

Dica profissional: Use o Opus para tarefas complexas e o Sonnet para velocidade. OmniRoute rastreia cota por modelo!

Codex OpenAI (Plus/Pro)

Dashboard → Providers → Connect Codex
→ OAuth login (port 1455)
→ 5-hour + weekly reset

Models:
  cx/gpt-5.2-codex
  cx/gpt-5.1-codex-max

Gemini CLI (GRÁTIS 180K/mês!)

Dashboard → Providers → Connect Gemini CLI
→ Google OAuth
→ 180K completions/month + 1K/day

Models:
  gc/gemini-3-flash-preview
  gc/gemini-2.5-pro

Melhor valor: Grande nível gratuito! Use isso antes dos níveis pagos.

GitHub Copiloto

Dashboard → Providers → Connect GitHub
→ OAuth via GitHub
→ Monthly reset (1st of month)

Models:
  gh/gpt-5
  gh/claude-4.5-sonnet
  gh/gemini-3-pro
🔑 Provedores de chave de API

NVIDIA NIM (1000 créditos GRÁTIS!)

  1. Inscreva-se: build.nvidia.com
  2. Obtenha uma chave de API gratuita (1.000 créditos de inferência incluídos)
  3. Painel → Adicionar Provedor → NVIDIA NIM:
    • Chave API: nvapi-your-key

Modelos: nvidia/llama-3.3-70b-instruct, nvidia/mistral-7b-instruct e mais de 50

Dica profissional: API compatível com OpenAI — funciona perfeitamente com a tradução de formato do OmniRoute!

DeepSeek

  1. Inscreva-se: platform.deepseek.com
  2. Obtenha a chave API
  3. Painel → Adicionar provedor → DeepSeek

Modelos: deepseek/deepseek-chat, deepseek/deepseek-coder

Groq (nível gratuito disponível!)

  1. Inscreva-se: console.groq.com
  2. Obtenha a chave API (nível gratuito incluído)
  3. Painel → Adicionar Provedor → Groq

Modelos: groq/llama-3.3-70b, groq/mixtral-8x7b

Dica profissional: Inferência ultrarrápida — melhor para codificação em tempo real!

OpenRouter (mais de 100 modelos)

  1. Inscreva-se: openrouter.ai
  2. Obtenha a chave API
  3. Painel → Adicionar Provedor → OpenRouter

Modelos: acesse mais de 100 modelos de todos os principais fornecedores por meio de uma única chave de API.

💰 Provedores baratos (backup)

GLM-4.7 (redefinição diária, US$ 0,6/1 milhão)

  1. Inscreva-se: Zhipu AI
  2. Obtenha a chave API do plano de codificação
  3. Painel → Adicionar chave API:
    • Provedor: glm
    • Chave API: your-key

Usar: glm/glm-4.7

Dica profissional: O plano de codificação oferece cota 3× com custo de 1/7! Redefinir diariamente às 10h.

MiniMax M2.1 (redefinição de 5h, US$ 0,20/1 milhão)

  1. Inscreva-se: MiniMax
  2. Obtenha a chave API
  3. Painel → Adicionar chave API

Usar: minimax/MiniMax-M2.1

Dica profissional: Opção mais barata para contexto longo (1 milhão de tokens)!

Kimi K2 (US$ 9/mês fixo)

  1. Inscreva-se: Moonshot AI
  2. Obtenha a chave API
  3. Painel → Adicionar chave API

Usar: kimi/kimi-latest

Dica profissional: $9 fixos/mês para 10 milhões de tokens = $0,90/custo efetivo de 1 milhão!

🆓 Provedores GRATUITOS (backup de emergência)

iFlow (8 modelos GRATUITOS)

Dashboard → Connect iFlow
→ iFlow OAuth login
→ Unlimited usage

Models:
  if/kimi-k2-thinking
  if/qwen3-coder-plus
  if/glm-4.7
  if/minimax-m2
  if/deepseek-r1

Qwen (3 modelos GRATUITOS)

Dashboard → Connect Qwen
→ Device code authorization
→ Unlimited usage

Models:
  qw/qwen3-coder-plus
  qw/qwen3-coder-flash

Kiro (Claude GRÁTIS)

Dashboard → Connect Kiro
→ AWS Builder ID or Google/GitHub
→ Unlimited usage

Models:
  kr/claude-sonnet-4.5
  kr/claude-haiku-4.5
🎨 Criar Combos

Exemplo 1: Maximize a assinatura → Backup barato

Dashboard → Combos → Create New

Name: premium-coding
Models:
  1. cc/claude-opus-4-6 (Subscription primary)
  2. glm/glm-4.7 (Cheap backup, $0.6/1M)
  3. minimax/MiniMax-M2.1 (Cheapest fallback, $0.20/1M)

Use in CLI: premium-coding

Exemplo 2: somente gratuito (custo zero)

Name: free-combo
Models:
  1. gc/gemini-3-flash-preview (180K free/month)
  2. if/kimi-k2-thinking (unlimited)
  3. qw/qwen3-coder-plus (unlimited)

Cost: $0 forever!
🔧 Integração CLI

Cursor IDE

Settings → Models → Advanced:
  OpenAI API Base URL: http://localhost:20128/v1
  OpenAI API Key: [from OmniRoute dashboard]
  Model: cc/claude-opus-4-6

Código Cláudio

Use a página Ferramentas CLI no painel para configuração com um clique ou edite ~/.claude/settings.json manualmente.

CLI do Codex

export OPENAI_BASE_URL="http://localhost:20128"
export OPENAI_API_KEY="your-omniroute-api-key"

codex "your prompt"

###OpenClaw

Opção 1 — Painel (recomendado):

Dashboard → CLI Tools → OpenClaw → Select Model → Apply

Opção 2 — Manual: Editar ~/.openclaw/openclaw.json:

{
  "models": {
    "providers": {
      "omniroute": {
        "baseUrl": "http://127.0.0.1:20128/v1",
        "apiKey": "sk_omniroute",
        "api": "openai-completions"
      }
    }
  }
}

Observação: OpenClaw só funciona com OmniRoute local. Use 127.0.0.1 em vez de localhost para evitar problemas de resolução de IPv6.

Cline / Continuar / RooCode

Settings → API Configuration:
  Provider: OpenAI Compatible
  Base URL: http://localhost:20128/v1
  API Key: [from OmniRoute dashboard]
  Model: if/kimi-k2-thinking

📊 Modelos Disponíveis

Ver todos os modelos disponíveis

Código Claude (cc/) - Pro/Máx:

  • cc/claude-opus-4-6
  • cc/claude-sonnet-4-5-20250929
  • cc/claude-haiku-4-5-20251001

Códice (cx/) - Plus/Pro:

  • cx/gpt-5.2-codex
  • cx/gpt-5.1-codex-max

Gemini CLI (gc/) - GRATUITO:

  • gc/gemini-3-flash-preview
  • gc/gemini-2.5-pro

Copiloto do GitHub (gh/):

  • gh/gpt-5
  • gh/claude-4.5-sonnet

NVIDIA NIM (nvidia/) - Créditos GRATUITOS:

  • nvidia/llama-3.3-70b-instruct
  • nvidia/mistral-7b-instruct
  • Mais de 50 modelos em build.nvidia.com

GLM (glm/) - US$ 0,6/1 milhão:

  • glm/glm-4.7

MiniMax (minimax/) - US$ 0,2/1 milhão:

  • minimax/MiniMax-M2.1

iFlow (if/) - GRATUITO:

  • if/kimi-k2-thinking
  • if/qwen3-coder-plus
  • if/deepseek-r1
  • if/glm-4.7
  • if/minimax-m2

Qwen (qw/) - GRATUITO:

  • qw/qwen3-coder-plus
  • qw/qwen3-coder-flash

Kiro (kr/) - GRATUITO:

  • kr/claude-sonnet-4.5
  • kr/claude-haiku-4.5

OpenRouter (or/) - mais de 100 modelos:


🧪 Avaliações (Evals)

OmniRoute inclui uma estrutura de avaliação integrada para testar a qualidade da resposta do LLM em relação a um conjunto dourado. Acesse-o em Analytics → Evals no painel.

Conjunto Dourado Integrado

O "OmniRoute Golden Set" pré-carregado contém 10 casos de teste cobrindo:

  • Saudações, matemática, geografia, geração de código
  • Conformidade com o formato JSON, tradução, remarcação
  • Recusa de segurança (conteúdo prejudicial), contagem, lógica booleana

Estratégias de Avaliação

Estratégia Descrição Exemplo
exact A saída deve corresponder exatamente "4"
contains A saída deve conter substring (sem distinção entre maiúsculas e minúsculas) "Paris"
regex A saída deve corresponder ao padrão regex "1.*2.*3"
custom Função JS personalizada retorna verdadeiro/falso (output) => output.length > 10

🔐 OAuth em Servidor Remoto (Remote OAuth Setup)

⚠️ IMPORTANTE para usuários com OmniRoute em VPS/Docker/servidor remoto

Por que o OAuth do Antigravity / Gemini CLI falha em servidores remotos?

Os provedores Antigravity e Gemini CLI usam Google OAuth 2.0 para autenticação. O Google exige que um redirect_uri usado no fluxo OAuth seja exatamente uma das URIs pré-cadastradas no Google Cloud Console do aplicativo.

As credenciais OAuth incorporadas no OmniRoute estão cadastradas apenas para localhost. Quando você acessa o OmniRoute em um servidor remoto (ex: https://omniroute.meuservidor.com), o Google rejeita a autenticação com:

Error 400: redirect_uri_mismatch

Solução: Configure suas próprias credenciais OAuth

Você precisa criar um OAuth 2.0 Client ID no Google Cloud Console com o URI do seu servidor.

####Passo a passo

1. Acesse o Console do Google Cloud

Abra: https://console.cloud.google.com/apis/credentials

2. Crie um novo ID de cliente OAuth 2.0

  • Clique em "+ Criar credenciais""ID do cliente OAuth"
  • Tipo de aplicativo: "Aplicativo Web"
  • Nome: escolha qualquer nome (ex: OmniRoute Remote)

3. Adicionar como URIs de redirecionamento autorizados

No campo "URIs de redirecionamento autorizados", adicionado:

https://seu-servidor.com/callback

Substitua seu-servidor.com pelo domínio ou IP do seu servidor (inclua a porta se necessário, ex: http://45.33.32.156:20128/callback).

4. Salve e copie as credenciais

Após criar, o Google mostrará o Client ID e o Client Secret.

5. Configurar como variáveis de ambiente

No seu .env (ou nas variáveis de ambiente do Docker):

# Para Antigravity:
ANTIGRAVITY_OAUTH_CLIENT_ID=seu-client-id.apps.googleusercontent.com
ANTIGRAVITY_OAUTH_CLIENT_SECRET=GOCSPX-seu-secret

# Para Gemini CLI:
GEMINI_OAUTH_CLIENT_ID=seu-client-id.apps.googleusercontent.com
GEMINI_OAUTH_CLIENT_SECRET=GOCSPX-seu-secret
GEMINI_CLI_OAUTH_CLIENT_SECRET=GOCSPX-seu-secret

6. Reinicie o OmniRoute

# Se usando npm:
npm run dev

# Se usando Docker:
docker restart omniroute

7. Tente conectar novamente

Painel → Provedores → Antigravidade (ou Gemini CLI) → OAuth

Agora o Google redirecionará corretamente para https://seu-servidor.com/callback e a autenticação funcionará.


Solução alternativa temporária (sem configurar credenciais próprias)

Se não quiser criar credenciais próprias agora, ainda é possível usar o fluxo manual de URL:

  1. O OmniRoute abrirá uma URL de autorização do Google
  2. Após você autorizar, o Google tentará redirecionar para localhost (que falha no servidor remoto)
  3. Copie a URL completa da barra de endereço do seu navegador (mesmo que a página não carregue)
  4. Cole essa URL no campo que aparece no modal de conexão do OmniRoute
  5. Clique em "Conectar"

Esta solução alternativa funciona porque o código de autorização na URL é válido, independentemente do redirecionamento ter sido carregado ou não.


🐛 Solução de problemas

Clique para expandir o guia de solução de problemas

"O modelo de linguagem não forneceu mensagens"

  • Cota do provedor esgotada → Verifique o rastreador de cota do painel
  • Solução: use o combo substituto ou mude para um nível mais barato

** Limitação de taxa **

  • Cota de assinatura esgotada → Fallback para GLM/MiniMax
  • Adicionar combinação: cc/claude-opus-4-6 → glm/glm-4.7 → if/kimi-k2-thinking

O token OAuth expirou

  • Atualizado automaticamente pelo OmniRoute
  • Se os problemas persistirem: Painel → Provedor → Reconectar

Custos elevados

  • Verifique as estatísticas de uso em Painel → Custos
  • Mude o modelo primário para GLM/MiniMax
  • Use o nível gratuito (Gemini CLI, iFlow) para tarefas não críticas

Painel abre na porta errada

  • Definir PORT=20128 e NEXT_PUBLIC_BASE_URL=http://localhost:20128

Erros de sincronização na nuvem

  • Verifique BASE_URL aponta para sua instância em execução
  • Verifique os pontos CLOUD_URL para o endpoint de nuvem esperado
  • Mantenha os valores NEXT_PUBLIC_* alinhados com os valores do lado do servidor

Primeiro login não funciona

  • Verifique INITIAL_PASSWORD em .env
  • Se não definida, a senha substituta é 123456

Sem registros de solicitação

  • Definir ENABLE_REQUEST_LOGS=true em .env

O teste de conexão mostra "Inválido" para provedores compatíveis com OpenAI

  • Muitos provedores não expõem um endpoint /models
  • OmniRoute v1.0.6+ inclui validação de fallback por meio de conclusões de chat
  • Certifique-se de que o URL base inclua o sufixo /v1

🛠️ Pilha de tecnologia

  • Tempo de execução: Node.js 18–22 LTS (⚠️ Node.js 24+ não é compatívelbetter-sqlite3 binários nativos são incompatíveis)
  • Idioma: TypeScript 5.9 — 100% TypeScript em src/ e open-sse/ (v1.0.6)
  • Estrutura: Next.js 16 + React 19 + Tailwind CSS 4
  • Banco de dados: LowDB (JSON) + SQLite (estado do domínio + logs de proxy)
  • Streaming: eventos enviados pelo servidor (SSE)
  • Autenticação: OAuth 2.0 (PKCE) + JWT + chaves de API
  • Testes: executor de testes Node.js (mais de 368 testes de unidade)
  • CI/CD: GitHub Actions (publicação automática de npm + Docker Hub no lançamento)
  • Site: omniroute.online
  • Pacote: npmjs.com/package/omniroute
  • Docker: hub.docker.com/r/diegosouzapw/omniroute
  • Resiliência: Disjuntor, espera exponencial, rebanho anti-trovão, falsificação de TLS

📖 Documentação

Documento Descrição
User Guide Provedores, combos, integração CLI, implantação
API Reference Todos os endpoints com exemplos
Troubleshooting Problemas e soluções comuns
Architecture Arquitetura do sistema e componentes internos
Contributing Configuração e diretrizes de desenvolvimento
OpenAPI Spec Especificação OpenAPI 3.0
Security Policy Relatórios de vulnerabilidades e práticas de segurança
VM Deployment Guia completo: configuração de VM + nginx + Cloudflare
Features Gallery Tour visual do painel com capturas de tela

📸 Visualização do painel

Clique para ver as capturas de tela do painel
Página Captura de tela
Fornecedores Providers
Combos Combos
Análise Analytics
Saúde Health
Tradutor Translator
Configurações Settings
Ferramentas CLI CLI Tools
Registros de uso Usage
Ponto final Endpoint

🗺️ Roteiro

OmniRoute tem 210+ recursos planejados em diversas fases de desenvolvimento. Aqui estão as principais áreas:

Categoria Recursos planejados Destaques
🧠 Roteamento e Inteligência 25+ Roteamento de menor latência, roteamento baseado em tags, simulação de cota, seleção de conta P2C
🔒 Segurança e Conformidade 20+ Proteção SSRF, camuflagem de credenciais, limite de taxa por endpoint, escopo de chave de gerenciamento
📊 Observabilidade 15+ Integração OpenTelemetry, monitoramento de cotas em tempo real, rastreamento de custos por modelo
🔄 Integrações com Provedores 20+ Registro de modelo dinâmico, resfriamento de provedor, Codex multicontas, análise de cotas do Copilot
Desempenho 15+ Camada de cache dupla, cache de prompt, cache de resposta, manutenção de atividade de streaming, API em lote
🌐 Ecossistema 10+ API WebSocket, configuração hot-reload, armazenamento de configuração distribuído, modo comercial

🔜 Em breve

  • 🔗 Integração OpenCode — Suporte de provedor nativo para o IDE de codificação OpenCode AI
  • 🔗 Integração TRAE — Suporte total para a estrutura de desenvolvimento TRAE AI
  • 📦 API Batch — Processamento assíncrono em lote para solicitações em massa
  • 🎯 Roteamento baseado em tags — Roteie solicitações com base em tags personalizadas e metadados
  • 💰 Estratégia de custo mais baixo — Selecione automaticamente o provedor mais barato disponível

📝 Especificações completas de recursos disponíveis em OMNI_TOKEN_147 (217 especificações detalhadas)


📧 Suporte

💬 Junte-se à nossa comunidade! WhatsApp Group — Obtenha ajuda, compartilhe dicas e fique atualizado.


👥 Colaboradores

Contributors

Como contribuir

  1. Bifurque o repositório
  2. Crie sua ramificação de recursos (git checkout -b feature/amazing-feature)
  3. Confirme suas alterações (git commit -m 'Add amazing feature')
  4. Envie para a ramificação (git push origin feature/amazing-feature)
  5. Abra uma solicitação pull

Consulte CONTRIBUTING.md para obter diretrizes detalhadas.

Lançando uma nova versão

# Create a release — npm publish happens automatically
gh release create v1.0.6 --title "v1.0.6" --generate-notes

📊 História das Estrelas

Star History Chart

🙏 Agradecimentos

Agradecimentos especiais a 9router de decolua — o projeto original que inspirou este fork. OmniRoute se baseia nessa base incrível com recursos adicionais, APIs multimodais e uma reescrita completa do TypeScript.

Agradecimentos especiais a CLIProxyAPI — a implementação Go original que inspirou esta versão JavaScript.


📄 Licença

Licença MIT - consulte LICENSE para obter detalhes.



🇧🇷 OmniRoute — Gateway de IA Gratuito

Nunca pare de codificar. Roteamento inteligente para modelos de IA GRATUITOS e de baixo custo com fallback automático.

Seu proxy universal de API — um endpoint, mais de 36 provedores, tempo de inatividade zero.

🌐 Internacionalização (i18n)

O painel do OmniRoute suporta múltiplos idiomas. Atualmente disponível em:

Idioma Código Estado
🇺🇸 Inglês en ✅ Completo
🇧🇷 Português (Brasil) pt-BR ✅ Completo

Para alterar o idioma: Clique no seletor de idioma (🇺🇸 PT) no cabeçalho do painel → selecione o idioma desejado.

Para adicionar um novo idioma:

  1. Crie src/i18n/messages/{codigo}.json baseado em en.json
  2. Adicione o código em src/i18n/config.tsLOCALES e LANGUAGES
  3. Reinicie o servidor

⚡ Início Rápido

# Instalar via npm
npx omniroute@latest

# Ou rodar do código-fonte
cp .env.example .env
npm install
PORT=20128 NEXT_PUBLIC_BASE_URL=http://localhost:20128 npm run dev

🐳 Docker

docker run -d --name omniroute -p 20128:20128 diegosouzapw/omniroute:latest

🔑 Funcionalidades Principais

  • 36+ provedores de IA — Claude, GPT, Gemini, Llama, Qwen, DeepSeek, e mais
  • Roteamento inteligente — Fallback automático entre provedores
  • Tradução de formato — OpenAI ↔ Claude ↔ Gemini automaticamente
  • Multi-conta — Múltiplas contas por provedor com seleção inteligente
  • Cache semântico — Reduz custos e latência
  • OAuth automático — Tokens renovam automaticamente
  • Combos personalizados — 6 estratégias de roteamento
  • Dashboard completo — Monitoramento, logs, análises, configurações
  • Ferramentas CLI — Configure Claude Code, Codex, Cursor, Cline com um clique
  • 100% TypeScript — Código limpo e digitado

📖 Documentação

Documento Descrição
Guia do Usuário Provedores, combos, CLI, implantar
Referência da API Todos os endpoints com exemplos
Solução de Problemas Problemas comuns e soluções
Arquitetura Arquitetura e portas do sistema
Contribuição Configuração de desenvolvimento e diretrizes
Deploy em VM Guia completo: VM + nginx + Cloudflare

📧Suporte

💬 Entre para a comunidade! Grupo WhatsApp — Tire dúvidas, compartilhe dicas e fique atualizado.


Construído com ❤️ para desenvolvedores que codificam 24 horas por dia, 7 dias por semana
omniroute.online