🌐 Languages: 🇺🇸 English | 🇧🇷 Português (Brasil) | 🇪🇸 Español | 🇫🇷 Français | 🇮🇹 Italiano | 🇷🇺 Русский | 🇨🇳 中文 (简体) | 🇩🇪 Deutsch | 🇮🇳 हिन्दी | 🇹🇭 ไทย | 🇺🇦 Українська | 🇸🇦 العربية | 🇯🇵 日本語 | 🇻🇳 Tiếng Việt | 🇧🇬 Български | 🇩🇰 Dansk | 🇫🇮 Suomi | 🇮🇱 עברית | 🇭🇺 Magyar | 🇮🇩 Bahasa Indonesia | 🇰🇷 한국어 | 🇲🇾 Bahasa Melayu | 🇳🇱 Nederlands | 🇳🇴 Norsk | 🇵🇹 Português (Portugal) | 🇷🇴 Română | 🇵🇱 Polski | 🇸🇰 Slovenčina | 🇸🇪 Svenska | 🇵🇭 Filipino
Última atualização: 18/02/2026
OmniRoute é um gateway de roteamento de IA local e painel construído em Next.js.
Ele fornece um único endpoint compatível com OpenAI (/v1/*) e roteia o tráfego entre vários provedores upstream com tradução, fallback, atualização de token e rastreamento de uso.
Capacidades principais:
- Superfície API compatível com OpenAI para CLI/ferramentas (28 provedores)
- Tradução de solicitação/resposta em formatos de provedores
- Fallback de combinação de modelos (sequência de vários modelos)
- Fallback em nível de conta (várias contas por provedor)
- Gerenciamento de conexão de provedor de chave OAuth + API
- Geração de incorporação via
/v1/embeddings(6 provedores, 9 modelos) - Geração de imagens via
/v1/images/generations(4 provedores, 9 modelos) - Pense na análise de tags (
<think>...</think>) para modelos de raciocínio - Sanitização de resposta para compatibilidade estrita com OpenAI SDK
- Normalização de funções (desenvolvedor→sistema, sistema→usuário) para compatibilidade entre provedores
- Conversão de saída estruturada (json_schema → Gemini responseSchema)
- Persistência local para provedores, chaves, aliases, combos, configurações, preços
- Acompanhamento de uso/custo e registro de solicitações
- Sincronização em nuvem opcional para sincronização de vários dispositivos/estado
- Lista de permissões/lista de bloqueio de IP para controle de acesso à API
- Pensando na gestão orçamentária (passthrough/auto/custom/adaptive)
- Injeção imediata do sistema global
- Rastreamento de sessão e impressão digital
- Limitação de taxa aprimorada por conta com perfis específicos do provedor
- Padrão de disjuntor para resiliência do provedor
- Proteção de rebanho anti-trovão com bloqueio mutex
- Cache de desduplicação de solicitação baseada em assinatura
- Camada de domínio: disponibilidade do modelo, regras de custo, política de fallback, política de bloqueio
- Persistência de estado de domínio (cache write-through SQLite para fallbacks, orçamentos, bloqueios, disjuntores)
- Mecanismo de política para avaliação centralizada de solicitações (bloqueio → orçamento → fallback)
- Solicitar telemetria com agregação de latência p50/p95/p99
- ID de correlação (X-Request-Id) para rastreamento ponta a ponta
- Registro de auditoria de conformidade com cancelamento por chave de API
- Estrutura de avaliação para garantia de qualidade LLM
- Painel de UI de resiliência com status do disjuntor em tempo real
- Provedores OAuth modulares (12 módulos individuais em
src/lib/oauth/providers/)
Modelo de tempo de execução primário:
- As rotas do aplicativo Next.js em
src/app/api/*implementam APIs de painel e APIs de compatibilidade - Um núcleo SSE/roteamento compartilhado em
src/sse/*+open-sse/*lida com execução, tradução, streaming, fallback e uso do provedor
- Tempo de execução do gateway local
- APIs de gerenciamento de painel
- Autenticação do provedor e atualização de token
- Solicitar tradução e streaming SSE
- Estado local + persistência de uso
- Orquestração opcional de sincronização em nuvem
- Implementação de serviço em nuvem por trás de
NEXT_PUBLIC_CLOUD_URL - Plano de controle/SLA do provedor fora do processo local
- Os próprios binários CLI externos (Claude CLI, Codex CLI, etc.)
flowchart LR
subgraph Clients[Developer Clients]
C1[Claude Code]
C2[Codex CLI]
C3[OpenClaw / Droid / Cline / Continue / Roo]
C4[Custom OpenAI-compatible clients]
BROWSER[Browser Dashboard]
end
subgraph Router[OmniRoute Local Process]
API[V1 Compatibility API\n/v1/*]
DASH[Dashboard + Management API\n/api/*]
CORE[SSE + Translation Core\nopen-sse + src/sse]
DB[(db.json)]
UDB[(usage.json + log.txt)]
end
subgraph Upstreams[Upstream Providers]
P1[OAuth Providers\nClaude/Codex/Gemini/Qwen/iFlow/GitHub/Kiro/Cursor/Antigravity]
P2[API Key Providers\nOpenAI/Anthropic/OpenRouter/GLM/Kimi/MiniMax\nDeepSeek/Groq/xAI/Mistral/Perplexity\nTogether/Fireworks/Cerebras/Cohere/NVIDIA]
P3[Compatible Nodes\nOpenAI-compatible / Anthropic-compatible]
end
subgraph Cloud[Optional Cloud Sync]
CLOUD[Cloud Sync Endpoint\nNEXT_PUBLIC_CLOUD_URL]
end
C1 --> API
C2 --> API
C3 --> API
C4 --> API
BROWSER --> DASH
API --> CORE
DASH --> DB
CORE --> DB
CORE --> UDB
CORE --> P1
CORE --> P2
CORE --> P3
DASH --> CLOUD
Diretórios principais:
src/app/api/v1/*esrc/app/api/v1beta/*para APIs de compatibilidadesrc/app/api/*para APIs de gerenciamento/configuração- Próximas reescritas em
next.config.mjsmapeiam/v1/*para/api/v1/*
Rotas de compatibilidade importantes:
src/app/api/v1/chat/completions/route.tssrc/app/api/v1/messages/route.tssrc/app/api/v1/responses/route.tssrc/app/api/v1/models/route.ts— inclui modelos personalizados comcustom: truesrc/app/api/v1/embeddings/route.ts— geração de incorporação (6 provedores)src/app/api/v1/images/generations/route.ts— geração de imagens (4+ provedores incluindo Antigravidade/Nebius)src/app/api/v1/messages/count_tokens/route.tssrc/app/api/v1/providers/[provider]/chat/completions/route.ts— bate-papo dedicado por provedorsrc/app/api/v1/providers/[provider]/embeddings/route.ts— embeddings dedicados por provedorsrc/app/api/v1/providers/[provider]/images/generations/route.ts— imagens dedicadas por provedorsrc/app/api/v1beta/models/route.tssrc/app/api/v1beta/models/[...path]/route.ts
Domínios de gerenciamento:
- Autenticação/configurações:
src/app/api/auth/*,src/app/api/settings/* - Provedores/conexões:
src/app/api/providers* - Nós do provedor:
src/app/api/provider-nodes* - Modelos personalizados:
src/app/api/provider-models(GET/POST/DELETE) - Catálogo de modelos:
src/app/api/models/catalog(GET) - Configuração de proxy:
src/app/api/settings/proxy(GET/PUT/DELETE) +src/app/api/settings/proxy/test(POST) - OAuth:
src/app/api/oauth/* - Chaves/aliases/combos/preços:
src/app/api/keys*,src/app/api/models/alias,src/app/api/combos*,src/app/api/pricing - Uso:
src/app/api/usage/* - Sincronização/nuvem:
src/app/api/sync/*,src/app/api/cloud/* - Ajudantes de ferramentas CLI:
src/app/api/cli-tools/* - Filtro IP:
src/app/api/settings/ip-filter(GET/PUT) - Orçamento pensado:
src/app/api/settings/thinking-budget(GET/PUT) - Prompt do sistema:
src/app/api/settings/system-prompt(GET/PUT) - Sessões:
src/app/api/sessions(GET) - Limites de taxa:
src/app/api/rate-limits(GET) - Resiliência:
src/app/api/resilience(GET/PATCH) — perfis de provedor, disjuntor, estado limite de taxa - Redefinição de resiliência:
src/app/api/resilience/reset(POST) — redefinir disjuntores + resfriamento - Estatísticas de cache:
src/app/api/cache/stats(GET/DELETE) - Disponibilidade do modelo:
src/app/api/models/availability(GET/POST) - Telemetria:
src/app/api/telemetry/summary(GET) - Orçamento:
src/app/api/usage/budget(GET/POST) - Cadeias de fallback:
src/app/api/fallback/chains(GET/POST/DELETE) - Auditoria de conformidade:
src/app/api/compliance/audit-log(GET) - Avaliações:
src/app/api/evals(GET/POST),src/app/api/evals/[suiteId](GET) - Políticas:
src/app/api/policies(GET/POST)
Principais módulos de fluxo:
- Entrada:
src/sse/handlers/chat.ts - Orquestração principal:
open-sse/handlers/chatCore.ts - Adaptadores de execução do provedor:
open-sse/executors/* - Detecção de formato/configuração do provedor:
open-sse/services/provider.ts - Análise/resolução de modelo:
src/sse/services/model.ts,open-sse/services/model.ts - Lógica de substituição da conta:
open-sse/services/accountFallback.ts - Registro de tradução:
open-sse/translator/index.ts - Transformações de fluxo:
open-sse/utils/stream.ts,open-sse/utils/streamHandler.ts - Extração/normalização de uso:
open-sse/utils/usageTracking.ts - Pense no analisador de tags:
open-sse/utils/thinkTagParser.ts - Manipulador de incorporação:
open-sse/handlers/embeddings.ts - Incorporação de registro de provedor:
open-sse/config/embeddingRegistry.ts - Manipulador de geração de imagem:
open-sse/handlers/imageGeneration.ts - Registro do provedor de imagens:
open-sse/config/imageRegistry.ts - Sanitização de resposta:
open-sse/handlers/responseSanitizer.ts - Normalização de função:
open-sse/services/roleNormalizer.ts
Serviços (lógica de negócios):
- Seleção/pontuação de conta:
open-sse/services/accountSelector.ts - Gerenciamento do ciclo de vida do contexto:
open-sse/services/contextManager.ts - Aplicação do filtro IP:
open-sse/services/ipFilter.ts - Acompanhamento de sessão:
open-sse/services/sessionManager.ts - Solicitar desduplicação:
open-sse/services/signatureCache.ts - Injeção de prompt do sistema:
open-sse/services/systemPrompt.ts - Pensando na gestão orçamentária:
open-sse/services/thinkingBudget.ts - Roteamento de modelo curinga:
open-sse/services/wildcardRouter.ts - Gerenciamento de limite de taxa:
open-sse/services/rateLimitManager.ts - Disjuntor:
open-sse/services/circuitBreaker.ts
Módulos da camada de domínio:
- Disponibilidade do modelo:
src/lib/domain/modelAvailability.ts - Regras/orçamentos de custos:
src/lib/domain/costRules.ts - Política de substituto:
src/lib/domain/fallbackPolicy.ts - Resolvedor combinado:
src/lib/domain/comboResolver.ts - Política de bloqueio:
src/lib/domain/lockoutPolicy.ts - Mecanismo de política:
src/domain/policyEngine.ts— bloqueio centralizado → orçamento → avaliação alternativa - Catálogo de códigos de erro:
src/lib/domain/errorCodes.ts - ID da solicitação:
src/lib/domain/requestId.ts - Tempo limite de busca:
src/lib/domain/fetchTimeout.ts - Solicitar telemetria:
src/lib/domain/requestTelemetry.ts - Conformidade/auditoria:
src/lib/domain/compliance/index.ts - Corredor de avaliação:
src/lib/domain/evalRunner.ts - Persistência de estado de domínio:
src/lib/db/domainState.ts— SQLite CRUD para cadeias de fallback, orçamentos, histórico de custos, estado de bloqueio, disjuntores
Módulos do provedor OAuth (12 arquivos individuais em src/lib/oauth/providers/):
- Índice de registro:
src/lib/oauth/providers/index.ts - Provedores individuais:
claude.ts,codex.ts,gemini.ts,antigravity.ts,iflow.ts,qwen.ts,kimi-coding.ts,github.ts,kiro.ts,cursor.ts,kilocode.ts,cline.ts - Thin wrapper:
src/lib/oauth/providers.ts— reexportações de módulos individuais
Banco de dados de estado primário:
src/lib/localDb.ts- arquivo:
${DATA_DIR}/db.json(ou$XDG_CONFIG_HOME/omniroute/db.jsonquando definido, caso contrário,~/.omniroute/db.json) - entidades: ProviderConnections, ProviderNodes, modelAliases, combos, apiKeys, configurações, preços, customModels, proxyConfig, ipFilter, thinkingBudget, systemPrompt
Banco de dados de uso:
src/lib/usageDb.ts- arquivos:
${DATA_DIR}/usage.json,${DATA_DIR}/log.txt,${DATA_DIR}/call_logs/ - segue a mesma política de diretório base de
localDb(DATA_DIR, entãoXDG_CONFIG_HOME/omniroutequando definido) - decomposto em submódulos focados:
migrations.ts,usageHistory.ts,costCalculator.ts,usageStats.ts,callLogs.ts
Banco de dados de estado de domínio (SQLite):
src/lib/db/domainState.ts— Operações CRUD para estado de domínio- Tabelas (criadas em
src/lib/db/core.ts):domain_fallback_chains,domain_budgets,domain_cost_history,domain_lockout_state,domain_circuit_breakers - Padrão de cache write-through: os mapas na memória são autoritativos em tempo de execução; as mutações são escritas de forma síncrona no SQLite; o estado é restaurado do banco de dados na inicialização a frio
- Autenticação de cookie do painel:
src/proxy.ts,src/app/api/auth/login/route.ts - Geração/verificação de chave de API:
src/shared/utils/apiKey.ts - Os segredos do provedor persistiram nas entradas
providerConnections - Suporte a proxy de saída via
open-sse/utils/proxyFetch.ts(env vars) eopen-sse/utils/networkProxy.ts(configurável por provedor ou global)
- Inicialização do agendador:
src/lib/initCloudSync.ts,src/shared/services/initializeCloudSync.ts - Tarefa periódica:
src/shared/services/cloudSyncScheduler.ts - Rota de controle:
src/app/api/sync/cloud/route.ts
sequenceDiagram
autonumber
participant Client as CLI/SDK Client
participant Route as /api/v1/chat/completions
participant Chat as src/sse/handlers/chat
participant Core as open-sse/handlers/chatCore
participant Model as Model Resolver
participant Auth as Credential Selector
participant Exec as Provider Executor
participant Prov as Upstream Provider
participant Stream as Stream Translator
participant Usage as usageDb
Client->>Route: POST /v1/chat/completions
Route->>Chat: handleChat(request)
Chat->>Model: parse/resolve model or combo
alt Combo model
Chat->>Chat: iterate combo models (handleComboChat)
end
Chat->>Auth: getProviderCredentials(provider)
Auth-->>Chat: active account + tokens/api key
Chat->>Core: handleChatCore(body, modelInfo, credentials)
Core->>Core: detect source format
Core->>Core: translate request to target format
Core->>Exec: execute(provider, transformedBody)
Exec->>Prov: upstream API call
Prov-->>Exec: SSE/JSON response
Exec-->>Core: response + metadata
alt 401/403
Core->>Exec: refreshCredentials()
Exec-->>Core: updated tokens
Core->>Exec: retry request
end
Core->>Stream: translate/normalize stream to client format
Stream-->>Client: SSE chunks / JSON response
Stream->>Usage: extract usage + persist history/log
flowchart TD
A[Incoming model string] --> B{Is combo name?}
B -- Yes --> C[Load combo models sequence]
B -- No --> D[Single model path]
C --> E[Try model N]
E --> F[Resolve provider/model]
D --> F
F --> G[Select account credentials]
G --> H{Credentials available?}
H -- No --> I[Return provider unavailable]
H -- Yes --> J[Execute request]
J --> K{Success?}
K -- Yes --> L[Return response]
K -- No --> M{Fallback-eligible error?}
M -- No --> N[Return error]
M -- Yes --> O[Mark account unavailable cooldown]
O --> P{Another account for provider?}
P -- Yes --> G
P -- No --> Q{In combo with next model?}
Q -- Yes --> E
Q -- No --> R[Return all unavailable]
As decisões de fallback são orientadas por open-sse/services/accountFallback.ts usando códigos de status e heurísticas de mensagens de erro.
sequenceDiagram
autonumber
participant UI as Dashboard UI
participant OAuth as /api/oauth/[provider]/[action]
participant ProvAuth as Provider Auth Server
participant DB as localDb
participant Test as /api/providers/[id]/test
participant Exec as Provider Executor
UI->>OAuth: GET authorize or device-code
OAuth->>ProvAuth: create auth/device flow
ProvAuth-->>OAuth: auth URL or device code payload
OAuth-->>UI: flow data
UI->>OAuth: POST exchange or poll
OAuth->>ProvAuth: token exchange/poll
ProvAuth-->>OAuth: access/refresh tokens
OAuth->>DB: createProviderConnection(oauth data)
OAuth-->>UI: success + connection id
UI->>Test: POST /api/providers/[id]/test
Test->>Exec: validate credentials / optional refresh
Exec-->>Test: valid or refreshed token info
Test->>DB: update status/tokens/errors
Test-->>UI: validation result
A atualização durante o tráfego ativo é executada dentro de open-sse/handlers/chatCore.ts por meio do executor refreshCredentials().
sequenceDiagram
autonumber
participant UI as Endpoint Page UI
participant Sync as /api/sync/cloud
participant DB as localDb
participant Cloud as External Cloud Sync
participant Claude as ~/.claude/settings.json
UI->>Sync: POST action=enable
Sync->>DB: set cloudEnabled=true
Sync->>DB: ensure API key exists
Sync->>Cloud: POST /sync/{machineId} (providers/aliases/combos/keys)
Cloud-->>Sync: sync result
Sync->>Cloud: GET /{machineId}/v1/verify
Sync-->>UI: enabled + verification status
UI->>Sync: POST action=sync
Sync->>Cloud: POST /sync/{machineId}
Cloud-->>Sync: remote data
Sync->>DB: update newer local tokens/status
Sync-->>UI: synced
UI->>Sync: POST action=disable
Sync->>DB: set cloudEnabled=false
Sync->>Cloud: DELETE /sync/{machineId}
Sync->>Claude: switch ANTHROPIC_BASE_URL back to local (if needed)
Sync-->>UI: disabled
A sincronização periódica é acionada por CloudSyncScheduler quando a nuvem está habilitada.
erDiagram
SETTINGS ||--o{ PROVIDER_CONNECTION : controls
PROVIDER_NODE ||--o{ PROVIDER_CONNECTION : backs_compatible_provider
PROVIDER_CONNECTION ||--o{ USAGE_ENTRY : emits_usage
SETTINGS {
boolean cloudEnabled
number stickyRoundRobinLimit
boolean requireLogin
string password_hash
string fallbackStrategy
json rateLimitDefaults
json providerProfiles
}
PROVIDER_CONNECTION {
string id
string provider
string authType
string name
number priority
boolean isActive
string apiKey
string accessToken
string refreshToken
string expiresAt
string testStatus
string lastError
string rateLimitedUntil
json providerSpecificData
}
PROVIDER_NODE {
string id
string type
string name
string prefix
string apiType
string baseUrl
}
MODEL_ALIAS {
string alias
string targetModel
}
COMBO {
string id
string name
string[] models
}
API_KEY {
string id
string name
string key
string machineId
}
USAGE_ENTRY {
string provider
string model
number prompt_tokens
number completion_tokens
string connectionId
string timestamp
}
CUSTOM_MODEL {
string id
string name
string providerId
}
PROXY_CONFIG {
string global
json providers
}
IP_FILTER {
string mode
string[] allowlist
string[] blocklist
}
THINKING_BUDGET {
string mode
number customBudget
string effortLevel
}
SYSTEM_PROMPT {
boolean enabled
string prompt
string position
}
Arquivos de armazenamento físico:
- estado principal:
${DATA_DIR}/db.json(ou$XDG_CONFIG_HOME/omniroute/db.jsonquando definido, caso contrário,~/.omniroute/db.json) - estatísticas de uso:
${DATA_DIR}/usage.json - solicitar linhas de registro:
${DATA_DIR}/log.txt - sessões opcionais de depuração de tradução/solicitação:
<repo>/logs/...
flowchart LR
subgraph LocalHost[Developer Host]
CLI[CLI Tools]
Browser[Dashboard Browser]
end
subgraph ContainerOrProcess[OmniRoute Runtime]
Next[Next.js Server\nPORT=20128]
Core[SSE Core + Executors]
MainDB[(db.json)]
UsageDB[(usage.json/log.txt)]
end
subgraph External[External Services]
Providers[AI Providers]
SyncCloud[Cloud Sync Service]
end
CLI --> Next
Browser --> Next
Next --> Core
Next --> MainDB
Core --> MainDB
Core --> UsageDB
Core --> Providers
Next --> SyncCloud
src/app/api/v1/*,src/app/api/v1beta/*: APIs de compatibilidadesrc/app/api/v1/providers/[provider]/*: rotas dedicadas por provedor (chat, embeddings, imagens)src/app/api/providers*: provedor CRUD, validação, testesrc/app/api/provider-nodes*: gerenciamento de nó compatível personalizadosrc/app/api/provider-models: gerenciamento de modelo personalizado (CRUD)src/app/api/models/catalog: API de catálogo de modelos completo (todos os tipos agrupados por provedor)src/app/api/oauth/*: fluxos OAuth/código do dispositivosrc/app/api/keys*: ciclo de vida da chave de API localsrc/app/api/models/alias: gerenciamento de aliassrc/app/api/combos*: gerenciamento de combinação alternativasrc/app/api/pricing: substituições de preços para cálculo de custossrc/app/api/settings/proxy: configuração de proxy (GET/PUT/DELETE)src/app/api/settings/proxy/test: teste de conectividade de proxy de saída (POST)src/app/api/usage/*: APIs de uso e registrossrc/app/api/sync/*+src/app/api/cloud/*: sincronização na nuvem e ajudantes voltados para a nuvemsrc/app/api/cli-tools/*: gravadores/verificadores de configuração CLI locaissrc/app/api/settings/ip-filter: lista de permissões/lista de bloqueios de IP (GET/PUT)src/app/api/settings/thinking-budget: configuração do orçamento do token de pensamento (GET/PUT)src/app/api/settings/system-prompt: prompt global do sistema (GET/PUT)src/app/api/sessions: listagem de sessões ativas (GET)src/app/api/rate-limits: status de limite de taxa por conta (GET)
src/sse/handlers/chat.ts: análise de solicitação, tratamento de combinação, loop de seleção de contaopen-sse/handlers/chatCore.ts: tradução, envio do executor, manipulação de novas tentativas/atualizações, configuração de streamopen-sse/executors/*: rede específica do provedor e comportamento do formato
open-sse/translator/index.ts: registro e orquestração do tradutor- Solicitar tradutores:
open-sse/translator/request/* - Tradutores de resposta:
open-sse/translator/response/* - Constantes de formato:
open-sse/translator/formats.ts
src/lib/localDb.ts: configuração/estado persistentesrc/lib/usageDb.ts: histórico de uso e registros de solicitação contínua
Cada provedor tem um executor especializado que estende BaseExecutor (em open-sse/executors/base.ts), que fornece construção de URL, construção de cabeçalho, nova tentativa com espera exponencial, ganchos de atualização de credenciais e o método de orquestração execute().
| Executor | Fornecedor(es) | Tratamento Especial |
|---|---|---|
DefaultExecutor |
OpenAI, Claude, Gemini, Qwen, iFlow, OpenRouter, GLM, Kimi, MiniMax, DeepSeek, Groq, xAI, Mistral, Perplexity, Juntos, Fireworks, Cerebras, Cohere, NVIDIA | Configuração dinâmica de URL/cabeçalho por provedor |
AntigravityExecutor |
Antigravidade do Google | IDs de projeto/sessão personalizados, análise repetida após |
CodexExecutor |
Códice OpenAI | Injeta instruções do sistema, força esforço de raciocínio |
CursorExecutor |
Cursor IDE | Protocolo ConnectRPC, codificação Protobuf, assinatura de solicitação via checksum |
GithubExecutor |
Copiloto GitHub | Atualização de token do copiloto, cabeçalhos que imitam VSCode |
KiroExecutor |
AWS CodeWhisperer/Kiro | Formato binário AWS EventStream → conversão SSE |
GeminiCLIExecutor |
Gêmeos CLI | Ciclo de atualização do token OAuth do Google |
Todos os outros provedores (incluindo nós compatíveis personalizados) usam DefaultExecutor.
| Provedor | Formato | Autenticação | Transmitir | Não-transmissão | Atualização de token | API de uso |
|---|---|---|---|---|---|---|
| Cláudio | Cláudio | Chave API/OAuth | ✅ | ✅ | ✅ | |
| Gêmeos | gêmeos | Chave API/OAuth | ✅ | ✅ | ✅ | |
| Gêmeos CLI | gêmeo-cli | OAuth | ✅ | ✅ | ✅ | |
| Antigravidade | antigravidade | OAuth | ✅ | ✅ | ✅ | ✅ API de cota completa |
| OpenAI | abrirai | Chave API | ✅ | ✅ | ❌ | ❌ |
| Códice | respostas openai | OAuth | ✅ forçado | ❌ | ✅ | ✅ Limites de taxas |
| Copiloto GitHub | abrirai | OAuth + token de copiloto | ✅ | ✅ | ✅ | ✅ Instantâneos de cota |
| Cursor | cursor | Soma de verificação personalizada | ✅ | ✅ | ❌ | ❌ |
| Kiro | Kiro | AWS SSO OIDC | ✅ (EventStream) | ❌ | ✅ | ✅ Limites de uso |
| Qwen | abrirai | OAuth | ✅ | ✅ | ✅ | |
| iFlow | abrirai | OAuth (Básico) | ✅ | ✅ | ✅ | |
| OpenRouter | abrirai | Chave API | ✅ | ✅ | ❌ | ❌ |
| GLM/Kimi/MiniMax | Cláudio | Chave API | ✅ | ✅ | ❌ | ❌ |
| DeepSeek | abrirai | Chave API | ✅ | ✅ | ❌ | ❌ |
| Groq | abrirai | Chave API | ✅ | ✅ | ❌ | ❌ |
| xAI (Groque) | abrirai | Chave API | ✅ | ✅ | ❌ | ❌ |
| Mistral | abrirai | Chave API | ✅ | ✅ | ❌ | ❌ |
| Perplexidade | abrirai | Chave API | ✅ | ✅ | ❌ | ❌ |
| Juntos IA | abrirai | Chave API | ✅ | ✅ | ❌ | ❌ |
| IA de fogos de artifício | abrirai | Chave API | ✅ | ✅ | ❌ | ❌ |
| Cérebros | abrirai | Chave API | ✅ | ✅ | ❌ | ❌ |
| Coerente | abrirai | Chave API | ✅ | ✅ | ❌ | ❌ |
| NVIDIA NIM | abrirai | Chave API | ✅ | ✅ | ❌ | ❌ |
Os formatos de origem detectados incluem:
openaiopenai-responsesclaudegemini
Os formatos de destino incluem:
- Bate-papo/respostas OpenAI -Cláudio
- Envelope Gemini/Gemini-CLI/Antigravidade -Kiro
- Cursor
As traduções usam OpenAI como formato de hub — todas as conversões passam pelo OpenAI como intermediário:
Source Format → OpenAI (hub) → Target Format
As traduções são selecionadas dinamicamente com base no formato da carga útil de origem e no formato de destino do provedor.
Camadas de processamento adicionais no pipeline de tradução:
- Sanitização de respostas — Remove campos não padrão de respostas no formato OpenAI (streaming e não streaming) para garantir conformidade estrita com o SDK
- Normalização de funções — Converte
developer→systempara alvos não-OpenAI; mesclasystem→userpara modelos que rejeitam a função do sistema (GLM, ERNIE) - Extração de tag Think — Analisa blocos
<think>...</think>do conteúdo no camporeasoning_content - Saída estruturada — Converte OpenAI
response_format.json_schemaemresponseMimeType+responseSchemado Gemini
| Ponto final | Formato | Manipulador |
|---|---|---|
POST /v1/chat/completions |
Bate-papo OpenAI | src/sse/handlers/chat.ts |
POST /v1/messages |
Mensagens de Cláudio | Mesmo manipulador (detectado automaticamente) |
POST /v1/responses |
Respostas OpenAI | open-sse/handlers/responsesHandler.ts |
POST /v1/embeddings |
Incorporações OpenAI | open-sse/handlers/embeddings.ts |
GET /v1/embeddings |
Listagem de modelos | Rota API |
POST /v1/images/generations |
Imagens OpenAI | open-sse/handlers/imageGeneration.ts |
GET /v1/images/generations |
Listagem de modelos | Rota API |
POST /v1/providers/{provider}/chat/completions |
Bate-papo OpenAI | Dedicado por provedor com validação de modelo |
POST /v1/providers/{provider}/embeddings |
Incorporações OpenAI | Dedicado por provedor com validação de modelo |
POST /v1/providers/{provider}/images/generations |
Imagens OpenAI | Dedicado por provedor com validação de modelo |
POST /v1/messages/count_tokens |
Contagem de tokens de Claude | Rota API |
GET /v1/models |
Lista de modelos OpenAI | Rota API (chat + incorporação + imagem + modelos customizados) |
GET /api/models/catalog |
Catálogo | Todos os modelos agrupados por fornecedor + tipo |
POST /v1beta/models/*:streamGenerateContent |
Nativo de Gêmeos | Rota API |
GET/PUT/DELETE /api/settings/proxy |
Configuração de proxy | Configuração de proxy de rede |
POST /api/settings/proxy/test |
Conectividade proxy | Endpoint de teste de integridade/conectividade do proxy |
GET/POST/DELETE /api/provider-models |
Modelos personalizados | Gestão de modelos customizados por provedor |
O manipulador de bypass (open-sse/utils/bypassHandler.ts) intercepta solicitações "descartáveis" conhecidas da CLI de Claude — pings de aquecimento, extrações de títulos e contagens de tokens — e retorna uma resposta falsa sem consumir tokens do provedor upstream. Isso é acionado somente quando User-Agent contém claude-cli.
O registrador de solicitações (open-sse/utils/requestLogger.ts) fornece um pipeline de registro de depuração de 7 estágios, desabilitado por padrão, habilitado por meio de ENABLE_REQUEST_LOGS=true:
1_req_client.json → 2_req_source.json → 3_req_openai.json → 4_req_target.json
→ 5_res_provider.txt → 6_res_openai.txt → 7_res_client.txt
Os arquivos são gravados em <repo>/logs/<session>/ para cada sessão de solicitação.
- resfriamento da conta do provedor em erros transitórios/taxa/autenticação
- fallback da conta antes da falha na solicitação
- modelo combinado substituto quando o caminho do modelo/provedor atual se esgota
- pré-verificação e atualização com nova tentativa para provedores atualizáveis
- Nova tentativa 401/403 após tentativa de atualização no caminho principal
- controlador de fluxo com reconhecimento de desconexão
- fluxo de tradução com liberação de fim de fluxo e manipulação de
[DONE] - fallback de estimativa de uso quando faltam metadados de uso do provedor
- erros de sincronização aparecem, mas o tempo de execução local continua
- o agendador tem lógica com capacidade de repetição, mas a execução periódica atualmente chama a sincronização de tentativa única por padrão
- Migração/reparo de formato de banco de dados para chaves ausentes
- proteções de redefinição JSON corrompidas para localDb e usageDb
Fontes de visibilidade em tempo de execução:
- registros do console de
src/sse/utils/logger.ts - agregados de uso por solicitação em
usage.json - registro de status da solicitação textual em
log.txt - registros opcionais de solicitação/tradução profunda em
logs/quandoENABLE_REQUEST_LOGS=true - endpoints de uso do painel (
/api/usage/*) para consumo de UI
- Segredo JWT (
JWT_SECRET) protege a verificação/assinatura de cookies da sessão do painel - O substituto de senha inicial (
INITIAL_PASSWORD, padrão123456) deve ser substituído em implantações reais - O segredo HMAC da chave de API (
API_KEY_SECRET) protege o formato de chave de API local gerado - Os segredos do provedor (chaves/tokens de API) persistem no banco de dados local e devem ser protegidos no nível do sistema de arquivos
- Os endpoints de sincronização em nuvem dependem da semântica de autenticação de chave de API + ID de máquina
Variáveis de ambiente usadas ativamente pelo código:
- Aplicativo/autenticação:
JWT_SECRET,INITIAL_PASSWORD - Armazenamento:
DATA_DIR - Comportamento do nó compatível:
ALLOW_MULTI_CONNECTIONS_PER_COMPAT_NODE - Substituição opcional da base de armazenamento (Linux/macOS quando
DATA_DIRnão definido):XDG_CONFIG_HOME - Hash de segurança:
API_KEY_SECRET,MACHINE_ID_SALT - Registro:
ENABLE_REQUEST_LOGS - URL de sincronização/nuvem:
NEXT_PUBLIC_BASE_URL,NEXT_PUBLIC_CLOUD_URL - Proxy de saída:
HTTP_PROXY,HTTPS_PROXY,ALL_PROXY,NO_PROXYe variantes minúsculas - Sinalizadores de recurso SOCKS5:
ENABLE_SOCKS5_PROXY,NEXT_PUBLIC_ENABLE_SOCKS5_PROXY - Auxiliares de plataforma/tempo de execução (não configuração específica do aplicativo):
APPDATA,NODE_ENV,PORT,HOSTNAME
usageDbelocalDbagora compartilham a mesma política de diretório base (DATA_DIR->XDG_CONFIG_HOME/omniroute->~/.omniroute) com migração de arquivo legado./api/v1/route.tsretorna uma lista de modelos estáticos e não é a principal fonte de modelos usada por/v1/models.- O registrador de solicitações grava cabeçalhos/corpo completos quando habilitado; trate o diretório de log como confidencial.
- O comportamento da nuvem depende do
NEXT_PUBLIC_BASE_URLcorreto e da acessibilidade do endpoint na nuvem. - O diretório
open-sse/é publicado como o@omniroute/open-ssepacote de espaço de trabalho npm. O código-fonte o importa via@omniroute/open-sse/...(resolvido por Next.jstranspilePackages). Os caminhos de arquivo neste documento ainda usam o nome de diretórioopen-sse/para consistência. - Os gráficos no painel usam Recharts (baseados em SVG) para visualizações analíticas interativas e acessíveis (gráficos de barras de uso de modelo, tabelas de detalhamento de fornecedores com taxas de sucesso).
- Os testes E2E usam Playwright (
tests/e2e/), executados vianpm run test:e2e. Os testes de unidade usam o executor de testes Node.js (tests/unit/), executado por meio denpm run test:plan3. O código-fonte emsrc/é TypeScript (.ts/.tsx); o espaço de trabalhoopen-sse/permanece JavaScript (.js). - A página de configurações é organizada em 5 guias: Segurança, Roteamento (6 estratégias globais: preenchimento primeiro, round-robin, p2c, aleatório, menos usado, com custo otimizado), Resiliência (limites de taxa editáveis, disjuntor, políticas), IA (pensando no orçamento, prompt do sistema, cache de prompt), Avançado (proxy).
- Construir a partir da fonte:
npm run build - Construir imagem Docker:
docker build -t omniroute . - Inicie o serviço e verifique:
GET /api/settingsGET /api/v1/models- O URL base de destino da CLI deve ser
http://<host>:20128/v1quandoPORT=20128