Stop nooit met coderen. Slimme routering naar GRATIS en voordelige AI-modellen met automatische terugval.
Uw universele API-proxy: één eindpunt, meer dan 36 providers, geen downtime.
Chatvoltooiingen • Insluitingen • Afbeelding genereren • Audio • Herrangschikking • 100% TypeScript
Verbind elke AI-aangedreven IDE- of CLI-tool via OmniRoute: gratis API-gateway voor onbeperkte codering.
|
OpenClaw ⭐ 205K |
NanoBot ⭐ 20.9K |
PicoClaw ⭐ 14.6K |
ZeroClaw ⭐ 9.9K |
IronClaw ⭐ 2.1K |
|
OpenCode ⭐ 106K |
Codex CLI ⭐ 60.8K |
Claude Code ⭐ 67.3K |
Gemini CLI ⭐ 94.7K |
Kilo Code ⭐ 15.5K |
📡 Alle agenten maken verbinding via http://localhost:20128/v1 of http://cloud.omniroute.online/v1 — één configuratie, onbeperkte modellen en quota
🌐 Website • 🚀 Quick Start • 💡 Features • 📖 Docs • 💰 Pricing • 💬 WhatsApp
🌐 Available in: 🇺🇸 English | 🇧🇷 Português (Brasil) | 🇪🇸 Español | 🇫🇷 Français | 🇮🇹 Italiano | 🇷🇺 Русский | 🇨🇳 中文 (简体) | 🇩🇪 Deutsch | 🇮🇳 हिन्दी | 🇹🇭 ไทย | 🇺🇦 Українська | 🇸🇦 العربية | 🇯🇵 日本語 | 🇻🇳 Tiếng Việt | 🇧🇬 Български | 🇩🇰 Dansk | 🇫🇮 Suomi | 🇮🇱 עברית | 🇭🇺 Magyar | 🇮🇩 Bahasa Indonesia | 🇰🇷 한국어 | 🇲🇾 Bahasa Melayu | 🇳🇱 Nederlands | 🇳🇴 Norsk | 🇵🇹 Português (Portugal) | 🇷🇴 Română | 🇵🇱 Polski | 🇸🇰 Slovenčina | 🇸🇪 Svenska | 🇵🇭 Filipino
Stop met het verspillen van geld en het bereiken van grenzen:
Het abonnementsquotum verloopt elke maand ongebruikt
Snelheidslimieten voorkomen dat u halverwege codeert
Dure API's ($20-50/maand per provider)
Handmatig schakelen tussen providers
OmniRoute lost dit op:
- ✅ Maximaliseer abonnementen - Houd quota bij, gebruik elk bit voordat u het opnieuw instelt
- ✅ Automatische fallback - Abonnement → API-sleutel → Goedkoop → Gratis, geen downtime
- ✅ Multi-account - Round-robin tussen accounts per provider
- ✅ Universeel - Werkt met Claude Code, Codex, Gemini CLI, Cursor, Cline, OpenClaw, elke CLI-tool
┌─────────────┐
│ Your CLI │ (Claude Code, Codex, Gemini CLI, OpenClaw, Cursor, Cline...)
│ Tool │
└──────┬──────┘
│ http://localhost:20128/v1
↓
┌─────────────────────────────────────────┐
│ OmniRoute (Smart Router) │
│ • Format translation (OpenAI ↔ Claude) │
│ • Quota tracking + Embeddings + Images │
│ • Auto token refresh │
└──────┬──────────────────────────────────┘
│
├─→ [Tier 1: SUBSCRIPTION] Claude Code, Codex, Gemini CLI
│ ↓ quota exhausted
├─→ [Tier 2: API KEY] DeepSeek, Groq, xAI, Mistral, NVIDIA NIM, etc.
│ ↓ budget limit
├─→ [Tier 3: CHEAP] GLM ($0.6/1M), MiniMax ($0.2/1M)
│ ↓ budget limit
└─→ [Tier 4: FREE] iFlow, Qwen, Kiro (unlimited)
Result: Never stop coding, minimal cost
Every developer using AI tools faces these problems daily. OmniRoute was built to solve them all — from cost overruns to regional blocks, from broken OAuth flows to zero observability.
💸 1. "I pay for an expensive subscription but still get interrupted by limits"
Developers pay $20–200/month for Claude Pro, Codex Pro, or GitHub Copilot. Even paying, quota has a ceiling — 5h of usage, weekly limits, or per-minute rate limits. Mid-coding session, the provider stops responding and the developer loses flow and productivity.
How OmniRoute solves it:
- Smart 4-Tier Fallback — If subscription quota runs out, automatically redirects to API Key → Cheap → Free with zero manual intervention
- Real-Time Quota Tracking — Shows token consumption in real-time with reset countdown (5h, daily, weekly)
- Multi-Account Support — Multiple accounts per provider with auto round-robin — when one runs out, switches to the next
- Custom Combos — Customizable fallback chains with 6 balancing strategies (fill-first, round-robin, P2C, random, least-used, cost-optimized)
- Codex Business Quotas — Business/Team workspace quota monitoring directly in the dashboard
🔌 2. "I need to use multiple providers but each has a different API"
OpenAI uses one format, Claude (Anthropic) uses another, Gemini yet another. If a dev wants to test models from different providers or fallback between them, they need to reconfigure SDKs, change endpoints, deal with incompatible formats. Custom providers (FriendLI, NIM) have non-standard model endpoints.
How OmniRoute solves it:
- Unified Endpoint — A single
http://localhost:20128/v1serves as proxy for all 36+ providers - Format Translation — Automatic and transparent: OpenAI ↔ Claude ↔ Gemini ↔ Responses API
- Response Sanitization — Strips non-standard fields (
x_groq,usage_breakdown,service_tier) that break OpenAI SDK v1.83+ - Role Normalization — Converts
developer→systemfor non-OpenAI providers;system→userfor GLM/ERNIE - Think Tag Extraction — Extracts
<think>blocks from models like DeepSeek R1 into standardizedreasoning_content - Structured Output for Gemini —
json_schema→responseMimeType/responseSchemaautomatic conversion streamdefaults tofalse— Aligns with OpenAI spec, avoiding unexpected SSE in Python/Rust/Go SDKs
🌐 3. "My AI provider blocks my region/country"
Providers like OpenAI/Codex block access from certain geographic regions. Users get errors like unsupported_country_region_territory during OAuth and API connections. This is especially frustrating for developers from developing countries.
How OmniRoute solves it:
- 3-Level Proxy Config — Configurable proxy at 3 levels: global (all traffic), per-provider (one provider only), and per-connection/key
- Color-Coded Proxy Badges — Visual indicators: 🟢 global proxy, 🟡 provider proxy, 🔵 connection proxy, always showing the IP
- OAuth Token Exchange Through Proxy — OAuth flow also goes through the proxy, solving
unsupported_country_region_territory - Connection Tests via Proxy — Connection tests use the configured proxy (no more direct bypass)
- SOCKS5 Support — Full SOCKS5 proxy support for outbound routing
- TLS Fingerprint Spoofing — Browser-like TLS fingerprint via
wreq-jsto bypass bot detection
🆓 4. "I want to use AI for coding but I have no money"
Not everyone can pay $20–200/month for AI subscriptions. Students, devs from emerging countries, hobbyists, and freelancers need access to quality models at zero cost.
How OmniRoute solves it:
- Free Tier Providers Built-in — Native support for 100% free providers: iFlow (8 unlimited models), Qwen (3 unlimited models), Kiro (Claude for free), Gemini CLI (180K/month free)
- Free-Only Combos — Chain
gc/gemini-3-flash → if/kimi-k2-thinking → qw/qwen3-coder-plus= $0/month with zero downtime - NVIDIA NIM Free Credits — 1000 free credits integrated
- Cost Optimized Strategy — Routing strategy that automatically chooses the cheapest available provider
🔒 5. "I need to protect my AI gateway from unauthorized access"
When exposing an AI gateway to the network (LAN, VPS, Docker), anyone with the address can consume the developer's tokens/quota. Without protection, APIs are vulnerable to misuse, prompt injection, and abuse.
How OmniRoute solves it:
- API Key Management — Generation, rotation, and scoping per provider with a dedicated
/dashboard/api-managerpage - Model-Level Permissions — Restrict API keys to specific models (
openai/*, wildcard patterns), with Allow All/Restrict toggle - API Endpoint Protection — Require a key for
/v1/modelsand block specific providers from the listing - Auth Guard + CSRF Protection — All dashboard routes protected with
withAuthmiddleware + CSRF tokens - Rate Limiter — Per-IP rate limiting with configurable windows
- IP Filtering — Allowlist/blocklist for access control
- Prompt Injection Guard — Sanitization against malicious prompt patterns
- AES-256-GCM Encryption — Credentials encrypted at rest
🛑 6. "My provider went down and I lost my coding flow"
AI providers can become unstable, return 5xx errors, or hit temporary rate limits. If a dev depends on a single provider, they're interrupted. Without circuit breakers, repeated retries can crash the application.
How OmniRoute solves it:
- Circuit Breaker per-provider — Auto-open/close with configurable thresholds and cooldown (Closed/Open/Half-Open)
- Exponential Backoff — Progressive retry delays
- Anti-Thundering Herd — Mutex + semaphore protection against concurrent retry storms
- Combo Fallback Chains — If the primary provider fails, automatically falls through the chain with no intervention
- Combo Circuit Breaker — Auto-disables failing providers within a combo chain
- Health Dashboard — Uptime monitoring, circuit breaker states, lockouts, cache stats, p50/p95/p99 latency
🔧 7. "Configuring each AI tool is tedious and repetitive"
Developers use Cursor, Claude Code, Codex CLI, OpenClaw, Gemini CLI, Kilo Code... Each tool needs a different config (API endpoint, key, model). Reconfiguring when switching providers or models is a waste of time.
How OmniRoute solves it:
- CLI Tools Dashboard — Dedicated page with one-click setup for Claude Code, Codex CLI, OpenClaw, Kilo Code, Antigravity, Cline
- GitHub Copilot Config Generator — Generates
chatLanguageModels.jsonfor VS Code with bulk model selection - Onboarding Wizard — Guided 4-step setup for first-time users
- One endpoint, all models — Configure
http://localhost:20128/v1once, access 36+ providers
🔑 8. "Managing OAuth tokens from multiple providers is hell"
Claude Code, Codex, Gemini CLI, Copilot — all use OAuth 2.0 with expiring tokens. Developers need to re-authenticate constantly, deal with client_secret is missing, redirect_uri_mismatch, and failures on remote servers. OAuth on LAN/VPS is particularly problematic.
How OmniRoute solves it:
- Auto Token Refresh — OAuth tokens refresh in background before expiration
- OAuth 2.0 (PKCE) Built-in — Automatic flow for Claude Code, Codex, Gemini CLI, Copilot, Kiro, Qwen, iFlow
- Multi-Account OAuth — Multiple accounts per provider via JWT/ID token extraction
- OAuth LAN/Remote Fix — Private IP detection for
redirect_uri+ manual URL mode for remote servers - OAuth Behind Nginx — Uses
window.location.originfor reverse proxy compatibility - Remote OAuth Guide — Step-by-step guide for Google Cloud credentials on VPS/Docker
📊 9. "I don't know how much I'm spending or where"
Developers use multiple paid providers but have no unified view of spending. Each provider has its own billing dashboard, but there's no consolidated view. Unexpected costs can pile up.
How OmniRoute solves it:
- Cost Analytics Dashboard — Per-token cost tracking and budget management per provider
- Budget Limits per Tier — Spending ceiling per tier that triggers automatic fallback
- Per-Model Pricing Configuration — Configurable prices per model
- Usage Statistics Per API Key — Request count and last-used timestamp per key
- Analytics Dashboard — Stat cards, model usage chart, provider table with success rates and latency
🐛 10. "I can't diagnose errors and problems in AI calls"
When a call fails, the dev doesn't know if it was a rate limit, expired token, wrong format, or provider error. Fragmented logs across different terminals. Without observability, debugging is trial-and-error.
How OmniRoute solves it:
- Unified Logs Dashboard — 4 tabs: Request Logs, Proxy Logs, Audit Logs, Console
- Console Log Viewer — Real-time terminal-style viewer with color-coded levels, auto-scroll, search, filter
- SQLite Proxy Logs — Persistent logs that survive server restarts
- Translator Playground — 4 debugging modes: Playground (format translation), Chat Tester (round-trip), Test Bench (batch), Live Monitor (real-time)
- Request Telemetry — p50/p95/p99 latency + X-Request-Id tracing
- File-Based Logging with Rotation — Console interceptor captures everything to JSON log with size-based rotation
🏗️ 11. "Deploying and maintaining the gateway is complex"
Installing, configuring, and maintaining an AI proxy across different environments (local, VPS, Docker, cloud) is labor-intensive. Problems like hardcoded paths, EACCES on directories, port conflicts, and cross-platform builds add friction.
How OmniRoute solves it:
- npm global install —
npm install -g omniroute && omniroute— done - Docker Multi-Platform — AMD64 + ARM64 native (Apple Silicon, AWS Graviton, Raspberry Pi)
- Docker Compose Profiles —
base(no CLI tools) andcli(with Claude Code, Codex, OpenClaw) - Electron Desktop App — Native app for Windows/macOS/Linux with system tray, auto-start, offline mode
- Split-Port Mode — API and Dashboard on separate ports for advanced scenarios (reverse proxy, container networking)
- Cloud Sync — Config synchronization across devices via Cloudflare Workers
- DB Backups — Automatic backup, restore, export and import of all settings
🌍 12. "The interface is English-only and my team doesn't speak English"
Teams in non-English-speaking countries, especially in Latin America, Asia, and Europe, struggle with English-only interfaces. Language barriers reduce adoption and increase configuration errors.
How OmniRoute solves it:
- Dashboard i18n — 30 Languages — All 500+ keys translated including Arabic, Bulgarian, Danish, German, Spanish, Finnish, French, Hebrew, Hindi, Hungarian, Indonesian, Italian, Japanese, Korean, Malay, Dutch, Norwegian, Polish, Portuguese (PT/BR), Romanian, Russian, Slovak, Swedish, Thai, Ukrainian, Vietnamese, Chinese, Filipino, English
- RTL Support — Right-to-left support for Arabic and Hebrew
- Multi-Language READMEs — 30 complete documentation translations
- Language Selector — Globe icon in header for real-time switching
🔄 13. "I need more than chat — I need embeddings, images, audio"
AI isn't just chat completion. Devs need to generate images, transcribe audio, create embeddings for RAG, rerank documents, and moderate content. Each API has a different endpoint and format.
How OmniRoute solves it:
- Embeddings —
/v1/embeddingswith 6 providers and 9+ models - Image Generation —
/v1/images/generationswith 4 providers and 9+ models - Audio Transcription —
/v1/audio/transcriptions— Whisper-compatible - Text-to-Speech —
/v1/audio/speech— Multi-provider audio synthesis - Moderations —
/v1/moderations— Content safety checks - Reranking —
/v1/rerank— Document relevance reranking - Responses API — Full
/v1/responsessupport for Codex
🧪 14. "I have no way to test and compare quality across models"
Developers want to know which model is best for their use case — code, translation, reasoning — but comparing manually is slow. No integrated eval tools exist.
How OmniRoute solves it:
- LLM Evaluations — Golden set testing with 10 pre-loaded cases covering greetings, math, geography, code generation, JSON compliance, translation, markdown, safety refusal
- 4 Match Strategies —
exact,contains,regex,custom(JS function) - Translator Playground Test Bench — Batch testing with multiple inputs and expected outputs, cross-provider comparison
- Chat Tester — Full round-trip with visual response rendering
- Live Monitor — Real-time stream of all requests flowing through the proxy
📈 15. "I need to scale without losing performance"
As request volume grows, without caching the same questions generate duplicate costs. Without idempotency, duplicate requests waste processing. Per-provider rate limits must be respected.
How OmniRoute solves it:
- Semantic Cache — Two-tier cache (signature + semantic) reduces cost and latency
- Request Idempotency — 5s deduplication window for identical requests
- Rate Limit Detection — Per-provider RPM, min gap, and max concurrent tracking
- Editable Rate Limits — Configurable defaults in Settings → Resilience with persistence
- API Key Validation Cache — 3-tier cache for production performance
- Health Dashboard with Telemetry — p50/p95/p99 latency, cache stats, uptime
🤖 16. "I want to control model behavior globally"
Developers who want all responses in a specific language, with a specific tone, or want to limit reasoning tokens. Configuring this in every tool/request is impractical.
How OmniRoute solves it:
- System Prompt Injection — Global prompt applied to all requests
- Thinking Budget Validation — Reasoning token allocation control per request (passthrough, auto, custom, adaptive)
- 6 Routing Strategies — Global strategies that determine how requests are distributed
- Wildcard Router —
provider/*patterns route dynamically to any provider - Combo Enable/Disable Toggle — Toggle combos directly from the dashboard
- Provider Toggle — Enable/disable all connections for a provider with one click
- Blocked Providers — Exclude specific providers from
/v1/modelslisting
1. Wereldwijd installeren:
npm install -g omniroute
omniroute🎉 Dashboard wordt geopend op http://localhost:20128
| Commando | Beschrijving |
|---|---|
omniroute |
Startserver (standaardpoort 20128) |
omniroute --port 3000 |
Gebruik aangepaste poort |
omniroute --no-open |
Browser niet automatisch openen |
omniroute --help |
Hulp tonen |
2. Sluit een GRATIS provider aan:
Dashboard → Providers → Claude Code of Antigravity verbinden → OAuth-aanmelding → Klaar!
3. Gebruik in uw CLI-tool:
Claude Code/Codex/Gemini CLI/OpenClaw/Cursor/Cline Settings:
Endpoint: http://localhost:20128/v1
API Key: [copy from dashboard]
Model: if/kimi-k2-thinking
Dat is alles! Begin met coderen met GRATIS AI-modellen.
Alternatief — uitvoeren vanaf bron:
cp .env.example .env
npm install
PORT=20128 NEXT_PUBLIC_BASE_URL=http://localhost:20128 npm run devOmniRoute is beschikbaar als openbare Docker-image op Docker Hub.
Snelle uitvoering:
docker run -d \
--name omniroute \
--restart unless-stopped \
-p 20128:20128 \
-v omniroute-data:/app/data \
diegosouzapw/omniroute:latestMet omgevingsbestand:
# Copy and edit .env first
cp .env.example .env
docker run -d \
--name omniroute \
--restart unless-stopped \
--env-file .env \
-p 20128:20128 \
-v omniroute-data:/app/data \
diegosouzapw/omniroute:latest** Docker Compose gebruiken:**
# Base profile (no CLI tools)
docker compose --profile base up -d
# CLI profile (Claude Code, Codex, OpenClaw built-in)
docker compose --profile cli up -d| Afbeelding | Label | Maat | Beschrijving |
|---|---|---|---|
diegosouzapw/omniroute |
latest |
~250MB | Nieuwste stabiele release |
diegosouzapw/omniroute |
1.0.3 |
~250MB | Huidige versie |
🆕 NEW! OmniRoute is now available as a native desktop application for Windows, macOS, and Linux.
- 🖥️ Native Window — Dedicated app window with system tray integration
- 🔄 Auto-Start — Launch OmniRoute on system login
- 🔔 Native Notifications — Get alerts for quota exhaustion or provider issues
- ⚡ One-Click Install — NSIS (Windows), DMG (macOS), AppImage (Linux)
- 🌐 Offline Mode — Works fully offline with bundled server
npm run electron:dev # Development mode
npm run electron:build # Current platform
npm run electron:build:win # Windows (.exe)
npm run electron:build:mac # macOS (.dmg)
npm run electron:build:linux # Linux (.AppImage)📖 Full documentation: electron/README.md
| Niveau | Aanbieder | Kosten | Quotum opnieuw instellen | Beste voor |
|---|---|---|---|---|
| 💳 ABONNEMENT | Claude Code (Pro) | $ 20/maand | 5u + wekelijks | Al geabonneerd |
| Codex (Plus/Pro) | $ 20-200/maand | 5u + wekelijks | OpenAI-gebruikers | |
| Tweeling CLI | GRATIS | 180K/maand + 1K/dag | Iedereen! | |
| GitHub-copiloot | $ 10-19/maand | Maandelijks | GitHub-gebruikers | |
| 🔑 API-SLEUTEL | NVIDIA NIM | GRATIS (1000 credits) | Eenmalig | Gratis niveautesten |
| DeepSeek | Betalen per gebruik | Geen | Beste prijs/kwaliteit | |
| Groq | Gratis niveau + betaald | Tarief beperkt | Ultrasnelle gevolgtrekking | |
| xAI (Grok) | Betalen per gebruik | Geen | Grok-modellen | |
| Mistral | Gratis niveau + betaald | Tarief beperkt | Europese AI | |
| OpenRouter | Betalen per gebruik | Geen | 100+ modellen | |
| 💰GOEDKOOP | GLM-4.7 | $ 0,6/1 miljoen | Dagelijks 10.00 uur | Budgetback-up |
| MiniMax M2.1 | $ 0,2/1 miljoen | 5-uurs rollen | Goedkoopste optie | |
| Kimi K2 | $ 9/maand plat | 10 miljoen tokens/maand | Voorspelbare kosten | |
| 🆓 GRATIS | iFlow | $0 | Onbeperkt | 8 modellen gratis |
| Qwen | $0 | Onbeperkt | 3 modellen gratis | |
| Kiro | $0 | Onbeperkt | Claude vrij |
💡 Pro-tip: Begin met Gemini CLI (180K gratis/maand) + iFlow (onbeperkt gratis) combo = $ 0 kosten!
| Kenmerk | Wat het doet |
|---|---|
| 🎯 Slimme terugval op 4 niveaus | Autoroute: Abonnement → API-sleutel → Goedkoop → Gratis |
| 📊 Realtime quota bijhouden | Live tokentelling + reset-aftelling per provider |
| 🔄 Formaatvertaling | OpenAI ↔ Claude ↔ Gemini ↔ Cursor ↔ Kiro naadloos + responsopschoning |
| 👥 Ondersteuning voor meerdere accounts | Meerdere accounts per aanbieder met intelligente selectie |
| 🔄 Automatische tokenvernieuwing | OAuth-tokens worden automatisch vernieuwd bij nieuwe poging |
| 🎨 Aangepaste combo's | 6 strategieën: eerst vullen, round-robin, p2c, willekeurig, minst gebruikt, kostengeoptimaliseerd |
| 🧩 Aangepaste modellen | Voeg elke model-ID toe aan elke provider |
| 🌐 Wildcard-router | Stuur provider/* patronen dynamisch naar elke provider |
| 🧠 Denkbudget | Passthrough-, automatische, aangepaste en adaptieve modi voor redeneermodellen |
| 🔀 Model Aliases | Auto-forward deprecated model IDs to current replacements (built-in + custom) |
| ⚡ Background Degradation | Auto-route background tasks (titles, summaries) to cheaper models |
| 💬 Systeempromptinjectie | Algemene systeemprompt toegepast op alle verzoeken |
| 📄 Reacties-API | Volledige OpenAI Responses API (/v1/responses) ondersteuning voor Codex |
| Kenmerk | Wat het doet |
|---|---|
| 🖼️ Beeldgeneratie | /v1/images/generations — 4 providers, 9+ modellen |
| 📐 Insluitingen | /v1/embeddings — 6 providers, 9+ modellen |
| 🎤 Audiotranscriptie | /v1/audio/transcriptions — Whisper-compatibel |
| 🔊 Tekst-naar-spraak | /v1/audio/speech — Audiosynthese van meerdere providers |
| 🛡️ Moderaties | /v1/moderations — Veiligheidscontroles van inhoud |
| 🔀 Herschikking | /v1/rerank — Herschikking van documentrelevantie |
| Kenmerk | Wat het doet |
|---|---|
| 🔌 Stroomonderbreker | Automatisch openen/sluiten per provider met configureerbare drempels |
| 🛡️ Anti-donderende kudde | Mutex + semafoorsnelheidslimiet voor API-sleutelproviders |
| 🧠 Semantische cache | Tweelaagse cache (handtekening + semantisch) verlaagt de kosten en latentie |
| ⚡ Idempotentie aanvragen | 5s ontdubbelingsvenster voor dubbele verzoeken |
| 🔒 TLS-vingerafdrukspoofing | Omzeil TLS-gebaseerde botdetectie via wreq-js |
| 🌐 IP-filtering | Toelatingslijst/blokkeerlijst voor API-toegangscontrole |
| 📊 Bewerkbare tarieflimieten | Configureerbare RPM, minimale tussenruimte en maximale gelijktijdigheid op systeemniveau |
| 💾 Rate Limit Persistence | Learned limits survive restarts via SQLite with 60s debounce + 24h staleness |
| 🔄 Token Refresh Resilience | Per-provider circuit breaker (5 fails→30min) + 30s timeout per attempt |
| 🛡 API-eindpuntbescherming | Auth-gating + providerblokkering voor het /models eindpunt |
| 🔒 Proxyzichtbaarheid | Kleurgecodeerde badges: 🟢 wereldwijd, 🟡 provider, 🔵 per verbinding met IP-display |
| 🌐 Proxyconfiguratie op 3 niveaus | Configureer proxy's op globaal, per provider of per verbindingsniveau |
| Kenmerk | Wat het doet |
|---|---|
| 📝 Logboekregistratie aanvragen | Foutopsporingsmodus met volledige aanvraag-/antwoordlogboeken |
| 💾 SQLite Proxy-logboeken | Aanhoudende proxylogboeken overleven het opnieuw opstarten van de server |
| 📊 Analytics-dashboard | Recharts-aangedreven: statistische kaarten, modelgebruiksgrafiek, providertabel |
| 📈 Voortgang bijhouden | SSE-voortgangsgebeurtenissen aanmelden voor streaming |
| 🧪 LLM-evaluaties | Gouden settesten met 4 wedstrijdstrategieën |
| 🔍 Telemetrie aanvragen | p50/p95/p99 latentie-aggregatie + X-Request-Id-tracering |
| 📋 Logdashboard | Uniforme pagina met 4 tabbladen: aanvraaglogboeken, proxylogboeken, auditlogboeken, console |
| 🖥️ Consolelogviewer | Realtime viewer in terminalstijl met niveaufilter, zoeken, automatisch scrollen |
| 📑 Op bestanden gebaseerde logboekregistratie | Console-interceptor legt alle uitvoer vast naar JSON-logbestand met rotatie |
| 🏥 Gezondheidsdashboard | Systeemuptime, status van stroomonderbrekers, uitsluitingen, cachestatistieken |
| 💰 Kosten bijhouden | Budgetbeheer + prijsconfiguratie per model |
| Kenmerk | Wat het doet |
|---|---|
| 💾 Cloudsynchronisatie | Synchroniseer de configuratie op verschillende apparaten via Cloudflare Workers |
| 🌐 Overal implementeren | Localhost, VPS, Docker, Cloudflare Workers |
| 🔑 API-sleutelbeheer | Genereer, roteer en bereik API-sleutels per provider |
| 🧙 Onboarding-wizard | Begeleide installatie in 4 stappen voor nieuwe gebruikers |
| 🔧 CLI Tools-dashboard | Configureer met één klik Claude, Codex, Cline, OpenClaw, Kilo, Antigravity |
| 🔄 DB-back-ups | Automatische back-up, herstel, export en import voor alle instellingen |
| 🌐 Internationalisering | Volledige i18n met next-intl — Engels + Portugees (Brazilië) ondersteuning |
| 🌍 Taalkiezer | Wereldbolpictogram in koptekst voor realtime taalwisseling (🇺🇸/🇧🇷) |
| 📂 Aangepaste gegevensmap | DATA_DIR env var om standaard ~/.omniroute opslagpad te overschrijven |
📖 Functiedetails
Creëer combo's met automatische terugval:
Combo: "my-coding-stack"
1. cc/claude-opus-4-6 (your subscription)
2. nvidia/llama-3.3-70b (free NVIDIA API)
3. glm/glm-4.7 (cheap backup, $0.6/1M)
4. if/kimi-k2-thinking (free fallback)
→ Auto switches when quota runs out or errors occur
- Tokenverbruik per aanbieder
- Aftellen resetten (5 uur, dagelijks, wekelijks)
- Kostenraming voor betaalde niveaus
- Maandelijkse uitgavenrapporten
Naadloze vertaling tussen formaten:
- OpenAI ↔ Claude ↔ Gemini ↔ OpenAI-reacties
- Uw CLI-tool verzendt OpenAI-formaat → OmniRoute vertaalt → Provider ontvangt native formaat
- Werkt met elke tool die aangepaste OpenAI-eindpunten ondersteunt
- Reactieopschoning — Verwijdert niet-standaardvelden voor strikte OpenAI SDK-compatibiliteit
- Rolnormalisatie —
developer→systemvoor niet-OpenAI;system→uservoor GLM/ERNIE-modellen - Extractie van Think-tags —
<think>blokken →reasoning_contentvoor denkmodellen - Gestructureerde uitvoer —
json_schema→ Gemini'sresponseMimeType/responseSchema
- Voeg meerdere accounts per aanbieder toe
- Automatische round-robin of op prioriteit gebaseerde routering
- Terugval naar het volgende account wanneer één het quotum bereikt
- OAuth-tokens worden automatisch vernieuwd voordat ze verlopen
- Geen handmatige herauthenticatie nodig
- Naadloze ervaring bij alle providers
- Creëer onbeperkte modelcombinaties
- 6 strategieën: eerst vullen, round-robin, macht van twee keuzes, willekeurig, minst gebruikt, kostengeoptimaliseerd
- Deel combo's op verschillende apparaten met Cloud Sync
- Systeemstatus (uptime, versie, geheugengebruik)
- Status van de stroomonderbrekers per provider (Gesloten/Open/Half-Open)
- Tarieflimietstatus en actieve uitsluitingen
- Kenmerkende cachestatistieken
- Latency-telemetrie (p50/p95/p99) + promptcache
- Reset de gezondheidsstatus met één klik
OmniRoute bevat een krachtige ingebouwde Translator Playground met 4 modi voor het debuggen, testen en monitoren van API-vertalingen:
| Modus | Beschrijving |
|---|---|
| 💻 Speeltuin | Directe formaatvertaling: plak de hoofdtekst van een API-verzoek en zie direct hoe OmniRoute deze vertaalt tussen providerformaten (OpenAI ↔ Claude ↔ Gemini ↔ Responses API). Bevat voorbeeldsjablonen en automatische detectie van formaten. |
| 💬 Chattester | Stuur echte chatverzoeken via OmniRoute en bekijk het volledige overzicht: uw invoer, het vertaalde verzoek, het antwoord van de provider en het vertaalde antwoord terug. Van onschatbare waarde voor het valideren van combo-routering. |
| 🧪 Proefbank | Batchtestmodus: definieer meerdere testgevallen met verschillende inputs en verwachte outputs, voer ze allemaal tegelijk uit en vergelijk de resultaten van verschillende providers en modellen. |
| 📱Livemonitor | Real-time monitoring van verzoeken: bekijk binnenkomende verzoeken terwijl ze door OmniRoute stromen, bekijk de formaatvertalingen live en identificeer problemen direct. |
Toegang: Dashboard → Vertaler (zijbalk)
- Synchroniseer providers, combo's en instellingen op verschillende apparaten
- Automatische achtergrondsynchronisatie
- Veilige gecodeerde opslag
Probleem: Quotum verloopt ongebruikt, snelheidslimieten tijdens intensief coderen
Combo: "maximize-claude"
1. cc/claude-opus-4-6 (use subscription fully)
2. glm/glm-4.7 (cheap backup when quota out)
3. if/kimi-k2-thinking (free emergency fallback)
Monthly cost: $20 (subscription) + ~$5 (backup) = $25 total
vs. $20 + hitting limits = frustration
Probleem: Ik kan geen abonnementen betalen, heb betrouwbare AI-codering nodig
Combo: "free-forever"
1. gc/gemini-3-flash (180K free/month)
2. if/kimi-k2-thinking (unlimited free)
3. qw/qwen3-coder-plus (unlimited free)
Monthly cost: $0
Quality: Production-ready models
Probleem: Deadlines, downtime is niet mogelijk
Combo: "always-on"
1. cc/claude-opus-4-6 (best quality)
2. cx/gpt-5.2-codex (second subscription)
3. glm/glm-4.7 (cheap, resets daily)
4. minimax/MiniMax-M2.1 (cheapest, 5h reset)
5. if/kimi-k2-thinking (free unlimited)
Result: 5 layers of fallback = zero downtime
Probleem: AI-assistent nodig in berichtenapps, geheel gratis
Combo: "openclaw-free"
1. if/glm-4.7 (unlimited free)
2. if/minimax-m2.1 (unlimited free)
3. if/kimi-k2-thinking (unlimited free)
Monthly cost: $0
Access via: WhatsApp, Telegram, Slack, Discord, iMessage, Signal...
💳 Abonnementaanbieders
Dashboard → Providers → Connect Claude Code
→ OAuth login → Auto token refresh
→ 5-hour + weekly quota tracking
Models:
cc/claude-opus-4-6
cc/claude-sonnet-4-5-20250929
cc/claude-haiku-4-5-20251001Pro-tip: Gebruik Opus voor complexe taken, Sonnet voor snelheid. OmniRoute houdt quota bij per model!
Dashboard → Providers → Connect Codex
→ OAuth login (port 1455)
→ 5-hour + weekly reset
Models:
cx/gpt-5.2-codex
cx/gpt-5.1-codex-maxDashboard → Providers → Connect Gemini CLI
→ Google OAuth
→ 180K completions/month + 1K/day
Models:
gc/gemini-3-flash-preview
gc/gemini-2.5-proBeste waarde: Enorm gratis niveau! Gebruik dit vóór betaalde niveaus.
Dashboard → Providers → Connect GitHub
→ OAuth via GitHub
→ Monthly reset (1st of month)
Models:
gh/gpt-5
gh/claude-4.5-sonnet
gh/gemini-3-pro🔑 API-sleutelproviders
- Aanmelden: build.nvidia.com
- Ontvang een gratis API-sleutel (inclusief 1000 inferentiecredits)
- Dashboard → Provider toevoegen → NVIDIA NIM:
- API-sleutel:
nvapi-your-key
- API-sleutel:
Modellen: nvidia/llama-3.3-70b-instruct, nvidia/mistral-7b-instruct en nog meer dan 50
Pro-tip: OpenAI-compatibele API — werkt naadloos samen met de formaatvertaling van OmniRoute!
- Aanmelden: platform.deepseek.com
- Haal de API-sleutel op
- Dashboard → Provider toevoegen → DeepSeek
Modellen: deepseek/deepseek-chat, deepseek/deepseek-coder
- Aanmelden: console.groq.com
- Ontvang een API-sleutel (inclusief gratis laag)
- Dashboard → Provider toevoegen → Groq
Modellen: groq/llama-3.3-70b, groq/mixtral-8x7b
Pro-tip: Ultrasnelle gevolgtrekking — het beste voor realtime coderen!
- Aanmelden: openrouter.ai
- Haal de API-sleutel op
- Dashboard → Provider toevoegen → OpenRouter
Modellen: Krijg toegang tot meer dan 100 modellen van alle grote providers via één API-sleutel.
💰 Goedkope providers (back-up)
- Aanmelden: Zhipu AI
- Haal de API-sleutel op uit het Coderingsplan
- Dashboard → API-sleutel toevoegen:
- Aanbieder:
glm - API-sleutel:
your-key
- Aanbieder:
Gebruik: glm/glm-4.7
Pro-tip: Coderingsplan biedt 3× quotum tegen 1/7 kosten! Dagelijks resetten om 10:00 uur.
- Aanmelden: MiniMax
- Haal de API-sleutel op
- Dashboard → API-sleutel toevoegen
Gebruik: minimax/MiniMax-M2.1
Pro-tip: Goedkoopste optie voor lange context (1 miljoen tokens)!
- Abonneer je: Moonshot AI
- Haal de API-sleutel op
- Dashboard → API-sleutel toevoegen
Gebruik: kimi/kimi-latest
Pro-tip: Vaste $ 9/maand voor 10 miljoen tokens = $ 0,90/1 miljoen effectieve kosten!
🆓 GRATIS providers (noodback-up)
Dashboard → Connect iFlow
→ iFlow OAuth login
→ Unlimited usage
Models:
if/kimi-k2-thinking
if/qwen3-coder-plus
if/glm-4.7
if/minimax-m2
if/deepseek-r1Dashboard → Connect Qwen
→ Device code authorization
→ Unlimited usage
Models:
qw/qwen3-coder-plus
qw/qwen3-coder-flashDashboard → Connect Kiro
→ AWS Builder ID or Google/GitHub
→ Unlimited usage
Models:
kr/claude-sonnet-4.5
kr/claude-haiku-4.5🎨 Combo's maken
Dashboard → Combos → Create New
Name: premium-coding
Models:
1. cc/claude-opus-4-6 (Subscription primary)
2. glm/glm-4.7 (Cheap backup, $0.6/1M)
3. minimax/MiniMax-M2.1 (Cheapest fallback, $0.20/1M)
Use in CLI: premium-coding
Name: free-combo
Models:
1. gc/gemini-3-flash-preview (180K free/month)
2. if/kimi-k2-thinking (unlimited)
3. qw/qwen3-coder-plus (unlimited)
Cost: $0 forever!
🔧 CLI-integratie
Settings → Models → Advanced:
OpenAI API Base URL: http://localhost:20128/v1
OpenAI API Key: [from OmniRoute dashboard]
Model: cc/claude-opus-4-6
Gebruik de pagina CLI Tools in het dashboard voor configuratie met één klik, of bewerk ~/.claude/settings.json handmatig.
export OPENAI_BASE_URL="http://localhost:20128"
export OPENAI_API_KEY="your-omniroute-api-key"
codex "your prompt"Optie 1 — Dashboard (aanbevolen):
Dashboard → CLI Tools → OpenClaw → Select Model → Apply
Optie 2 — Handmatig: Bewerk ~/.openclaw/openclaw.json:
{
"models": {
"providers": {
"omniroute": {
"baseUrl": "http://127.0.0.1:20128/v1",
"apiKey": "sk_omniroute",
"api": "openai-completions"
}
}
}
}Opmerking: OpenClaw werkt alleen met lokale OmniRoute. Gebruik
127.0.0.1in plaats vanlocalhostom IPv6-resolutieproblemen te voorkomen.
Settings → API Configuration:
Provider: OpenAI Compatible
Base URL: http://localhost:20128/v1
API Key: [from OmniRoute dashboard]
Model: if/kimi-k2-thinking
OmniRoute bevat een ingebouwd evaluatieframework om de LLM-responskwaliteit te testen aan de hand van een gouden set. U kunt deze openen via Analytics → Evaluaties in het dashboard.
De vooraf geladen "OmniRoute Golden Set" bevat 10 testcases die betrekking hebben op:
- Groeten, wiskunde, aardrijkskunde, codegeneratie
- Naleving van JSON-formaat, vertaling, prijsverlaging
- Veiligheidsweigering (schadelijke inhoud), tellen, booleaanse logica
| Strategie | Beschrijving | Voorbeeld |
|---|---|---|
exact |
De uitvoer moet exact overeenkomen met | "4" |
contains |
De uitvoer moet een subtekenreeks bevatten (niet hoofdlettergevoelig) | "Paris" |
regex |
Uitvoer moet overeenkomen met regex-patroon | "1.*2.*3" |
custom |
Aangepaste JS-functie retourneert waar/onwaar | (output) => output.length > 10 |
Klik om de probleemoplossingsgids uit te vouwen
"Taalmodel heeft geen berichten verstrekt"
- Providerquotum opgebruikt → Controleer dashboardquotumtracker
- Oplossing: gebruik combo-fallback of schakel over naar een goedkoper niveau
Snelheidslimiet
- Abonnementquotum op → Terugval op GLM/MiniMax
- Combinatie toevoegen:
cc/claude-opus-4-6 → glm/glm-4.7 → if/kimi-k2-thinking
OAuth-token verlopen
- Automatisch vernieuwd door OmniRoute
- Als de problemen aanhouden: Dashboard → Provider → Opnieuw verbinding maken
Hoge kosten
- Controleer gebruiksstatistieken in Dashboard → Kosten
- Schakel het primaire model over naar GLM/MiniMax
- Gebruik de gratis laag (Gemini CLI, iFlow) voor niet-kritieke taken
Dashboard opent op verkeerde poort
- Stel
PORT=20128enNEXT_PUBLIC_BASE_URL=http://localhost:20128in
Cloudsynchronisatiefouten
- Controleer of
BASE_URLverwijst naar uw actieve exemplaar - Controleer of
CLOUD_URLverwijst naar uw verwachte cloudeindpunt - Houd
NEXT_PUBLIC_*waarden afgestemd op de waarden op de server
Eerste login werkt niet
- Controleer
INITIAL_PASSWORDin.env - Indien niet ingesteld, is het reservewachtwoord
123456
Geen verzoeklogboeken
- Stel
ENABLE_REQUEST_LOGS=truein in.env
Verbindingstest toont "Ongeldig" voor OpenAI-compatibele providers
- Veel providers stellen geen
/modelseindpunt beschikbaar - OmniRoute v1.0.6+ omvat fallback-validatie via chat-voltooiingen
- Zorg ervoor dat de basis-URL het achtervoegsel
/v1bevat
⚠️ BELANGRIJK voor gebruik met OmniRoute op VPS/Docker/server op afstand
Deze bewijzen Antigravity en Gemini CLI gebruiken Google OAuth 2.0 voor authenticatie. O Google vraagt dat redirect_uri geen OAuth-stroom gebruikt exatamente een van de URI's vóór de kadaster zonder toepassing van Google Cloud Console.
Omdat OAuth geen OmniRoute heeft geregistreerd, is dit apenas para localhost. Wanneer u OmniRoute op een externe server opent (bijvoorbeeld: https://omniroute.meuservidor.com), of Google een authenticatie aanvraagt:
Error 400: redirect_uri_mismatch
U kunt precies zien hoe OAuth 2.0 Client ID geen Google Cloud Console heeft met een URI van zijn server.
1. Toegang tot Google Cloud Console
Abra: https://console.cloud.google.com/apis/credentials
2. Nieuwe OAuth 2.0 client-ID
- Klik op "+ Credentials aanmaken" → "OAuth-client-ID"
- Applicatietip: "Webapplicatie"
- Nome: escolha qualquer nome (bijvoorbeeld:
OmniRoute Remote)
3. Adicione als geautoriseerde omleidings-URI's
Geen campagne "Geautoriseerde omleidings-URI's", aanbevolen:
https://seu-servidor.com/callback
Vervang
seu-servidor.comdoor de domicilie of het IP-adres van uw server (inclusief een noodzakelijke poort, bijvoorbeeld:http://45.33.32.156:20128/callback).
4. Bewaar en kopieer als credenciais
U kunt ook op Google klikken op Client-ID en Clientgeheim.
5. Configureer als variáveis de ambiente
Geen .env (of de verschillende omgevingen van Docker):
# Para Antigravity:
ANTIGRAVITY_OAUTH_CLIENT_ID=seu-client-id.apps.googleusercontent.com
ANTIGRAVITY_OAUTH_CLIENT_SECRET=GOCSPX-seu-secret
# Para Gemini CLI:
GEMINI_OAUTH_CLIENT_ID=seu-client-id.apps.googleusercontent.com
GEMINI_OAUTH_CLIENT_SECRET=GOCSPX-seu-secret
GEMINI_CLI_OAUTH_CLIENT_SECRET=GOCSPX-seu-secret6. Reinicie van OmniRoute
# Se usando npm:
npm run dev
# Se usando Docker:
docker restart omniroute7. Nieuwe verbinding
Dashboard → Providers → Antigravity (ou Gemini CLI) → OAuth
Nadat Google de juiste verwijzing naar https://seu-servidor.com/callback heeft gemaakt, is deze autenticaal functioneel geworden.
Als u geen geloofwaardige geloofwaardigheid meer heeft, is het mogelijk om de stroom handleiding van de URL te gebruiken:
- OmniRoute gebruikt een autorisatie-URL van Google
- Als u de autorisatie heeft gegeven, zal Google de doorverwijzing naar
localhostuitvoeren (die geen externe service biedt) - Kopieer een volledige URL door de browser van uw browser (het bericht dat de pagina niet verder gaat)
- Cole essa URL is niet beschikbaar op de verbindingswijze van OmniRoute
- Klik op "Verbinden"
Deze tijdelijke oplossing werkt door de autorisatiecode van de URL en is onafhankelijk van het omleiden naar uw autorisatie of niet.
- Runtime: Node.js 18–22 LTS (
⚠️ Node.js 24+ wordt niet ondersteund —better-sqlite3native binaire bestanden zijn incompatibel) - Taal: TypeScript 5.9 — 100% TypeScript voor
src/enopen-sse/(v1.0.6) - Framework: Next.js 16 + React 19 + Tailwind CSS 4
- Database: LowDB (JSON) + SQLite (domeinstatus + proxylogboeken)
- Streaming: door de server verzonden gebeurtenissen (SSE)
- Auth: OAuth 2.0 (PKCE) + JWT + API-sleutels
- Testen: Node.js-testloper (368+ unit-tests)
- CI/CD: GitHub-acties (automatische npm-publicatie + Docker Hub bij release)
- Website: omniroute.online
- Pakket: npmjs.com/package/omniroute
- Docker: hub.docker.com/r/diegosouzapw/omniroute
- Veerkracht: stroomonderbreker, exponentieel uitstel, anti-donderkudde, TLS-spoofing
| Document | Beschrijving |
|---|---|
| User Guide | Providers, combo's, CLI-integratie, implementatie |
| API Reference | Alle eindpunten met voorbeelden |
| Troubleshooting | Veelvoorkomende problemen en oplossingen |
| Architecture | Systeemarchitectuur en internals |
| Contributing | Ontwikkelingsopstelling en richtlijnen |
| OpenAPI Spec | OpenAPI 3.0-specificatie |
| Security Policy | Kwetsbaarheidsrapportage en beveiligingspraktijken |
| VM Deployment | Volledige gids: VM + nginx + Cloudflare-installatie |
| Features Gallery | Visuele dashboardrondleiding met screenshots |
Klik om dashboardscreenshots te bekijken
| Pagina | Schermafbeelding |
|---|---|
| Aanbieders | ![]() |
| Combo's | ![]() |
| Analytics | ![]() |
| Gezondheid | ![]() |
| Vertaler | ![]() |
| Instellingen | ![]() |
| CLI-hulpmiddelen | ![]() |
| Gebruikslogboeken | ![]() |
| Eindpunt | ![]() |
OmniRoute heeft 210+ functies gepland over meerdere ontwikkelingsfasen. Dit zijn de belangrijkste gebieden:
| Categorie | Geplande functies | Hoogtepunten |
|---|---|---|
| 🧠 Routing en intelligentie | 25+ | Routering met de laagste latentie, op tags gebaseerde routering, quota-preflight, P2C-accountselectie |
| 🔒 Beveiliging en naleving | 20+ | SSRF-verharding, cloaking van inloggegevens, snelheidslimiet per eindpunt, scoping van beheersleutels |
| 📊 Waarneembaarheid | 15+ | OpenTelemetry-integratie, realtime quotabewaking, kostenregistratie per model |
| 🔄 Provider-integraties | 20+ | Dynamisch modelregister, cooldowns van providers, Codex met meerdere accounts, parseren van Copilot-quota |
| ⚡ Prestaties | 15+ | Dubbele cachelaag, promptcache, responscache, streaming keepalive, batch-API |
| 🌐 Ecosysteem | 10+ | WebSocket API, configuratie hot-reload, gedistribueerde configuratieopslag, commerciële modus |
- 🔗 OpenCode-integratie — Native providerondersteuning voor de OpenCode AI-coderings-IDE
- 🔗 TRAE-integratie — Volledige ondersteuning voor het TRAE AI-ontwikkelingsframework
- 📦 Batch API — Asynchrone batchverwerking voor bulkaanvragen
- 🎯 Op tags gebaseerde routering — Routeer verzoeken op basis van aangepaste tags en metagegevens
- 💰 Laagste kostenstrategie — Selecteer automatisch de goedkoopste beschikbare provider
📝 Volledige functiespecificaties beschikbaar in link (217 gedetailleerde specificaties)
💬 Word lid van onze community! WhatsApp Group — Krijg hulp, deel tips en blijf op de hoogte.
- Website: omniroute.online
- GitHub: github.com/diegosouzapw/OmniRoute
- Problemen: github.com/diegosouzapw/OmniRoute/issues
- WhatsApp: Community Group
- Origineel project: 9router by decolua
- Fork de repository
- Maak uw feature branch (
git checkout -b feature/amazing-feature) - Leg uw wijzigingen vast (
git commit -m 'Add amazing feature') - Duw naar het filiaal (
git push origin feature/amazing-feature) - Open een Pull Request
Zie CONTRIBUTING.md voor gedetailleerde richtlijnen.
# Create a release — npm publish happens automatically
gh release create v1.0.6 --title "v1.0.6" --generate-notesSpeciale dank aan 9router door decolua — het originele project dat deze vork inspireerde. OmniRoute bouwt voort op die ongelooflijke basis met extra functies, multimodale API's en een volledige TypeScript-herschrijving.
Speciale dank aan CLIProxyAPI — de originele Go-implementatie die deze JavaScript-port inspireerde.
MIT-licentie - zie LICENSE voor details.
omniroute.online








