🚀 OmniRoute — De gratis AI-gateway

Stop nooit met coderen. Slimme routering naar GRATIS en voordelige AI-modellen met automatische terugval.

Uw universele API-proxy: één eindpunt, meer dan 36 providers, geen downtime.

Chatvoltooiingen • Insluitingen • Afbeelding genereren • Audio • Herrangschikking • 100% TypeScript

🤖 Gratis AI-provider voor uw favoriete codeeragenten

Verbind elke AI-aangedreven IDE- of CLI-tool via OmniRoute: gratis API-gateway voor onbeperkte codering.

OpenClaw _{⭐ 205K}	NanoBot _{⭐ 20.9K}	PicoClaw _{⭐ 14.6K}	ZeroClaw _{⭐ 9.9K}	IronClaw _{⭐ 2.1K}
OpenCode _{⭐ 106K}	Codex CLI _{⭐ 60.8K}	Claude Code _{⭐ 67.3K}	Gemini CLI _{⭐ 94.7K}	Kilo Code _{⭐ 15.5K}

_{📡 Alle agenten maken verbinding via http://localhost:20128/v1 of http://cloud.omniroute.online/v1 — één configuratie, onbeperkte modellen en quota}

🌐 Website • 🚀 Quick Start • 💡 Features • 📖 Docs • 💰 Pricing • 💬 WhatsApp

🖼️

📸

...

#	#
1
2
3
4
5
6
7
8
9

🤔 Waarom OmniRoute?

Stop met het verspillen van geld en het bereiken van grenzen:

Het abonnementsquotum verloopt elke maand ongebruikt
Snelheidslimieten voorkomen dat u halverwege codeert
Dure API's ($20-50/maand per provider)
Handmatig schakelen tussen providers

OmniRoute lost dit op:

✅ Maximaliseer abonnementen - Houd quota bij, gebruik elk bit voordat u het opnieuw instelt
✅ Automatische fallback - Abonnement → API-sleutel → Goedkoop → Gratis, geen downtime
✅ Multi-account - Round-robin tussen accounts per provider
✅ Universeel - Werkt met Claude Code, Codex, Gemini CLI, Cursor, Cline, OpenClaw, elke CLI-tool

📧 Ondersteuning

💬 Word lid van onze community! WhatsApp Group — Krijg hulp, deel tips en blijf op de hoogte.

Website: omniroute.online
GitHub: github.com/diegosouzapw/OmniRoute
Problemen: github.com/diegosouzapw/OmniRoute/issues
WhatsApp: Community Group
Origineel project: 9router by decolua

🔄 Hoe het werkt

┌─────────────┐
│  Your CLI   │  (Claude Code, Codex, Gemini CLI, OpenClaw, Cursor, Cline...)
│   Tool      │
└──────┬──────┘
       │ http://localhost:20128/v1
       ↓
┌─────────────────────────────────────────┐
│           OmniRoute (Smart Router)        │
│  • Format translation (OpenAI ↔ Claude) │
│  • Quota tracking + Embeddings + Images │
│  • Auto token refresh                   │
└──────┬──────────────────────────────────┘
       │
       ├─→ [Tier 1: SUBSCRIPTION] Claude Code, Codex, Gemini CLI
       │   ↓ quota exhausted
       ├─→ [Tier 2: API KEY] DeepSeek, Groq, xAI, Mistral, NVIDIA NIM, etc.
       │   ↓ budget limit
       ├─→ [Tier 3: CHEAP] GLM ($0.6/1M), MiniMax ($0.2/1M)
       │   ↓ budget limit
       └─→ [Tier 4: FREE] iFlow, Qwen, Kiro (unlimited)

Result: Never stop coding, minimal cost

🎯 Wat OmniRoute oplost — 30 echte pijnpunten en gebruiksscenario's

Elke ontwikkelaar die AI-tools gebruikt, wordt dagelijks met deze problemen geconfronteerd. OmniRoute is gebouwd om ze allemaal op te lossen: van kostenoverschrijdingen tot regionale blokkades, van kapotte OAuth-stromen tot protocolbewerkingen en bedrijfsobservatie.

💸 1. "Ik betaal voor een duur abonnement, maar word nog steeds onderbroken door limieten"

Ontwikkelaars betalen $20-200/maand voor Claude Pro, Codex Pro of GitHub Copilot. Zelfs als je betaalt, heeft het quotum een plafond: 5 uur gebruik, wekelijkse limieten of tarieflimieten per minuut. Halverwege de codeersessie reageert de provider niet meer en verliest de ontwikkelaar flow en productiviteit.

Hoe OmniRoute het oplost:

Smart 4-Tier Fallback — Als het abonnementsquotum opraakt, wordt automatisch doorgestuurd naar API Key → Goedkoop → Gratis zonder handmatige tussenkomst
Realtime bijhouden van quota — Toont het tokenverbruik in realtime met aftellen van de reset (5 uur, dagelijks, wekelijks)
Ondersteuning voor meerdere accounts — Meerdere accounts per provider met automatische round-robin — als de ene op is, wordt er overgeschakeld naar de volgende
Aangepaste combo's — Aanpasbare fallback-ketens met 6 balanceringsstrategieën (fill-first, round-robin, P2C, willekeurig, minst gebruikt, kostengeoptimaliseerd)
Codex Business Quota — Quotabewaking van zakelijke/teamwerkruimte rechtstreeks in het dashboard

🔌 2. "Ik moet meerdere providers gebruiken, maar elk heeft een andere API"

OpenAI gebruikt het ene formaat, Claude (Anthropic) gebruikt een ander, Gemini nog een ander. Als een ontwikkelaar modellen van verschillende providers wil testen of terug wil vallen tussen deze providers, moet hij SDK's opnieuw configureren, eindpunten wijzigen en omgaan met incompatibele formaten. Aangepaste providers (FriendLI, NIM) hebben niet-standaard modeleindpunten.

Hoe OmniRoute het oplost:

Unified Endpoint — Eén enkele http://localhost:20128/v1 dient als proxy voor alle 36+ providers
Formatvertaling — Automatisch en transparant: OpenAI ↔ Claude ↔ Gemini ↔ Responses API
Response Sanitization — Verwijdert niet-standaardvelden (x_groq, usage_breakdown, service_tier) die OpenAI SDK v1.83+ breken
Rolnormalisatie — Converteert developer → system voor niet-OpenAI-providers; system → user voor GLM/ERNIE
Think Tag Extraction — Extraheert <think>-blokken uit modellen zoals DeepSeek R1 naar gestandaardiseerde reasoning_content
Gestructureerde uitvoer voor Gemini — json_schema → responseMimeType/responseSchema automatische conversie
stream is standaard ingesteld op false — Sluit aan bij de OpenAI-specificaties en vermijdt onverwachte SSE in Python/Rust/Go SDK's

🌐 3. "Mijn AI-provider blokkeert mijn regio/land"

Providers zoals OpenAI/Codex blokkeren de toegang vanuit bepaalde geografische regio's. Gebruikers krijgen fouten zoals unsupported_country_region_territory tijdens OAuth- en API-verbindingen. Dit is vooral frustrerend voor ontwikkelaars uit ontwikkelingslanden.

Hoe OmniRoute het oplost:

Proxyconfiguratie op 3 niveaus — Configureerbare proxy op 3 niveaus: globaal (al het verkeer), per provider (slechts één provider) en per verbinding/sleutel
Kleurgecodeerde proxybadges — Visuele indicatoren: 🟢 globale proxy, 🟡 providerproxy, 🔵verbindingsproxy, waarbij altijd het IP-adres wordt weergegeven
OAuth-tokenuitwisseling via proxy: de OAuth-stroom verloopt ook via de proxy, waardoor unsupported_country_region_territory wordt opgelost
Verbindingstests via proxy — Verbindingstests gebruiken de geconfigureerde proxy (geen directe bypass meer)
SOCKS5-ondersteuning — Volledige SOCKS5-proxyondersteuning voor uitgaande routering
TLS Fingerprint Spoofing — Browserachtige TLS-vingerafdruk via wreq-js om botdetectie te omzeilen

🆓 4. "Ik wil AI gebruiken voor codering, maar ik heb geen geld"

Niet iedereen kan $ 20-200 per maand betalen voor AI-abonnementen. Studenten, ontwikkelaars uit opkomende landen, hobbyisten en freelancers hebben kosteloos toegang nodig tot kwaliteitsmodellen.

Hoe OmniRoute het oplost:

Free Tier Providers ingebouwd — Native ondersteuning voor 100% gratis providers: iFlow (8 onbeperkte modellen), Qwen (3 onbeperkte modellen), Kiro (Claude gratis), Gemini CLI (180K/maand gratis)
Alleen gratis combo's — Chain gc/gemini-3-flash → if/kimi-k2-thinking → qw/qwen3-coder-plus = $ 0/maand zonder downtime
NVIDIA NIM Free Credits — 1000 gratis credits geïntegreerd
Kostengeoptimaliseerde strategie — Routingstrategie die automatisch de goedkoopste beschikbare provider kiest

🔒 5. "Ik moet mijn AI-gateway beschermen tegen ongeoorloofde toegang"

Bij het blootstellen van een AI-gateway aan het netwerk (LAN, VPS, Docker) kan iedereen met het adres de tokens/quota van de ontwikkelaar gebruiken. Zonder bescherming zijn API's kwetsbaar voor misbruik, snelle injectie en misbruik.

Hoe OmniRoute het oplost:

API Key Management — Generatie, rotatie en bereik per provider met een speciale /dashboard/api-manager-pagina
Machtigingen op modelniveau — Beperk API-sleutels tot specifieke modellen (openai/*, jokertekenpatronen), met de schakelaar Alles toestaan/Beperken
API Endpoint Protection — Vereist een sleutel voor /v1/models en blokkeer specifieke providers uit de lijst
Auth Guard + CSRF-bescherming — Alle dashboardroutes beschermd met withAuth middleware + CSRF-tokens
Rate Limiter — Per-IP-snelheidslimiet met configureerbare vensters
IP-filtering — Toelatingslijst/blokkeerlijst voor toegangscontrole
Prompt Injection Guard — Sanering tegen kwaadaardige promptpatronen
AES-256-GCM-codering — Inloggegevens gecodeerd in rust

🛑 6. "Mijn provider is uitgevallen en ik ben mijn codeerstroom kwijt"

AI-aanbieders kunnen instabiel worden, 5xx-fouten retourneren of tijdelijke tarieflimieten bereiken. Als een ontwikkelaar afhankelijk is van één enkele provider, worden deze onderbroken. Zonder stroomonderbrekers kunnen herhaalde pogingen de toepassing laten crashen.

Hoe OmniRoute het oplost:

Stroomonderbreker per provider — Automatisch openen/sluiten met configureerbare drempels en cooldown (gesloten/open/halfopen)
Exponentiële uitstel — Progressieve vertragingen bij nieuwe pogingen
Anti-Thundering Herd — Mutex + semafoorbescherming tegen gelijktijdige nieuwe stormen
Combo Fallback Chains — Als de primaire provider faalt, valt deze automatisch zonder tussenkomst door de keten
Combo-stroomonderbreker — Schakelt falende providers binnen een combo-keten automatisch uit
Gezondheidsdashboard — Uptime-monitoring, status van stroomonderbrekers, uitsluitingen, cachestatistieken, p50/p95/p99-latentie

🔧 7. "Het configureren van elke AI-tool is vervelend en repetitief"

Ontwikkelaars gebruiken Cursor, Claude Code, Codex CLI, OpenClaw, Gemini CLI, Kilo Code... Elke tool heeft een andere configuratie nodig (API-eindpunt, sleutel, model). Opnieuw configureren bij het wisselen van provider of model is tijdverspilling.

Hoe OmniRoute het oplost:

CLI Tools Dashboard — Speciale pagina met installatie met één klik voor Claude Code, Codex CLI, OpenClaw, Kilo Code, Antigravity, Cline
GitHub Copilot Config Generator — Genereert chatLanguageModels.json voor VS-code met bulkmodelselectie
Onboarding Wizard — Begeleide installatie in 4 stappen voor nieuwe gebruikers
Eén eindpunt, alle modellen — Configureer http://localhost:20128/v1 één keer, krijg toegang tot meer dan 36 providers

🔑 8. "Het beheren van OAuth-tokens van meerdere providers is een hel"

Claude Code, Codex, Gemini CLI, Copilot: ze gebruiken allemaal OAuth 2.0 met aflopende tokens. Ontwikkelaars moeten zich voortdurend opnieuw authenticeren en omgaan met client_secret is missing, redirect_uri_mismatch en storingen op externe servers. OAuth op LAN/VPS is bijzonder problematisch.

Hoe OmniRoute het oplost:

Automatische tokenvernieuwing: OAuth-tokens worden op de achtergrond vernieuwd voordat ze verlopen
OAuth 2.0 (PKCE) ingebouwd — Automatische stroom voor Claude Code, Codex, Gemini CLI, Copilot, Kiro, Qwen, iFlow
Multi-Account OAuth — Meerdere accounts per provider via JWT/ID-tokenextractie
OAuth LAN/Remote Fix — Privé-IP-detectie voor redirect_uri + handmatige URL-modus voor externe servers
OAuth achter Nginx — gebruikt window.location.origin voor reverse proxy-compatibiliteit
Remote OAuth-handleiding — Stapsgewijze handleiding voor Google Cloud-inloggegevens op VPS/Docker

📊 9. "Ik weet niet hoeveel ik uitgeef of waar"

Ontwikkelaars gebruiken meerdere betaalde providers, maar hebben geen uniform beeld van de uitgaven. Elke provider heeft zijn eigen factureringsdashboard, maar er is geen geconsolideerd overzicht. Onverwachte kosten kunnen zich opstapelen.

Hoe OmniRoute het oplost:

Cost Analytics Dashboard — Kostenregistratie per token en budgetbeheer per provider
Budgetlimieten per niveau — Uitgavenplafond per niveau dat automatische terugval activeert
Prijsconfiguratie per model — Configureerbare prijzen per model
Gebruiksstatistieken per API-sleutel — Verzoekaantal en laatst gebruikte tijdstempel per sleutel
Analytics Dashboard — Statistiekkaarten, modelgebruiksgrafiek, providertabel met succespercentages en latentie

🐛 10. "Ik kan geen fouten en problemen in AI-oproepen diagnosticeren"

Wanneer een oproep mislukt, weet de ontwikkelaar niet of het een snelheidslimiet, een verlopen token, een verkeerd formaat of een providerfout is. Gefragmenteerde logboeken over verschillende terminals. Zonder waarneembaarheid is debuggen een kwestie van vallen en opstaan.

Hoe OmniRoute het oplost:

Unified Logs Dashboard — 4 tabbladen: aanvraaglogboeken, proxylogboeken, auditlogboeken, console
Consolelogviewer — Realtime viewer in terminalstijl met kleurgecodeerde niveaus, automatisch scrollen, zoeken, filteren
SQLite Proxy Logs — Persistente logs die het opnieuw opstarten van de server overleven
Translator Playground — 4 foutopsporingsmodi: Playground (formaatvertaling), Chat Tester (retour), Testbank (batch), Live Monitor (realtime)
Request Telemetry — p50/p95/p99 latentie + X-Request-Id-tracering
Op bestanden gebaseerde logboekregistratie met rotatie — Console-interceptor legt alles vast in JSON-logboek met op grootte gebaseerde rotatie

🏗️ 11. "Het implementeren en onderhouden van de gateway is complex"

Het installeren, configureren en onderhouden van een AI-proxy in verschillende omgevingen (lokaal, VPS, Docker, cloud) is arbeidsintensief. Problemen zoals hardgecodeerde paden, EACCES in mappen, poortconflicten en platformonafhankelijke builds zorgen voor wrijving.

Hoe OmniRoute het oplost:

npm globale installatie — npm install -g omniroute && omniroute — klaar
Docker Multi-Platform — AMD64 + ARM64 native (Apple Silicon, AWS Graviton, Raspberry Pi)
Docker Compose Profiles — base (geen CLI-tools) en cli (met Claude Code, Codex, OpenClaw)
Electron Desktop App — Native app voor Windows/macOS/Linux met systeemvak, automatisch starten, offlinemodus
Split-Port-modus — API en Dashboard op afzonderlijke poorten voor geavanceerde scenario's (reverse proxy, containernetwerken)
Cloud Sync — Configureer synchronisatie tussen apparaten via Cloudflare Workers
DB-back-ups — Automatische back-up, herstel, export en import van alle instellingen

🌍 12. "De interface is alleen in het Engels en mijn team spreekt geen Engels"

Teams in niet-Engelssprekende landen, vooral in Latijns-Amerika, Azië en Europa, worstelen met interfaces die alleen in het Engels beschikbaar zijn. Taalbarrières verminderen de adoptie en vergroten de configuratiefouten.

Hoe OmniRoute het oplost:

Dashboard i18n — 30 talen — Alle 500+ toetsen vertaald, waaronder Arabisch, Bulgaars, Deens, Duits, Spaans, Fins, Frans, Hebreeuws, Hindi, Hongaars, Indonesisch, Italiaans, Japans, Koreaans, Maleis, Nederlands, Noors, Pools, Portugees (PT/BR), Roemeens, Russisch, Slowaaks, Zweeds, Thais, Oekraïens, Vietnamees, Chinees, Filipijns, Engels
RTL-ondersteuning — Ondersteuning van rechts naar links voor Arabisch en Hebreeuws
Meertalige README's — 30 volledige documentatievertalingen
Taalkiezer — Wereldbolpictogram in de koptekst voor realtime schakelen

🔄 13. "Ik heb meer nodig dan chatten - ik heb insluitingen, afbeeldingen en audio nodig"

AI is niet alleen het voltooien van chats. Ontwikkelaars moeten afbeeldingen genereren, audio transcriberen, insluitingen voor RAG maken, documenten opnieuw rangschikken en inhoud modereren. Elke API heeft een ander eindpunt en formaat.

Hoe OmniRoute het oplost:

Inbedding — /v1/embeddings met 6 providers en 9+ modellen
Beeldgeneratie — /v1/images/generations met 10 providers en 20+ modellen (OpenAI, xAI, Together, Fireworks, Nebius, Hyperbolic, NanoBanana, Antigravity, SD WebUI, ComfyUI)
Tekst-naar-video — /v1/videos/generations — ComfyUI (AnimateDiff, SVD) en SD WebUI
Tekst-naar-muziek — /v1/music/generations — ComfyUI (Stable Audio Open, MusicGen)
Audiotranscriptie — /v1/audio/transcriptions — Whisper + Nvidia NIM, HuggingFace, Qwen3
Tekst-naar-spraak — /v1/audio/speech — ElevenLabs, Nvidia NIM, HuggingFace, Coqui, Tortoise, Qwen3, + bestaande providers
Moderaties — /v1/moderations — Veiligheidscontroles van inhoud
Herschikking — /v1/rerank — Herschikking van de relevantie van documenten
Responses API — Volledige /v1/responses-ondersteuning voor Codex

🧪 14. "Ik heb geen manier om de kwaliteit van verschillende modellen te testen en te vergelijken"

Ontwikkelaars willen weten welk model het beste is voor hun gebruiksscenario (code, vertaling, redenering), maar handmatig vergelijken gaat traag. Er bestaan geen geïntegreerde evaluatietools.

Hoe OmniRoute het oplost:

LLM-evaluaties — Golden set-tests met 10 vooraf geladen cases over begroetingen, wiskunde, aardrijkskunde, codegeneratie, JSON-compliance, vertaling, prijsverlaging, veiligheidsweigering
4 Matchstrategieën — exact, contains, regex, custom (JS-functie)
Translator Playground Test Bench — Batchtests met meerdere inputs en verwachte outputs, vergelijking tussen providers
Chat Tester — Volledige rondreis met visuele responsweergave
Live Monitor — Realtime stream van alle verzoeken die door de proxy stromen

📈 15. "Ik moet schalen zonder prestatieverlies"

Naarmate het verzoekvolume groeit, genereren dezelfde vragen dubbele kosten als dezelfde vragen niet in de cache worden opgeslagen. Zonder idempotentie verspillen dubbele aanvragen de verwerking. Tarieflimieten per aanbieder moeten worden gerespecteerd.

Hoe OmniRoute het oplost:

Semantische cache — Cache met twee lagen (handtekening + semantisch) verlaagt de kosten en de latentie
Request Idempotency — 5s deduplicatievenster voor identieke verzoeken
Detectie van tarieflimiet — RPM per provider, minimale tussenruimte en maximale gelijktijdige tracking
Bewerkbare snelheidslimieten — Configureerbare standaardinstellingen in Instellingen → Veerkracht met doorzettingsvermogen
API Key Validation Cache — 3-tier cache voor productieprestaties
Gezondheidsdashboard met telemetrie — p50/p95/p99-latentie, cachestatistieken, uptime

🤖 16. "Ik wil het modelgedrag wereldwijd controleren"

Ontwikkelaars die alle antwoorden in een specifieke taal willen, met een specifieke toon, of redeneringstokens willen beperken. Het is onpraktisch om dit in elke tool/verzoek te configureren.

Hoe OmniRoute het oplost:

Systeempromptinjectie: algemene prompt toegepast op alle verzoeken
Thinking Budget Validation — Redenering van tokentoewijzingscontrole per verzoek (passthrough, automatisch, aangepast, adaptief)
6 Routingstrategieën — Globale strategieën die bepalen hoe verzoeken worden gedistribueerd
Wildcard Router — provider/*-patronen routeren dynamisch naar elke provider
Combo in-/uitschakelen schakelen — Schakel combo's rechtstreeks vanuit het dashboard in
Provider wisselen — Schakel alle verbindingen voor een provider met één klik in/uit
Geblokkeerde providers: sluit specifieke providers uit van de /v1/models-lijst

🧰 17. "Ik heb MCP-tools nodig als eersteklas productmogelijkheden"

Veel AI-gateways stellen MCP alleen bloot als een verborgen implementatiedetail. Teams hebben een zichtbare, beheersbare operationele laag nodig.

Hoe OmniRoute het oplost:

MCP verschijnt op het dashboardnavigatie- en eindpuntprotocoltabblad
Speciale MCP-beheerpagina met proces, tools, scopes en audit
Ingebouwde snelstart voor omniroute --mcp en onboarding van klanten

🧠 18. "Ik heb A2A-orkestratie nodig met synchronisatie- en streamtaakpaden"

Agentworkflows hebben zowel directe antwoorden nodig als langdurige gestreamde uitvoering met levenscycluscontrole.

Hoe OmniRoute het oplost:

A2A JSON-RPC-eindpunt (POST /a2a) met message/send en message/stream
SSE-streaming met voortplanting van de terminalstatus
Taaklevenscyclus-API's voor tasks/get en tasks/cancel

🛰️ 19. "Ik heb echte MCP-processtatus nodig, geen geraden status"

Operationele teams moeten weten of MCP daadwerkelijk leeft, en niet alleen of een API bereikbaar is.

Hoe OmniRoute het oplost:

Runtime-hartslagbestand met PID, tijdstempels, transport, aantal gereedschappen en scope-modus
MCP-status-API die hartslag + recente activiteit combineert
UI-statuskaarten voor proces/uptime/hartslagversheid

📋 20. "Ik heb controleerbare MCP-tooluitvoering nodig"

Wanneer tools de configuratie muteren of operationele acties activeren, hebben teams forensische traceerbaarheid nodig.

Hoe OmniRoute het oplost:

SQLite-ondersteunde auditregistratie voor MCP-toolaanroepen
Filters op tool, succes/mislukking, API-sleutel en paginering
Dashboard-audittabel + statistiekeneindpunten voor automatisering

🔐 21. "Ik heb MCP-rechten per integratie nodig"

Verschillende clients moeten toegang tot de toolcategorieën met de minste bevoegdheden hebben.

Hoe OmniRoute het oplost:

9 gedetailleerde MCP-scopes voor gecontroleerde toegang tot tools
Scopehandhaving en zichtbaarheid in de MCP-beheerinterface
Veilige standaardhouding voor operationeel gereedschap

⚙️ 22. "Ik heb operationele controles nodig zonder opnieuw te implementeren"

Teams hebben snelle runtimewijzigingen nodig tijdens incidenten of kostengebeurtenissen.

Hoe OmniRoute het oplost:

Schakel combo-activering rechtstreeks vanuit het MCP-dashboard
Pas veerkrachtprofielen toe uit vooraf gedefinieerde beleidspakketten
Reset de status van de stroomonderbreker vanaf hetzelfde bedieningspaneel

🔄 23. "Ik heb live zichtbaarheid en annulering van de levenscyclus van A2A-taken nodig"

Zonder inzicht in de levenscyclus worden taakincidenten moeilijk te beoordelen.

Hoe OmniRoute het oplost:

Takenlijst/filteren op staat/vaardigheid met paginering
Inzoomen op taakmetagegevens, gebeurtenissen en artefacten
Eindpunt voor het annuleren van taken en UI-actie met bevestiging

🌊 24. "Ik heb actieve streamstatistieken nodig voor A2A-belasting"

Streamingworkflows vereisen operationeel inzicht in gelijktijdigheid en liveverbindingen.

Hoe OmniRoute het oplost:

Actieve streamtellers geïntegreerd in de A2A-status
Tijdstempel van de laatste taak en tellingen per staat
A2A-dashboardkaarten voor real-time operationele monitoring

🪪 25. "Ik heb standaard agentdetectie nodig voor klanten"

Externe klanten en orkestrators hebben machinaal leesbare metagegevens nodig voor onboarding.

Hoe OmniRoute het oplost:

Agentkaart zichtbaar op /.well-known/agent.json
Mogelijkheden en vaardigheden weergegeven in de management-UI
A2A-status-API bevat ontdekkingsmetagegevens voor automatisering

🧭 26. "Ik heb protocolvindbaarheid nodig in de product-UX"

Als gebruikers protocoloppervlakken niet kunnen ontdekken, neemt de acceptatie- en ondersteuningskwaliteit af.

Hoe OmniRoute het oplost:

Zijbalkinvoer voor MCP en A2A
Eindpuntpagina Tabblad Protocollen met snelstart en status
Koppelingen van overzicht naar speciale managementdashboards

🧪 27. "Ik heb end-to-end protocolvalidatie nodig met echte clients"

Mock-tests zijn niet voldoende om de protocolcompatibiliteit vóór de release te valideren.

Hoe OmniRoute het oplost:

E2E-suite die de app opstart en echt MCP SDK-clienttransport gebruikt
A2A-clienttests voor het ontdekken, verzenden, streamen, ophalen en annuleren van stromen
Controleer beweringen aan de hand van MCP-audit- en A2A-taken-API's

📡 28. "Ik heb uniforme observatie nodig over alle interfaces heen"

Het opsplitsen van de waarneembaarheid per protocol creëert blinde vlekken en een langere MTTR.

Hoe OmniRoute het oplost:

Uniforme dashboards/logboeken/analyses in één product
Gezondheid + audit + verzoektelemetrie over OpenAI-, MCP- en A2A-lagen
Operationele API's voor status en automatisering

💼 29. "Ik heb één runtime nodig voor proxy + tools + agentorkestratie"

Het uitvoeren van veel afzonderlijke services verhoogt de operationele kosten en faalwijzen.

Hoe OmniRoute het oplost:

OpenAI-compatibele proxy, MCP-server en A2A-server in één stapel
Gedeelde authenticatie, veerkracht, gegevensopslag en waarneembaarheid
Consistent beleidsmodel op alle interactieoppervlakken

🚀 30. "Ik moet agentische workflows verzenden zonder wildgroei van lijmcodes"

Teams verliezen snelheid bij het samenvoegen van meerdere ad-hocservices en scripts.

Hoe OmniRoute het oplost:

Uniforme eindpuntstrategie voor klanten en agenten
Ingebouwde gebruikersinterfaces voor protocolbeheer en rookvalidatiepaden
Productieklare fundamenten (beveiliging, loggen, veerkracht, back-up)

Voorbeeld-playbooks (geïntegreerde gebruiksscenario's)

Playbook A: Maximaliseer betaald abonnement + goedkope back-up

Combo: "maximize-claude"
  1. cc/claude-opus-4-6
  2. glm/glm-4.7
  3. if/kimi-k2-thinking

Monthly cost: $20 + small backup spend
Outcome: higher quality, near-zero interruption

Playbook B: Codeerstapel zonder kosten

Combo: "free-forever"
  1. gc/gemini-3-flash
  2. if/kimi-k2-thinking
  3. qw/qwen3-coder-plus

Monthly cost: $0
Outcome: stable free coding workflow

Playbook C: 24/7, altijd actieve fallback-keten

Combo: "always-on"
  1. cc/claude-opus-4-6
  2. cx/gpt-5.2-codex
  3. glm/glm-4.7
  4. minimax/MiniMax-M2.1
  5. if/kimi-k2-thinking

Outcome: deep fallback depth for deadline-critical workloads

Playbook D: Agentoperaties met MCP + A2A

1) Start MCP transport (`omniroute --mcp`) for tool-driven operations
2) Run A2A tasks via `message/send` and `message/stream`
3) Observe via /dashboard/mcp and /dashboard/a2a
4) Control incidents with resilience profile + task cancellation

⚡ Snelle start

1. Wereldwijd installeren:

npm install -g omniroute
omniroute

🎉 Dashboard wordt geopend op http://localhost:20128

Commando	Beschrijving
`omniroute`	Startserver (standaardpoort 20128)
`omniroute --port 3000`	Gebruik aangepaste poort
`omniroute --no-open`	Browser niet automatisch openen
`omniroute --help`	Hulp tonen

2. Sluit een GRATIS provider aan:

Dashboard → Providers → Claude Code of Antigravity verbinden → OAuth-aanmelding → Klaar!

3. Gebruik in uw CLI-tool:

Claude Code/Codex/Gemini CLI/OpenClaw/Cursor/Cline Settings:
  Endpoint: http://localhost:20128/v1
  API Key: [copy from dashboard]
  Model: if/kimi-k2-thinking

Dat is alles! Begin met coderen met GRATIS AI-modellen.

Alternatief — uitvoeren vanaf bron:

cp .env.example .env
npm install
PORT=20128 NEXT_PUBLIC_BASE_URL=http://localhost:20128 npm run dev

🐳 Docker

OmniRoute is beschikbaar als openbare Docker-image op Docker Hub.

Snelle uitvoering:

docker run -d \
  --name omniroute \
  --restart unless-stopped \
  -p 20128:20128 \
  -v omniroute-data:/app/data \
  diegosouzapw/omniroute:latest

Met omgevingsbestand:

# Copy and edit .env first
cp .env.example .env

docker run -d \
  --name omniroute \
  --restart unless-stopped \
  --env-file .env \
  -p 20128:20128 \
  -v omniroute-data:/app/data \
  diegosouzapw/omniroute:latest

** Docker Compose gebruiken:**

# Base profile (no CLI tools)
docker compose --profile base up -d

# CLI profile (Claude Code, Codex, OpenClaw built-in)
docker compose --profile cli up -d

Afbeelding	Label	Maat	Beschrijving
`diegosouzapw/omniroute`	`latest`	~250MB	Nieuwste stabiele release
`diegosouzapw/omniroute`	`1.0.3`	~250MB	Huidige versie

🖥️

🆕 NEW! OmniRoute is now available as a native desktop application for Windows, macOS, and Linux.

🖥️ Native Window — Dedicated app window with system tray integration
🔄 Auto-Start — Launch OmniRoute on system login
🔔 Native Notifications — Get alerts for quota exhaustion or provider issues
⚡ One-Click Install — NSIS (Windows), DMG (macOS), AppImage (Linux)
🌐 Offline Mode — Works fully offline with bundled server

npm run electron:dev           # Development mode
npm run electron:build         # Current platform
npm run electron:build:win     # Windows (.exe)
npm run electron:build:mac     # macOS (.dmg)
npm run electron:build:linux   # Linux (.AppImage)

📖 Full documentation: electron/README.md

💰 Prijzen in één oogopslag

Niveau	Aanbieder	Kosten	Quotum opnieuw instellen	Beste voor
💳 ABONNEMENT	Claude Code (Pro)	$ 20/maand	5u + wekelijks	Al geabonneerd
	Codex (Plus/Pro)	$ 20-200/maand	5u + wekelijks	OpenAI-gebruikers
	Tweeling CLI	GRATIS	180K/maand + 1K/dag	Iedereen!
	GitHub-copiloot	$ 10-19/maand	Maandelijks	GitHub-gebruikers
🔑 API-SLEUTEL	NVIDIA NIM	GRATIS (1000 credits)	Eenmalig	Gratis niveautesten
	DeepSeek	Betalen per gebruik	Geen	Beste prijs/kwaliteit
	Groq	Gratis niveau + betaald	Tarief beperkt	Ultrasnelle gevolgtrekking
	xAI (Grok)	Betalen per gebruik	Geen	Grok-modellen
	Mistral	Gratis niveau + betaald	Tarief beperkt	Europese AI
	OpenRouter	Betalen per gebruik	Geen	100+ modellen
💰GOEDKOOP	GLM-4.7	$ 0,6/1 miljoen	Dagelijks 10.00 uur	Budgetback-up
	MiniMax M2.1	$ 0,2/1 miljoen	5-uurs rollen	Goedkoopste optie
	Kimi K2	$ 9/maand plat	10 miljoen tokens/maand	Voorspelbare kosten
🆓 GRATIS	iFlow	$0	Onbeperkt	8 modellen gratis
	Qwen	$0	Onbeperkt	3 modellen gratis
	Kiro	$0	Onbeperkt	Claude vrij

💡 Pro-tip: Begin met Gemini CLI (180K gratis/maand) + iFlow (onbeperkt gratis) combo = $ 0 kosten!

💡 Belangrijkste kenmerken

🧠 Kernroutering en intelligentie

Kenmerk	Wat het doet
🎯 Slimme terugval op 4 niveaus	Autoroute: Abonnement → API-sleutel → Goedkoop → Gratis
📊 Realtime quota bijhouden	Live tokentelling + reset-aftelling per provider
🔄 Formaatvertaling	OpenAI ↔ Claude ↔ Gemini ↔ Cursor ↔ Kiro naadloos + responsopschoning
👥 Ondersteuning voor meerdere accounts	Meerdere accounts per aanbieder met intelligente selectie
🔄 Automatische tokenvernieuwing	OAuth-tokens worden automatisch vernieuwd bij nieuwe poging
🎨 Aangepaste combo's	6 strategieën: eerst vullen, round-robin, p2c, willekeurig, minst gebruikt, kostengeoptimaliseerd
🧩 Aangepaste modellen	Voeg elke model-ID toe aan elke provider
🌐 Wildcard-router	Stuur `provider/*` patronen dynamisch naar elke provider
🧠 Denkbudget	Passthrough-, automatische, aangepaste en adaptieve modi voor redeneermodellen
🔀 Model Aliases	Auto-forward deprecated model IDs to current replacements (built-in + custom)
⚡ Background Degradation	Auto-route background tasks (titles, summaries) to cheaper models
💬 Systeempromptinjectie	Algemene systeemprompt toegepast op alle verzoeken
📄 Reacties-API	Volledige OpenAI Responses API (`/v1/responses`) ondersteuning voor Codex

🎵 Multimodale API's

Kenmerk	Wat het doet
🖼️ Beeldgeneratie	`/v1/images/generations` — 4 providers, 9+ modellen
📐 Insluitingen	`/v1/embeddings` — 6 providers, 9+ modellen
🎤 Audiotranscriptie	`/v1/audio/transcriptions` — Whisper-compatibel
🔊 Tekst-naar-spraak	`/v1/audio/speech` — Audiosynthese van meerdere providers
🛡️ Moderaties	`/v1/moderations` — Veiligheidscontroles van inhoud
🔀 Herschikking	`/v1/rerank` — Herschikking van documentrelevantie

🛡️ Veerkracht en veiligheid

Kenmerk	Wat het doet
🔌 Stroomonderbreker	Automatisch openen/sluiten per provider met configureerbare drempels
🛡️ Anti-donderende kudde	Mutex + semafoorsnelheidslimiet voor API-sleutelproviders
🧠 Semantische cache	Tweelaagse cache (handtekening + semantisch) verlaagt de kosten en latentie
⚡ Idempotentie aanvragen	5s ontdubbelingsvenster voor dubbele verzoeken
🔒 TLS-vingerafdrukspoofing	Omzeil TLS-gebaseerde botdetectie via wreq-js
🌐 IP-filtering	Toelatingslijst/blokkeerlijst voor API-toegangscontrole
📊 Bewerkbare tarieflimieten	Configureerbare RPM, minimale tussenruimte en maximale gelijktijdigheid op systeemniveau
💾 Rate Limit Persistence	Learned limits survive restarts via SQLite with 60s debounce + 24h staleness
🔄 Token Refresh Resilience	Per-provider circuit breaker (5 fails→30min) + 30s timeout per attempt
🛡 API-eindpuntbescherming	Auth-gating + providerblokkering voor het `/models` eindpunt
🔒 Proxyzichtbaarheid	Kleurgecodeerde badges: 🟢 wereldwijd, 🟡 provider, 🔵 per verbinding met IP-display
🌐 Proxyconfiguratie op 3 niveaus	Configureer proxy's op globaal, per provider of per verbindingsniveau

📊 Waarneembaarheid en analyse

Kenmerk	Wat het doet
📝 Logboekregistratie aanvragen	Foutopsporingsmodus met volledige aanvraag-/antwoordlogboeken
💾 SQLite Proxy-logboeken	Aanhoudende proxylogboeken overleven het opnieuw opstarten van de server
📊 Analytics-dashboard	Recharts-aangedreven: statistische kaarten, modelgebruiksgrafiek, providertabel
📈 Voortgang bijhouden	SSE-voortgangsgebeurtenissen aanmelden voor streaming
🧪 LLM-evaluaties	Gouden settesten met 4 wedstrijdstrategieën
🔍 Telemetrie aanvragen	p50/p95/p99 latentie-aggregatie + X-Request-Id-tracering
📋 Logdashboard	Uniforme pagina met 4 tabbladen: aanvraaglogboeken, proxylogboeken, auditlogboeken, console
🖥️ Consolelogviewer	Realtime viewer in terminalstijl met niveaufilter, zoeken, automatisch scrollen
📑 Op bestanden gebaseerde logboekregistratie	Console-interceptor legt alle uitvoer vast naar JSON-logbestand met rotatie
🏥 Gezondheidsdashboard	Systeemuptime, status van stroomonderbrekers, uitsluitingen, cachestatistieken
💰 Kosten bijhouden	Budgetbeheer + prijsconfiguratie per model

☁️ Implementatie en synchronisatie

Kenmerk	Wat het doet
💾 Cloudsynchronisatie	Synchroniseer de configuratie op verschillende apparaten via Cloudflare Workers
🌐 Overal implementeren	Localhost, VPS, Docker, Cloudflare Workers
🔑 API-sleutelbeheer	Genereer, roteer en bereik API-sleutels per provider
🧙 Onboarding-wizard	Begeleide installatie in 4 stappen voor nieuwe gebruikers
🔧 CLI Tools-dashboard	Configureer met één klik Claude, Codex, Cline, OpenClaw, Kilo, Antigravity
🔄 DB-back-ups	Automatische back-up, herstel, export en import voor alle instellingen
🌐 Internationalisering	Volledige i18n met next-intl — Engels + Portugees (Brazilië) ondersteuning
🌍 Taalkiezer	Wereldbolpictogram in koptekst voor realtime taalwisseling (🇺🇸/🇧🇷)
📂 Aangepaste gegevensmap	`DATA_DIR` env var om standaard `~/.omniroute` opslagpad te overschrijven

📖 Functiedetails

🎯 Slimme terugval op 4 niveaus

Creëer combo's met automatische terugval:

Combo: "my-coding-stack"
  1. cc/claude-opus-4-6        (your subscription)
  2. nvidia/llama-3.3-70b      (free NVIDIA API)
  3. glm/glm-4.7               (cheap backup, $0.6/1M)
  4. if/kimi-k2-thinking       (free fallback)

→ Auto switches when quota runs out or errors occur

📊 Realtime quota bijhouden

Tokenverbruik per aanbieder
Aftellen resetten (5 uur, dagelijks, wekelijks)
Kostenraming voor betaalde niveaus
Maandelijkse uitgavenrapporten

🔄 Formaatvertaling

Naadloze vertaling tussen formaten:

OpenAI ↔ Claude ↔ Gemini ↔ OpenAI-reacties
Uw CLI-tool verzendt OpenAI-formaat → OmniRoute vertaalt → Provider ontvangt native formaat
Werkt met elke tool die aangepaste OpenAI-eindpunten ondersteunt
Reactieopschoning — Verwijdert niet-standaardvelden voor strikte OpenAI SDK-compatibiliteit
Rolnormalisatie — developer → system voor niet-OpenAI; system → user voor GLM/ERNIE-modellen
Extractie van Think-tags — <think> blokken → reasoning_content voor denkmodellen
Gestructureerde uitvoer — json_schema → Gemini's responseMimeType/responseSchema

👥 Ondersteuning voor meerdere accounts

Voeg meerdere accounts per aanbieder toe
Automatische round-robin of op prioriteit gebaseerde routering
Terugval naar het volgende account wanneer één het quotum bereikt

🔄 Automatische tokenvernieuwing

OAuth-tokens worden automatisch vernieuwd voordat ze verlopen
Geen handmatige herauthenticatie nodig
Naadloze ervaring bij alle providers

🎨 Aangepaste combo's

Creëer onbeperkte modelcombinaties
6 strategieën: eerst vullen, round-robin, macht van twee keuzes, willekeurig, minst gebruikt, kostengeoptimaliseerd
Deel combo's op verschillende apparaten met Cloud Sync

🏥 Gezondheidsdashboard

Systeemstatus (uptime, versie, geheugengebruik)
Status van de stroomonderbrekers per provider (Gesloten/Open/Half-Open)
Tarieflimietstatus en actieve uitsluitingen
Kenmerkende cachestatistieken
Latency-telemetrie (p50/p95/p99) + promptcache
Reset de gezondheidsstatus met één klik

🔧 Vertalerspeeltuin

OmniRoute bevat een krachtige ingebouwde Translator Playground met 4 modi voor het debuggen, testen en monitoren van API-vertalingen:

Modus	Beschrijving
💻 Speeltuin	Directe formaatvertaling: plak de hoofdtekst van een API-verzoek en zie direct hoe OmniRoute deze vertaalt tussen providerformaten (OpenAI ↔ Claude ↔ Gemini ↔ Responses API). Bevat voorbeeldsjablonen en automatische detectie van formaten.
💬 Chattester	Stuur echte chatverzoeken via OmniRoute en bekijk het volledige overzicht: uw invoer, het vertaalde verzoek, het antwoord van de provider en het vertaalde antwoord terug. Van onschatbare waarde voor het valideren van combo-routering.
🧪 Proefbank	Batchtestmodus: definieer meerdere testgevallen met verschillende inputs en verwachte outputs, voer ze allemaal tegelijk uit en vergelijk de resultaten van verschillende providers en modellen.
📱Livemonitor	Real-time monitoring van verzoeken: bekijk binnenkomende verzoeken terwijl ze door OmniRoute stromen, bekijk de formaatvertalingen live en identificeer problemen direct.

Toegang: Dashboard → Vertaler (zijbalk)

💾Cloudsynchronisatie

Synchroniseer providers, combo's en instellingen op verschillende apparaten
Automatische achtergrondsynchronisatie
Veilige gecodeerde opslag

🧪 Evaluaties (Evals)

OmniRoute bevat een ingebouwd evaluatieframework om de LLM-responskwaliteit te testen aan de hand van een gouden set. U kunt deze openen via Analytics → Evaluaties in het dashboard.

Ingebouwde gouden set

De vooraf geladen "OmniRoute Golden Set" bevat 10 testcases die betrekking hebben op:

Groeten, wiskunde, aardrijkskunde, codegeneratie
Naleving van JSON-formaat, vertaling, prijsverlaging
Veiligheidsweigering (schadelijke inhoud), tellen, booleaanse logica

Evaluatiestrategieën

Strategie	Beschrijving	Voorbeeld
`exact`	De uitvoer moet exact overeenkomen met	`"4"`
`contains`	De uitvoer moet een subtekenreeks bevatten (niet hoofdlettergevoelig)	`"Paris"`
`regex`	Uitvoer moet overeenkomen met regex-patroon	`"1.2.3"`
`custom`	Aangepaste JS-functie retourneert waar/onwaar	`(output) => output.length > 10`

📖 Installatiehandleiding

💳 Abonnementaanbieders

Claude-code (Pro/Max)

Dashboard → Providers → Connect Claude Code
→ OAuth login → Auto token refresh
→ 5-hour + weekly quota tracking

Models:
  cc/claude-opus-4-6
  cc/claude-sonnet-4-5-20250929
  cc/claude-haiku-4-5-20251001

Pro-tip: Gebruik Opus voor complexe taken, Sonnet voor snelheid. OmniRoute houdt quota bij per model!

OpenAI-codex (Plus/Pro)

Dashboard → Providers → Connect Codex
→ OAuth login (port 1455)
→ 5-hour + weekly reset

Models:
  cx/gpt-5.2-codex
  cx/gpt-5.1-codex-max

Gemini CLI (GRATIS 180K/maand!)

Dashboard → Providers → Connect Gemini CLI
→ Google OAuth
→ 180K completions/month + 1K/day

Models:
  gc/gemini-3-flash-preview
  gc/gemini-2.5-pro

Beste waarde: Enorm gratis niveau! Gebruik dit vóór betaalde niveaus.

GitHub-copiloot

Dashboard → Providers → Connect GitHub
→ OAuth via GitHub
→ Monthly reset (1st of month)

Models:
  gh/gpt-5
  gh/claude-4.5-sonnet
  gh/gemini-3-pro

🔑 API-sleutelproviders

NVIDIA NIM (GRATIS 1000 credits!)

Aanmelden: build.nvidia.com
Ontvang een gratis API-sleutel (inclusief 1000 inferentiecredits)
Dashboard → Provider toevoegen → NVIDIA NIM:
- API-sleutel: nvapi-your-key

Modellen: nvidia/llama-3.3-70b-instruct, nvidia/mistral-7b-instruct en nog meer dan 50

Pro-tip: OpenAI-compatibele API — werkt naadloos samen met de formaatvertaling van OmniRoute!

Diepzoeken

Aanmelden: platform.deepseek.com
Haal de API-sleutel op
Dashboard → Provider toevoegen → DeepSeek

Modellen: deepseek/deepseek-chat, deepseek/deepseek-coder

Groq (gratis niveau beschikbaar!)

Aanmelden: console.groq.com
Ontvang een API-sleutel (inclusief gratis laag)
Dashboard → Provider toevoegen → Groq

Modellen: groq/llama-3.3-70b, groq/mixtral-8x7b

Pro-tip: Ultrasnelle gevolgtrekking — het beste voor realtime coderen!

OpenRouter (meer dan 100 modellen)

Aanmelden: openrouter.ai
Haal de API-sleutel op
Dashboard → Provider toevoegen → OpenRouter

Modellen: Krijg toegang tot meer dan 100 modellen van alle grote providers via één API-sleutel.

💰 Goedkope providers (back-up)

GLM-4.7 (dagelijkse reset, $0,6/1 miljoen)

Aanmelden: Zhipu AI
Haal de API-sleutel op uit het Coderingsplan
Dashboard → API-sleutel toevoegen:
- Aanbieder: glm
- API-sleutel: your-key

Gebruik: glm/glm-4.7

Pro-tip: Coderingsplan biedt 3× quotum tegen 1/7 kosten! Dagelijks resetten om 10:00 uur.

MiniMax M2.1 (5 uur resetten, $0,20/1M)

Aanmelden: MiniMax
Haal de API-sleutel op
Dashboard → API-sleutel toevoegen

Gebruik: minimax/MiniMax-M2.1

Pro-tip: Goedkoopste optie voor lange context (1 miljoen tokens)!

Kimi K2 ($9/maand vast)

Abonneer je: Moonshot AI
Haal de API-sleutel op
Dashboard → API-sleutel toevoegen

Gebruik: kimi/kimi-latest

Pro-tip: Vaste $ 9/maand voor 10 miljoen tokens = $ 0,90/1 miljoen effectieve kosten!

🆓 GRATIS providers (noodback-up)

iFlow (8 GRATIS modellen)

Dashboard → Connect iFlow
→ iFlow OAuth login
→ Unlimited usage

Models:
  if/kimi-k2-thinking
  if/qwen3-coder-plus
  if/glm-4.7
  if/minimax-m2
  if/deepseek-r1

Qwen (3 GRATIS modellen)

Dashboard → Connect Qwen
→ Device code authorization
→ Unlimited usage

Models:
  qw/qwen3-coder-plus
  qw/qwen3-coder-flash

Kiro (Claude GRATIS)

Dashboard → Connect Kiro
→ AWS Builder ID or Google/GitHub
→ Unlimited usage

Models:
  kr/claude-sonnet-4.5
  kr/claude-haiku-4.5

🎨 Combo's maken

Voorbeeld 1: Maximaliseer abonnement → Goedkope back-up

Dashboard → Combos → Create New

Name: premium-coding
Models:
  1. cc/claude-opus-4-6 (Subscription primary)
  2. glm/glm-4.7 (Cheap backup, $0.6/1M)
  3. minimax/MiniMax-M2.1 (Cheapest fallback, $0.20/1M)

Use in CLI: premium-coding

Voorbeeld 2: Alleen gratis (geen kosten)

Name: free-combo
Models:
  1. gc/gemini-3-flash-preview (180K free/month)
  2. if/kimi-k2-thinking (unlimited)
  3. qw/qwen3-coder-plus (unlimited)

Cost: $0 forever!

🔧 CLI-integratie

Cursor-IDE

Settings → Models → Advanced:
  OpenAI API Base URL: http://localhost:20128/v1
  OpenAI API Key: [from OmniRoute dashboard]
  Model: cc/claude-opus-4-6

Claude-code

Gebruik de pagina CLI Tools in het dashboard voor configuratie met één klik, of bewerk ~/.claude/settings.json handmatig.

Codex-CLI

export OPENAI_BASE_URL="http://localhost:20128"
export OPENAI_API_KEY="your-omniroute-api-key"

codex "your prompt"

Open Klauw

Optie 1 — Dashboard (aanbevolen):

Dashboard → CLI Tools → OpenClaw → Select Model → Apply

Optie 2 — Handmatig: Bewerk ~/.openclaw/openclaw.json:

{
  "models": {
    "providers": {
      "omniroute": {
        "baseUrl": "http://127.0.0.1:20128/v1",
        "apiKey": "sk_omniroute",
        "api": "openai-completions"
      }
    }
  }
}

Opmerking: OpenClaw werkt alleen met lokale OmniRoute. Gebruik 127.0.0.1 in plaats van localhost om IPv6-resolutieproblemen te voorkomen.

Cline / Doorgaan / RooCode

Settings → API Configuration:
  Provider: OpenAI Compatible
  Base URL: http://localhost:20128/v1
  API Key: [from OmniRoute dashboard]
  Model: if/kimi-k2-thinking

🐛 Problemen oplossen

Klik om de probleemoplossingsgids uit te vouwen

"Taalmodel heeft geen berichten verstrekt"

Providerquotum opgebruikt → Controleer dashboardquotumtracker
Oplossing: gebruik combo-fallback of schakel over naar een goedkoper niveau

Snelheidslimiet

Abonnementquotum op → Terugval op GLM/MiniMax
Combinatie toevoegen: cc/claude-opus-4-6 → glm/glm-4.7 → if/kimi-k2-thinking

OAuth-token verlopen

Automatisch vernieuwd door OmniRoute
Als de problemen aanhouden: Dashboard → Provider → Opnieuw verbinding maken

Hoge kosten

Controleer gebruiksstatistieken in Dashboard → Kosten
Schakel het primaire model over naar GLM/MiniMax
Gebruik de gratis laag (Gemini CLI, iFlow) voor niet-kritieke taken

Dashboard opent op verkeerde poort

Stel PORT=20128 en NEXT_PUBLIC_BASE_URL=http://localhost:20128 in

Cloudsynchronisatiefouten

Controleer of BASE_URL verwijst naar uw actieve exemplaar
Controleer of CLOUD_URL verwijst naar uw verwachte cloudeindpunt
Houd NEXT_PUBLIC_* waarden afgestemd op de waarden op de server

Eerste login werkt niet

Controleer INITIAL_PASSWORD in .env
Indien niet ingesteld, is het reservewachtwoord 123456

Geen verzoeklogboeken

Stel ENABLE_REQUEST_LOGS=true in in .env

Verbindingstest toont "Ongeldig" voor OpenAI-compatibele providers

Veel providers stellen geen /models eindpunt beschikbaar
OmniRoute v1.0.6+ omvat fallback-validatie via chat-voltooiingen
Zorg ervoor dat de basis-URL het achtervoegsel /v1 bevat

🔐 OAuth

⚠️ BELANGRIJK voor gebruik met OmniRoute op VPS/Docker/server op afstand

OAuth

Deze bewijzen Antigravity en Gemini CLI gebruiken Google OAuth 2.0 voor authenticatie. O Google vraagt dat redirect_uri geen OAuth-stroom gebruikt exatamente een van de URI's vóór de kadaster zonder toepassing van Google Cloud Console.

Omdat OAuth geen OmniRoute heeft geregistreerd, is dit apenas para localhost. Wanneer u OmniRoute op een externe server opent (bijvoorbeeld: https://omniroute.meuservidor.com), of Google een authenticatie aanvraagt:

Error 400: redirect_uri_mismatch

Oplossing: Configureer uw eigen OAuth-credenciais

U kunt precies zien hoe OAuth 2.0 Client ID geen Google Cloud Console heeft met een URI van zijn server.

Passo een passo

1. Toegang tot Google Cloud Console

Abra: https://console.cloud.google.com/apis/credentials

2. Nieuwe OAuth 2.0 client-ID

Klik op "+ Credentials aanmaken" → "OAuth-client-ID"
Applicatietip: "Webapplicatie"
Nome: escolha qualquer nome (bijvoorbeeld: OmniRoute Remote)

3. Adicione als geautoriseerde omleidings-URI's

Geen campagne "Geautoriseerde omleidings-URI's", aanbevolen:

https://seu-servidor.com/callback

Vervang seu-servidor.com door de domicilie of het IP-adres van uw server (inclusief een noodzakelijke poort, bijvoorbeeld: http://45.33.32.156:20128/callback).

4. Bewaar en kopieer als credenciais

U kunt ook op Google klikken op Client-ID en Clientgeheim.

5. Configureer als variáveis de ambiente

Geen .env (of de verschillende omgevingen van Docker):

# Para Antigravity:
ANTIGRAVITY_OAUTH_CLIENT_ID=seu-client-id.apps.googleusercontent.com
ANTIGRAVITY_OAUTH_CLIENT_SECRET=GOCSPX-seu-secret

# Para Gemini CLI:
GEMINI_OAUTH_CLIENT_ID=seu-client-id.apps.googleusercontent.com
GEMINI_OAUTH_CLIENT_SECRET=GOCSPX-seu-secret
GEMINI_CLI_OAUTH_CLIENT_SECRET=GOCSPX-seu-secret

6. Reinicie van OmniRoute

# Se usando npm:
npm run dev

# Se usando Docker:
docker restart omniroute

7. Nieuwe verbinding

Dashboard → Providers → Antigravity (ou Gemini CLI) → OAuth

Nadat Google de juiste verwijzing naar https://seu-servidor.com/callback heeft gemaakt, is deze autenticaal functioneel geworden.

Tijdelijke tijdelijke oplossing (sem credenciais próprias configureren)

Als u geen geloofwaardige geloofwaardigheid meer heeft, is het mogelijk om de stroom handleiding van de URL te gebruiken:

OmniRoute gebruikt een autorisatie-URL van Google
Als u de autorisatie heeft gegeven, zal Google de doorverwijzing naar localhost uitvoeren (die geen externe service biedt)
Kopieer een volledige URL door de browser van uw browser (het bericht dat de pagina niet verder gaat)
Cole essa URL is niet beschikbaar op de verbindingswijze van OmniRoute
Klik op "Verbinden"

Deze tijdelijke oplossing werkt door de autorisatiecode van de URL en is onafhankelijk van het omleiden naar uw autorisatie of niet.

🛠️Technische stapel

Runtime: Node.js 18–22 LTS (⚠️ Node.js 24+ wordt niet ondersteund — better-sqlite3 native binaire bestanden zijn incompatibel)
Taal: TypeScript 5.9 — 100% TypeScript voor src/ en open-sse/ (v1.0.6)
Framework: Next.js 16 + React 19 + Tailwind CSS 4
Database: LowDB (JSON) + SQLite (domeinstatus + proxylogboeken)
Streaming: door de server verzonden gebeurtenissen (SSE)
Auth: OAuth 2.0 (PKCE) + JWT + API-sleutels
Testen: Node.js-testloper (368+ unit-tests)
CI/CD: GitHub-acties (automatische npm-publicatie + Docker Hub bij release)
Website: omniroute.online
Pakket: npmjs.com/package/omniroute
Docker: hub.docker.com/r/diegosouzapw/omniroute
Veerkracht: stroomonderbreker, exponentieel uitstel, anti-donderkudde, TLS-spoofing

📖 Documentatie

Document	Beschrijving
User Guide	Providers, combo's, CLI-integratie, implementatie
API Reference	Alle eindpunten met voorbeelden
Troubleshooting	Veelvoorkomende problemen en oplossingen
Architecture	Systeemarchitectuur en internals
Contributing	Ontwikkelingsopstelling en richtlijnen
OpenAPI Spec	OpenAPI 3.0-specificatie
Security Policy	Kwetsbaarheidsrapportage en beveiligingspraktijken
VM Deployment	Volledige gids: VM + nginx + Cloudflare-installatie
Features Gallery	Visuele dashboardrondleiding met screenshots

📸 Dashboardvoorbeeld

Klik om dashboardscreenshots te bekijken

Pagina	Schermafbeelding
Aanbieders
Combo's
Analytics
Gezondheid
Vertaler
Instellingen
CLI-hulpmiddelen
Gebruikslogboeken
Eindpunt

🗺️

OmniRoute heeft 210+ functies gepland over meerdere ontwikkelingsfasen. Dit zijn de belangrijkste gebieden:

Categorie	Geplande functies	Hoogtepunten
🎯 Endpoint-Aware Models	Custom models declare supported endpoints + API format
🧠 Routing en intelligentie	25+	Routering met de laagste latentie, op tags gebaseerde routering, quota-preflight, P2C-accountselectie
🔒 Beveiliging en naleving	20+	SSRF-verharding, cloaking van inloggegevens, snelheidslimiet per eindpunt, scoping van beheersleutels
📊 Waarneembaarheid	15+	OpenTelemetry-integratie, realtime quotabewaking, kostenregistratie per model
🔄 Provider-integraties	20+	Dynamisch modelregister, cooldowns van providers, Codex met meerdere accounts, parseren van Copilot-quota
⚡ Prestaties	15+	Dubbele cachelaag, promptcache, responscache, streaming keepalive, batch-API
🌐 Ecosysteem	10+	WebSocket API, configuratie hot-reload, gedistribueerde configuratieopslag, commerciële modus

🔜 Binnenkort beschikbaar

🔗 OpenCode-integratie — Native providerondersteuning voor de OpenCode AI-coderings-IDE
🔗 TRAE-integratie — Volledige ondersteuning voor het TRAE AI-ontwikkelingsframework
📦 Batch API — Asynchrone batchverwerking voor bulkaanvragen
🎯 Op tags gebaseerde routering — Routeer verzoeken op basis van aangepaste tags en metagegevens
💰 Laagste kostenstrategie — Selecteer automatisch de goedkoopste beschikbare provider

📝 Volledige functiespecificaties beschikbaar in link (217 gedetailleerde specificaties)

👥 Bijdragers

Hoe u kunt bijdragen

Fork de repository
Maak uw feature branch (git checkout -b feature/amazing-feature)
Leg uw wijzigingen vast (git commit -m 'Add amazing feature')
Duw naar het filiaal (git push origin feature/amazing-feature)
Open een Pull Request

Zie CONTRIBUTING.md voor gedetailleerde richtlijnen.

Er wordt een nieuwe versie uitgebracht

# Create a release — npm publish happens automatically
gh release create v1.0.6 --title "v1.0.6" --generate-notes

📊 Sterrengeschiedenis

🙏 Dankbetuigingen

Speciale dank aan 9router door decolua — het originele project dat deze vork inspireerde. OmniRoute bouwt voort op die ongelooflijke basis met extra functies, multimodale API's en een volledige TypeScript-herschrijving.

Speciale dank aan CLIProxyAPI — de originele Go-implementatie die deze JavaScript-port inspireerde.

📄 Licentie

MIT-licentie - zie LICENSE voor details.

_{Gebouwd met ❤️ voor ontwikkelaars die 24/7 coderen}
_{omniroute.online}

FilesExpand file tree

README.nl.md

Latest commit

History

README.nl.md

File metadata and controls

🚀 OmniRoute — De gratis AI-gateway

Stop nooit met coderen. Slimme routering naar GRATIS en voordelige AI-modellen met automatische terugval.

🤖 Gratis AI-provider voor uw favoriete codeeragenten

🖼️

📸

🤔 Waarom OmniRoute?

📧 Ondersteuning

🔄 Hoe het werkt

🎯 Wat OmniRoute oplost — 30 echte pijnpunten en gebruiksscenario's

Voorbeeld-playbooks (geïntegreerde gebruiksscenario's)

⚡ Snelle start

🐳 Docker

🖥️

💰 Prijzen in één oogopslag

💡 Belangrijkste kenmerken

🧠 Kernroutering en intelligentie

🎵 Multimodale API's

🛡️ Veerkracht en veiligheid

📊 Waarneembaarheid en analyse

☁️ Implementatie en synchronisatie

🎯 Slimme terugval op 4 niveaus

📊 Realtime quota bijhouden

🔄 Formaatvertaling

👥 Ondersteuning voor meerdere accounts

🔄 Automatische tokenvernieuwing

🎨 Aangepaste combo's

🏥 Gezondheidsdashboard

🔧 Vertalerspeeltuin

💾Cloudsynchronisatie

🧪 Evaluaties (Evals)

Ingebouwde gouden set

Evaluatiestrategieën

📖 Installatiehandleiding

Claude-code (Pro/Max)

OpenAI-codex (Plus/Pro)

Gemini CLI (GRATIS 180K/maand!)

GitHub-copiloot

NVIDIA NIM (GRATIS 1000 credits!)

Diepzoeken

Groq (gratis niveau beschikbaar!)

OpenRouter (meer dan 100 modellen)

GLM-4.7 (dagelijkse reset, $0,6/1 miljoen)

MiniMax M2.1 (5 uur resetten, $0,20/1M)

Kimi K2 ($9/maand vast)

iFlow (8 GRATIS modellen)

Qwen (3 GRATIS modellen)

Kiro (Claude GRATIS)

Voorbeeld 1: Maximaliseer abonnement → Goedkope back-up

Voorbeeld 2: Alleen gratis (geen kosten)

Cursor-IDE

Claude-code

Codex-CLI

Open Klauw

Cline / Doorgaan / RooCode

🐛 Problemen oplossen

🔐 OAuth

OAuth

Oplossing: Configureer uw eigen OAuth-credenciais

Passo een passo

Tijdelijke tijdelijke oplossing (sem credenciais próprias configureren)

🛠️Technische stapel

📖 Documentatie

📸 Dashboardvoorbeeld

🗺️

🔜 Binnenkort beschikbaar

👥 Bijdragers

Hoe u kunt bijdragen

Er wordt een nieuwe versie uitgebracht

📊 Sterrengeschiedenis

🙏 Dankbetuigingen

📄 Licentie