🚀 OmniRoute — Den gratis AI-gateway

Stop aldrig med at kode. Smart routing til GRATIS og billige AI-modeller med automatisk fallback.

Din universelle API-proxy — ét slutpunkt, 36+ udbydere, ingen nedetid. Nu med MCP & A2A agentorkestrering.

Chatafslutninger • Indlejringer • Billedgenerering • Video • Musik • Lyd • Genrangering • MCP-server • A2A-protokol • 100 % TypeScript

🌐 Hjemmeside • 🚀 Hurtig start • 💡 Funktioner • 📖 Docs • 💡 Priser • 💬 WhatsApp

🖼️ Hovedbetjeningspanel

📸 Dashboard Preview

Klik for at se skærmbilleder af dashboard

Side	Skærmbillede
Udbydere
Komboer
Analyse
Sundhed
Oversætter
Indstillinger
CLI-værktøjer
Brugslogfiler
Endpunkt

🤖 Gratis AI-udbyder til dine foretrukne kodningsagenter

Tilslut ethvert AI-drevet IDE- eller CLI-værktøj gennem OmniRoute - gratis API-gateway til ubegrænset kodning.

OpenClaw _{⭐ 205K}	NanoBot _{⭐ 20,9K}	PicoClaw _{⭐ 14.6K}	ZeroClaw _{⭐ 9,9K}	IronClaw _{⭐ 2.1K}
OpenCode _{⭐ 106K}	Codex CLI _{⭐ 60.8K}	Claude Kode _{⭐ 67.3K}	Gemini CLI _{⭐ 94.7K}	Kilo-kode _{⭐ 15,5K}

_{📡 Alle agenter opretter forbindelse via http://localhost:20128/v1 eller http://cloud.omniroute.online/v1XQZPH00 og unlimited model conf. quota}



🤔 Hvorfor OmniRoute?

Stop med at spilde penge og nå grænser:

 Abonnementskontingent udløber ubrugt hver måned
 Hastighedsgrænser stopper dig med midtkodning
 Dyre API'er ($20-50/måned pr. udbyder)
 Manuel skift mellem udbydere

OmniRoute løser dette:

✅ Maksimer abonnementer - Spor kvote, brug hver bit før nulstilling
✅ Automatisk fallback - Abonnement → API-nøgle → Billig → Gratis, ingen nedetid
✅ Multi-konto - Round-robin mellem konti pr. udbyder
✅ Universal - Virker med Claude Code, Codex, Gemini CLI, Cursor, Cline, OpenClaw, ethvert CLI-værktøj


📧 Support> 💬 Tilmeld dig vores fællesskab! WhatsApp Group — Få hjælp, del tips, og hold dig opdateret.


Websted: omniroute.online
GitHub: github.com/diegosouzapw/OmniRoute
Problemer: github.com/diegosouzapw/OmniRoute/issues
WhatsApp: Fællesskabsgruppe
Bidrager: Se CONTRIBUTING.md, åbn en PR, eller vælg en good first issue
Originalt projekt: 9router af decolua


🔄 Sådan virker det

┌─────────────┐
│  Your CLI   │  (Claude Code, Codex, Gemini CLI, OpenClaw, Cursor, Cline...)
│   Tool      │
└──────┬──────┘
       │ http://localhost:20128/v1
       ↓
┌─────────────────────────────────────────┐
│           OmniRoute (Smart Router)        │
│  • Format translation (OpenAI ↔ Claude) │
│  • Quota tracking + Embeddings + Images │
│  • Auto token refresh                   │
└──────┬──────────────────────────────────┘
       │
       ├─→ [Tier 1: SUBSCRIPTION] Claude Code, Codex, Gemini CLI
       │   ↓ quota exhausted
       ├─→ [Tier 2: API KEY] DeepSeek, Groq, xAI, Mistral, NVIDIA NIM, etc.
       │   ↓ budget limit
       ├─→ [Tier 3: CHEAP] GLM ($0.6/1M), MiniMax ($0.2/1M)
       │   ↓ budget limit
       └─→ [Tier 4: FREE] iFlow, Qwen, Kiro (unlimited)

Result: Never stop coding, minimal cost


🎯 Hvad OmniRoute løser — 30 rigtige smertepunkter og brugssager


Alle udviklere, der bruger AI-værktøjer, står over for disse problemer dagligt. OmniRoute blev bygget til at løse dem alle - fra omkostningsoverskridelser til regionale blokke, fra ødelagte OAuth-flows til protokoloperationer og observerbarhed i virksomheden.


💸 1. "Jeg betaler for et dyrt abonnement, men bliver stadig afbrudt af grænser"
Udviklere betaler $20-200/måned for Claude Pro, Codex Pro eller GitHub Copilot. Selv ved betaling har kvoten et loft - 5 timers brug, ugentlige grænser eller satsgrænser pr. minut. Mid-coding session, udbyderen holder op med at svare, og udvikleren mister flow og produktivitet.
Sådan løser OmniRoute det:

Smart 4-Tier Fallback — Hvis abonnementskvoten løber ud, omdirigeres automatisk til API Key → Billig → Gratis uden manuel indgriben
Kvotesporing i realtid — Viser tokenforbrug i realtid med nulstillingsnedtælling (5 timer, dagligt, ugentligt)
Multi-Account Support - Flere konti pr. udbyder med automatisk round-robin - når den ene løber tør, skifter til den næste
Custom Combos — Tilpasselige fallback-kæder med 6 balanceringsstrategier (fill-first, round-robin, P2C, tilfældig, mindst brugt, omkostningsoptimeret)
Codex Business Quotas — Business/Team Workspace kvoteovervågning direkte i dashboardet



🔌 2. "Jeg skal bruge flere udbydere, men hver har en forskellig API"
OpenAI bruger et format, Claude (Antropisk) bruger et andet, Gemini endnu et andet. Hvis en udvikler ønsker at teste modeller fra forskellige udbydere eller fallback mellem dem, skal de omkonfigurere SDK'er, ændre slutpunkter, håndtere inkompatible formater. Tilpassede udbydere (FriendLI, NIM) har ikke-standardmodelslutpunkter.
Sådan løser OmniRoute det:

Unified Endpoint — En enkelt http://localhost:20128/v1 fungerer som proxy for alle 36+ udbydere
Formatoversættelse — Automatisk og gennemsigtig: OpenAI ↔ Claude ↔ Gemini ↔ Responses API
Responssanering — Fjerner ikke-standardfelter (x_groq, usage_breakdown, service_tier), der bryder OpenAI SDK v1.83+
Rollenormalisering — Konverterer developer → system for ikke-OpenAI-udbydere; system → user til GLM/ERNIE
Think Tag Extraction — Udtrækker <think>-blokke fra modeller som DeepSeek R1 til standardiseret reasoning_content
Structured Output for Gemini — json_schema → responseMimeType/responseSchema automatisk konvertering
stream er som standard false — Justerer med OpenAI-specifikationer, og undgår uventede SSE i Python/Rust/Go SDK'er


🌐 3. "Min AI-udbyder blokerer mit område/land"
Udbydere som OpenAI/Codex blokerer adgang fra visse geografiske områder. Brugere får fejl som unsupported_country_region_territory under OAuth- og API-forbindelser. Dette er især frustrerende for udviklere fra udviklingslande.
Sådan løser OmniRoute det:

3-Level Proxy Config — Konfigurerbar proxy på 3 niveauer: global (al trafik), pr. udbyder (kun én udbyder) og pr. forbindelse/nøgle
Farvekodede proxy-badges — Visuelle indikatorer: 🟢 global proxy, 🟡 udbyder proxy, 🔵 forbindelsesproxy, viser altid IP'en
OAuth-tokenudveksling gennem proxy — OAuth-flowet går også gennem proxyen og løser unsupported_country_region_territory
Forbindelsestest via proxy — Forbindelsestest bruger den konfigurerede proxy (ikke mere direkte omgåelse)
SOCKS5-understøttelse — Fuld SOCKS5-proxy-understøttelse til udgående routing
TLS Fingerprint Spoofing — Browserlignende TLS-fingeraftryk via wreq-js for at omgå botdetektion



🆓 4. "Jeg vil bruge AI til kodning, men jeg har ingen penge"
Ikke alle kan betale $20-200/måned for AI-abonnementer. Studerende, udviklere fra vækstlande, hobbyfolk og freelancere har brug for adgang til kvalitetsmodeller uden omkostninger.
Sådan løser OmniRoute det:

Free Tier Providers Indbygget — Indbygget support for 100 % gratis udbydere: iFlow (8 ubegrænsede modeller), Qwen (3 ubegrænsede modeller), Kiro (Claude gratis), Gemini CLI (180K/måned gratis)
Kun gratis kombinationer — Kæde gc/gemini-3-flash → if/kimi-k2-thinking → qw/qwen3-coder-plus = $0/måned uden nedetid
NVIDIA NIM gratis kreditter — 1000 gratis kreditter integreret
Cost Optimized Strategy — Routingstrategi, der automatisk vælger den billigste tilgængelige udbyder



🔒 5. "Jeg skal beskytte min AI-gateway mod uautoriseret adgang" 
Når en AI-gateway eksponeres for netværket (LAN, VPS, Docker), kan enhver med adressen forbruge udviklerens tokens/kvote. Uden beskyttelse er API'er sårbare over for misbrug, hurtig injektion og misbrug.
Sådan løser OmniRoute det:

API Key Management — Generering, rotation og scoping pr. udbyder med en dedikeret /dashboard/api-manager side
Tilladelser på modelniveau — Begræns API-nøgler til specifikke modeller (openai/*, jokertegnmønstre) med Tillad alt/Begræns-skift
API Endpoint Protection — Kræv en nøgle til /v1/models og bloker specifikke udbydere fra fortegnelsen
Auth Guard + CSRF Protection — Alle dashboard-ruter beskyttet med withAuth middleware + CSRF-tokens
Rate Limiter — Per-IP hastighedsbegrænsning med konfigurerbare vinduer
IP-filtrering — Tilladelsesliste/blokeringsliste til adgangskontrol
Prompt Injection Guard — Sanering mod ondsindede promptmønstre
AES-256-GCM-kryptering — Legitimationsoplysninger krypteret i hvile



🛑 6. "Min udbyder gik ned, og jeg mistede mit kodningsflow"AI-udbydere kan blive ustabile, returnere 5xx-fejl eller ramme midlertidige hastighedsgrænser. Hvis en udvikler afhænger af en enkelt udbyder, bliver de afbrudt. Uden strømafbrydere kan gentagne genforsøg crashe programmet.
Sådan løser OmniRoute det:

Circuit Breaker pr. udbyder — Automatisk åbning/lukning med konfigurerbare tærskler og nedkøling (lukket/åbent/halvt åbent)
| 🎯 Endpoint-Aware Models | Custom models declare supported endpoints + API format |
Eksponentiel backoff — Progressive forsinkelser af genforsøg
Anti-tordenbesætning — Mutex + semaforbeskyttelse mod samtidige genforsøgsstorme
Combo Fallback Chains — Hvis den primære udbyder fejler, falder den automatisk gennem kæden uden indgriben
Combo Circuit Breaker - Deaktiverer automatisk fejlende udbydere i en kombinationskæde
| 🎯 Endpoint-Aware Models | Custom models declare supported endpoints + API format |
Health Dashboard — Oppetidsovervågning, strømafbrydertilstande, lockouts, cachestatistik, p50/p95/p99 latency



🔧 7. "Konfiguration af hvert AI-værktøj er trættende og gentagende" 
Udviklere bruger Cursor, Claude Code, Codex CLI, OpenClaw, Gemini CLI, Kilo Code... Hvert værktøj har brug for en anden konfiguration (API-endepunkt, nøgle, model). At omkonfigurere, når du skifter udbyder eller model, er spild af tid.
Sådan løser OmniRoute det:

CLI Tools Dashboard — Dedikeret side med et-klik opsætning til Claude Code, Codex CLI, OpenClaw, Kilo Code, Antigravity, Cline
GitHub Copilot Config Generator — Genererer chatLanguageModels.json til VS-kode med bulk modelvalg
Onboarding Wizard — Guidet 4-trins opsætning for førstegangsbrugere
Ét slutpunkt, alle modeller — Konfigurer http://localhost:20128/v1 én gang, få adgang til 36+ udbydere



🔑 8. "Administration af OAuth-tokens fra flere udbydere er et helvede" 
Claude Code, Codex, Gemini CLI, Copilot - alle bruger OAuth 2.0 med udløbende tokens. Udviklere skal re-godkende konstant, håndtere client_secret is missing, redirect_uri_mismatch og fejl på fjernservere. OAuth på LAN/VPS er særligt problematisk.
Sådan løser OmniRoute det:

Automatisk tokenopdatering — OAuth-tokens opdateres i baggrunden før udløb
OAuth 2.0 (PKCE) Indbygget — Automatisk flow for Claude Code, Codex, Gemini CLI, Copilot, Kiro, Qwen, iFlow
Multi-Account OAuth — Flere konti pr. udbyder via JWT/ID-tokenudtrækning
OAuth LAN/Remote Fix — Privat IP-detektion for redirect_uri + manuel URL-tilstand til fjernservere
OAuth Behind Nginx — Bruger window.location.origin til omvendt proxykompatibilitet
Remote OAuth Guide — Trin-for-trin guide til Google Cloud-legitimationsoplysninger på VPS/Docker



📊 9. "Jeg ved ikke, hvor meget jeg bruger eller hvor" 
Udviklere bruger flere betalte udbydere, men har ikke noget samlet syn på udgifter. Hver udbyder har sit eget faktureringsdashboard, men der er ingen konsolideret visning. Uventede omkostninger kan hobe sig op.
Sådan løser OmniRoute det:

Dashboard for omkostningsanalyse — omkostningssporing pr. token og budgetstyring pr. udbyder
Budgetgrænser pr. niveau — Udgiftsloft pr. niveau, der udløser automatisk fallback
Priskonfiguration pr. model — Konfigurerbare priser pr. model- Brugsstatistik pr. API-nøgle — Antal anmodninger og sidst anvendte tidsstempel pr. nøgle
Analytics Dashboard — Statiske kort, modelbrugsdiagram, udbydertabel med succesrater og latens



🐛 10. "Jeg kan ikke diagnosticere fejl og problemer i AI-opkald"
Når et opkald mislykkes, ved udvikleren ikke, om det var en takstgrænse, udløbet token, forkert format eller udbyderfejl. Fragmenterede logfiler på tværs af forskellige terminaler. Uden observerbarhed er fejlfinding trial-and-error.
Sådan løser OmniRoute det:

Unified Logs Dashboard — 4 faner: Request Logs, Proxy Logs, Audit Logs, Console
Console Log Viewer — Realtidsterminal-fremviser med farvekodede niveauer, automatisk rulning, søg, filtrer
SQLite Proxy Logs — Vedvarende logfiler, der overlever servergenstarter
Oversætterlegeplads — 4 fejlfindingstilstande: Legeplads (formatoversættelse), Chattester (rundtur), Testbænk (batch), Live Monitor (realtid)
Request Telemetri — p50/p95/p99 latency + X-Request-Id-sporing
Filbaseret logning med rotation — Konsolinterceptor fanger alt til JSON-log med størrelsesbaseret rotation



🏗️ 11. "Deployering og vedligeholdelse af gatewayen er kompleks" 
Installation, konfiguration og vedligeholdelse af en AI-proxy på tværs af forskellige miljøer (lokalt, VPS, Docker, cloud) er arbejdskrævende. Problemer som hårdkodede stier, EACCES på mapper, portkonflikter og cross-platform builds tilføjer friktion.
Sådan løser OmniRoute det:

npm global installation — npm install -g omniroute && omniroute — udført
Docker Multi-Platform — AMD64 + ARM64 native (Apple Silicon, AWS Graviton, Raspberry Pi)
Docker Compose Profiles — base (ingen CLI-værktøjer) og cli (med Claude Code, Codex, OpenClaw)
Electron Desktop App — Indbygget app til Windows/macOS/Linux med systembakke, autostart, offlinetilstand
Split-Port Mode — API og Dashboard på separate porte til avancerede scenarier (omvendt proxy, containernetværk)
Cloud Sync — Konfigurer synkronisering på tværs af enheder via Cloudflare Workers
DB Backups — Automatisk backup, gendannelse, eksport og import af alle indstillinger



🌍 12. "Grænsefladen er kun engelsk, og mit team taler ikke engelsk"
Hold i ikke-engelsktalende lande, især i Latinamerika, Asien og Europa, kæmper med grænseflader, der kun er på engelsk. Sprogbarrierer reducerer adoption og øger konfigurationsfejl.
Sådan løser OmniRoute det:

Dashboard i18n — 30 sprog — Alle 500+ taster oversat, inklusive arabisk, bulgarsk, dansk, tysk, spansk, finsk, fransk, hebraisk, hindi, ungarsk, indonesisk, italiensk, japansk, koreansk, malaysisk, hollandsk, norsk, polsk, portugisisk (PT/BR), rumænsk, russisk, ukrainsk, kinesisk, ukrainsk, kinesisk, kinesisk, ukrainsk, kinesisk, ukrainsk, kinesisk, ukrainsk, svensk, Vietnam, Vietnam
RTL-understøttelse — Højre-til-venstre-understøttelse for arabisk og hebraisk
Multi-Language READMEs — 30 komplette dokumentationsoversættelser
Sprogvælger — Globusikon i overskriften til skift i realtid


🔄 13. "Jeg har brug for mere end chat — jeg har brug for indlejringer, billeder, lyd"
AI er ikke kun fuldførelse af chat. Udviklere skal generere billeder, transskribere lyd, oprette indlejringer til RAG, omrangere dokumenter og moderere indhold. Hver API har et andet slutpunkt og format.
Sådan løser OmniRoute det:

Indlejringer — /v1/embeddings med 6 udbydere og 9+ modeller
Billedgenerering — /v1/images/generations med 10 udbydere og 20+ modeller (OpenAI, xAI, Together, Fireworks, Nebius, Hyperbolic, NanoBanana, Antigravity, SD WebUI, ComfyUI)
Tekst-til-video — /v1/videos/generations — ComfyUI (AnimateDiff, SVD) og SD WebUI
Tekst-til-musik — /v1/music/generations — ComfyUI (Stable Audio Open, MusicGen)
Lydtransskription — /v1/audio/transcriptions — Whisper + Nvidia NIM, HuggingFace, Qwen3
Tekst-til-tale — /v1/audio/speech — ElevenLabs, Nvidia NIM, HuggingFace, Coqui, Tortoise, Qwen3, + eksisterende udbydere
Moderationer — /v1/moderations — Indholdssikkerhedstjek
Omrangering — /v1/rerank — Omrangering af dokumentrelevans
Responses API — Fuld /v1/responses-understøttelse af Codex



🧪 14. "Jeg har ingen måde at teste og sammenligne kvalitet på tværs af modeller" 
Udviklere vil gerne vide, hvilken model der er bedst til deres brug - kode, oversættelse, ræsonnement - men manuel sammenligning er langsom. Der findes ingen integrerede evalueringsværktøjer.
Sådan løser OmniRoute det:

LLM-evalueringer — Gyldne sæt-test med 10 forudindlæste cases, der dækker hilsner, matematik, geografi, kodegenerering, JSON-overholdelse, oversættelse, markdown, sikkerhedsafvisning
4 matchstrategier — exact, contains, regex, custom (JS-funktion)
Translator Playground Test Bench — Batchtest med flere input og forventede output, sammenligning på tværs af udbydere
Chattester — Fuld rundtur med visuel responsgengivelse
Live Monitor — Realtidsstream af alle anmodninger, der flyder gennem proxyen



📈 15. "Jeg har brug for at skalere uden at miste ydeevne" 
Efterhånden som forespørgselsvolumen vokser, genererer de samme spørgsmål duplikerede omkostninger uden cache. Uden idempotens, dublerede anmodninger om affaldsbehandling. Takstgrænser pr. udbyder skal overholdes.
Sådan løser OmniRoute det:

Semantisk cache — To-lags cache (signatur + semantisk) reducerer omkostninger og latens
Request Idempotency — 5s deduplikeringsvindue for identiske anmodninger
Detektion af hastighedsgrænse — RPM pr. udbyder, min. gap og maks. samtidig sporing
Redigerbare hastighedsgrænser — Konfigurerbare standardindstillinger i Indstillinger → Modstandsdygtighed med vedholdenhed
API Key Validation Cache — 3-lags cache til produktionsydeevne
Health Dashboard med telemetri — p50/p95/p99 latency, cachestatistik, oppetid



🤖 16. "Jeg vil kontrollere modeladfærd globalt" Udviklere, der ønsker alle svar på et bestemt sprog, med en bestemt tone, eller ønsker at begrænse ræsonnementstokens. Det er upraktisk at konfigurere dette i hvert værktøj/anmodning.
Sådan løser OmniRoute det:

System Prompt Injection — Global prompt anvendt på alle anmodninger
Thinking Budget Validation — Reasoning token allocation control pr. anmodning (passthrough, auto, custom, adaptive)
6 Routing Strategies — Globale strategier, der bestemmer, hvordan anmodninger distribueres
Wildcard-router — provider/*-mønstre ruter dynamisk til enhver udbyder
Kombo Aktiver/Deaktiver Til/fra — Skift kombinationer direkte fra dashboardet
Tilskiftning af udbyder — Aktiver/deaktiver alle forbindelser for en udbyder med et enkelt klik
Blokerede udbydere — Ekskluder specifikke udbydere fra /v1/models-fortegnelsen



🧰 17. "Jeg har brug for MCP-værktøjer som førsteklasses produktegenskaber" 
Mange AI-gateways afslører kun MCP som en skjult implementeringsdetalje. Teams har brug for et synligt, overskueligt operationslag.
Sådan løser OmniRoute det:

MCP vises på fanen dashboardnavigation og endepunktsprotokol
Dedikeret MCP-administrationsside med proces, værktøjer, omfang og revision
Indbygget hurtigstart til omniroute --mcp og klient onboarding



🧠 18. "Jeg har brug for A2A-orkestrering med synkronisering + streamopgavestier"
Agentarbejdsgange kræver både direkte svar og langvarig streamet udførelse med livscykluskontrol.
Sådan løser OmniRoute det:

A2A JSON-RPC slutpunkt (POST /a2a) med message/send og message/stream
SSE-streaming med udbredelse af terminaltilstand
Task lifecycle API'er til tasks/get og tasks/cancel



🛰️ 19. "Jeg har brug for ægte MCP-processundhed, ikke gættet status"
Operationelle teams skal vide, om MCP faktisk er i live, ikke kun om en API er tilgængelig.
Sådan løser OmniRoute det:

Runtime-hjerteslagsfil med PID, tidsstempler, transport, værktøjstælling og omfangstilstand
MCP status API, der kombinerer hjerteslag + seneste aktivitet
UI-statuskort til proces/oppetid/hjerteslagsfriskhed



📋 20. "Jeg har brug for revisionsbar MCP-værktøjsudførelse"
Når værktøjer muterer konfiguration eller udløser ops-handlinger, har teams brug for retsmedicinsk sporbarhed.
Sådan løser OmniRoute det:

SQLite-støttet revisionslogning for MCP-værktøjsopkald
Filtrerer efter værktøj, succes/fiasko, API-nøgle og paginering
Dashboard revisionstabel + statistik slutpunkter til automatisering



🔐 21. "Jeg har brug for scoped MCP-tilladelser pr. integration" 
Forskellige klienter bør have mindst privilegeret adgang til værktøjskategorier.
Sådan løser OmniRoute det:

9 granulære MCP-skoper til kontrolleret værktøjsadgang
Håndhævelse af omfang og synlighed i MCP management UI
Sikker standardstilling for operationelt værktøj


⚙️ 22. "Jeg har brug for operationelle kontroller uden omfordeling" 
Teams har brug for hurtige runtime-ændringer under hændelser eller omkostningsbegivenheder.
Sådan løser OmniRoute det:

Skift kombinationsaktivering direkte fra MCP-dashboard
Anvend modstandsdygtighedsprofiler fra foruddefinerede politikpakker
Nulstil strømafbrydertilstand fra det samme betjeningspanel



🔄 23. "Jeg har brug for live A2A opgave livscyklus synlighed og annullering" 
Uden livscyklussynlighed bliver opgavehændelser svære at triage.
Sådan løser OmniRoute det:

Opgaveliste/filtrering efter tilstand/færdighed med paginering
Drill-down på opgavemetadata, hændelser og artefakter
Slutpunkt for annullering af opgave og UI-handling med bekræftelse



🌊 24. "Jeg har brug for aktive stream-metrics for A2A-indlæsning"
Streaming-arbejdsgange kræver operationel indsigt i samtidighed og live-forbindelser.
Sådan løser OmniRoute det:

Aktive stream-tællere integreret i A2A-status
Tidsstempel for sidste opgave og tæller pr. stat
A2A dashboard-kort til operationsovervågning i realtid



🪪 25. "Jeg har brug for standardagentopdagelse til klienter"
Eksterne klienter og orkestratorer har brug for maskinlæsbare metadata til onboarding.
Sådan løser OmniRoute det:

Agentkort afsløret på /.well-known/agent.json
Evner og færdigheder vist i ledelsens brugergrænseflade
A2A status API inkluderer opdagelsesmetadata til automatisering



🧭 26. "Jeg har brug for protokolsynlighed i produktets UX"
Hvis brugere ikke kan opdage protokoloverflader, falder kvaliteten af adoption og support.
Sådan løser OmniRoute det:

Sidebar-indgange til MCP og A2A
Endpoint-siden Protokoller-fane med hurtig start og status
Links fra oversigt til dedikerede ledelsesdashboards



🧪 27. "Jeg har brug for end-to-end protokolvalidering med rigtige klienter" 
Mock-tests er ikke nok til at validere protokolkompatibilitet før frigivelse.
Sådan løser OmniRoute det:

E2E-pakke, der starter app og bruger ægte MCP SDK-klienttransport
A2A klient tester for opdagelse, send, stream, hent og annuller flows
Krydstjek påstande mod MCP-revision og A2A-opgaver API'er



📡 28. "Jeg har brug for samlet observerbarhed på tværs af alle grænseflader"
Opdeling af observerbarhed efter protokol skaber blinde pletter og længere MTTR.
Sådan løser OmniRoute det:

Samlede dashboards/logfiler/analyse i ét produkt
Health + audit + request telemetri på tværs af OpenAI, MCP og A2A lag
Operationelle API'er til status og automatisering



💼 29. "Jeg har brug for én køretid til proxy + værktøjer + agentorkestrering" 
At køre mange separate tjenester øger driftsomkostninger og fejltilstande.
Sådan løser OmniRoute det:- OpenAI-kompatibel proxy, MCP-server og A2A-server i én stak

Delt godkendelse, robusthed, datalager og observerbarhed
Ensartet politikmodel på tværs af alle interaktionsflader



🚀 30. "Jeg har brug for at sende agentiske arbejdsgange uden limkodesprawl" 
Hold mister hastighed, når de sammensætter flere ad-hoc-tjenester og scripts.
Sådan løser OmniRoute det:

Ensartet slutpunktsstrategi for kunder og agenter
Indbygget protokolstyring UI'er og røgvalideringsstier
Produktionsklare fundamenter (sikkerhed, logning, robusthed, backup)


Eksempler på Playbooks

Playbook A: Maksimer betalt abonnement + billig backup
Combo: "maximize-claude"
  1. cc/claude-opus-4-6
  2. glm/glm-4.7
  3. if/kimi-k2-thinking

Monthly cost: $20 + small backup spend
Outcome: higher quality, near-zero interruption
Playbook B: Gratis kodningsstak
Combo: "free-forever"
  1. gc/gemini-3-flash
  2. if/kimi-k2-thinking
  3. qw/qwen3-coder-plus

Monthly cost: $0
Outcome: stable free coding workflow
Playbook C: 24/7 altid aktiv reservekæde
Combo: "always-on"
  1. cc/claude-opus-4-6
  2. cx/gpt-5.2-codex
  3. glm/glm-4.7
  4. minimax/MiniMax-M2.1
  5. if/kimi-k2-thinking

Outcome: deep fallback depth for deadline-critical workloads
Playbook D: Agent ops med MCP + A2A
1) Start MCP transport (`omniroute --mcp`) for tool-driven operations
2) Run A2A tasks via `message/send` and `message/stream`
3) Observe via /dashboard/mcp and /dashboard/a2a
4) Control incidents with resilience profile + task cancellation

⚡ Hurtig start

1) Installer og kør

npm install -g omniroute
omniroute
Dashboard åbner ved http://localhost:20128, og API-base-URL er http://localhost:20128/v1.



Kommando
Beskrivelse




omniroute
Start server (PORT=20128, API og dashboard på samme port)


omniroute --port 3000
Indstil kanonisk/API-port til 3000


omniroute --mcp
Start MCP-server (stdio-transport)


omniroute --no-open
Åbn ikke browseren automatisk


omniroute --help
Vis hjælp



Valgfri split-port-tilstand:
PORT=20128 DASHBOARD_PORT=20129 omniroute
# API:       http://localhost:20128/v1
# Dashboard: http://localhost:20129
2) Tilslut udbydere og opret din API-nøgle


Åbn Dashboard → Providers og tilslut mindst én udbyder (OAuth- eller API-nøgle).
Åbn Dashboard → Endpoint og opret en API-nøgle.
(Valgfrit) Åbn Dashboard → Combos og indstil din reservekæde.

3) Peg dit kodningsværktøj til OmniRoute

Base URL: http://localhost:20128/v1
API Key:  [copy from Endpoint page]
Model:    if/kimi-k2-thinking (or any provider/model prefix)
Fungerer med Claude Code, Codex CLI, Gemini CLI, Cursor, Cline, OpenClaw, OpenCode og OpenAI-kompatible SDK'er.
4) Aktiver og valider protokoller (v2.0)

MCP (til værktøjsdrevne operationer):
omniroute --mcp
Tilslut derefter din MCP-klient over stdio og test værktøjer som:

omniroute_get_health
omniroute_list_combos

A2A (for agent-til-agent arbejdsgange):
curl http://localhost:20128/.well-known/agent.json
curl -X POST http://localhost:20128/a2a \
  -H 'content-type: application/json' \
  -d '{"jsonrpc":"2.0","id":"quickstart","method":"message/send","params":{"skill":"quota-management","messages":[{"role":"user","content":"Give me a short quota summary."}]}}'
5) Valider alt ende-til-ende (anbefales)

npm run test:protocols:e2e
Denne suite validerer rigtige MCP- og A2A-klientstrømme mod en kørende app.
Alternativ: Kør fra kilden

cp .env.example .env
npm install
PORT=20128 DASHBOARD_PORT=20129 NEXT_PUBLIC_BASE_URL=http://localhost:20129 npm run dev

🐳 Docker

OmniRoute er tilgængelig som et offentligt Docker-billede på Docker Hub.
Hurtigt løb:
docker run -d \
  --name omniroute \
  --restart unless-stopped \
  -p 20128:20128 \
  -v omniroute-data:/app/data \
  diegosouzapw/omniroute:latest
Med miljøfil:
# Copy and edit .env first
cp .env.example .env

docker run -d \
  --name omniroute \
  --restart unless-stopped \
  --env-file .env \
  -p 20128:20128 \
  -v omniroute-data:/app/data \
  diegosouzapw/omniroute:latest
Brug af Docker Compose:
# Base profile (no CLI tools)
docker compose --profile base up -d

# CLI profile (Claude Code, Codex, OpenClaw built-in)
docker compose --profile cli up -d



Billede
Tag
Størrelse
Beskrivelse




diegosouzapw/omniroute
latest
~250MB
Seneste stabile udgivelse


diegosouzapw/omniroute
1.0.3
~250MB
Nuværende version




🖥️

Kør OmniRoute som en selvstændig desktop-app - ingen terminal, ingen browser, intet internet påkrævet for lokale modeller. Den elektronbaserede app inkluderer:

🖥️ Native Window — Dedikeret appvindue med systembakkeintegration
🔄 Auto-Start — Start OmniRoute ved systemlogin
🔔 Native notifikationer — Få advarsler om kvoteopbrugt eller udbyderproblemer
⚡ One-Click Install — NSIS (Windows), DMG (macOS), AppImage (Linux)
🌐 Offline-tilstand — Fungerer fuldt ud offline med medfølgende server

Hurtig start

# Development mode
npm run electron:dev

# Build for your platform
npm run electron:build         # Current platform
npm run electron:build:win     # Windows (.exe)
npm run electron:build:mac     # macOS (.dmg) — x64 & arm64
npm run electron:build:linux   # Linux (.AppImage)
Systembakke

Når den er minimeret, lever OmniRoute i din procesbakke med hurtige handlinger:

Åbn instrumentbrættet
Skift serverport
Afslut programmet

📖 Fuld dokumentation: electron/README.md

💰 Prissætning på et øjeblik




Tier
Udbyder
Omkostninger
Kvote nulstil
Bedst til




💳 ABONNEMENT
Claude Code (Pro)
20 USD/md.
5 timer + ugentlig
Allerede abonneret



Codex (Plus/Pro)
$20-200/md.
5 timer + ugentlig
OpenAI-brugere



Gemini CLI
GRATIS
180K/md + 1K/dag
Alle sammen!



GitHub Copilot
$10-19/md.
Månedlig
GitHub-brugere


🔑 API NØGLE
NVIDIA NIM
GRATIS (1000 kreditter)
Engangs
Gratis tier test



DeepSeek
Betal pr. brug
Ingen
Bedste pris/kvalitet



Groq
Gratis niveau + betalt
Sats begrænset
Ultrahurtig slutning



xAI (Grok)
Betal pr. brug
Ingen
Grok modeller



Mistral
Gratis niveau + betalt
Sats begrænset
Europæisk AI



OpenRouter
Betal pr. brug
Ingen
100+ modeller


💰 BILLIG
GLM-4.7
0,6 USD/1 mio.
Dagligt 10:00
Budget backup



MiniMax M2.1
$0,2/1 mio.
5-timers rullende
Billigste mulighed



Kimi K2
9 USD/md. lejlighed
10M tokens/md.
Forudsigelige omkostninger


🆓 GRATIS
iFlow
$0
Ubegrænset
8 modeller gratis



Qwen
$0
Ubegrænset
3 modeller gratis



Kiro
$0
Ubegrænset
Claude gratis



💡 Pro-tip: Start med Gemini CLI (180K gratis/måned) + iFlow (ubegrænset gratis) combo = $0 omkostninger!

💡 Nøglefunktioner

OmniRoute v2.0 er bygget som en operationel platform, ikke kun en relæ-proxy.
🤖 Agent- og protokoloperationer (v2.0)| Funktion | Hvad det gør |

| ------------------------------------ | ---------------------------------------------------------------------------------- |
| 🔧 MCP-server (16 værktøjer) | IDE/agent-værktøjer kontrollerer routing, sundhed, kombinationer, grænser og operationer | IDE/agent tools via 3 transports: stdio, SSE (/api/mcp/sse), Streamable HTTP (/api/mcp/stream)
| 🤝 A2A-server (JSON-RPC + SSE) | Agent-til-agent opgaveudførelse med synkronisering og streaming flows |
| 🧭 Consolidated Endpoints Page | Dedikerede administrationssider (/dashboard/mcp, /dashboard/a2a) |
| 🎚️ Service Enable/Disable Toggles | ON/OFF switches for MCP and A2A with settings persistence (default: OFF) |
| 🛰️ MCP Runtime Heartbeat | Reel processtatus (pid, oppetid, hjerteslagsalder, transport, omfangstilstand) |
| 📋 MCP Audit Trail | Filtrerbare revisionslogfiler med succes/fejl og nøgletilskrivning |
| 🔐 MCP Scope Enforcement | 9 granulære omfangstilladelser til kontrolleret værktøjsadgang |
| 📡 A2A Task Lifecycle Management | Liste/filtrere opgaver, inspicere hændelser/artefakter, annullere kørende opgaver |
| 📋 Agent Card Discovery | /.well-known/agent.json til klientens automatiske opdagelse |
| 🧪 Protokol E2E testsele | Ægte MCP SDK + A2A klientstrømme i test:protocols:e2e |
| ⚙️ Driftskontrol | Switch combo, påfør elasticitetsprofiler, nulstil afbrydere fra én kontrolflade |
🧠 Routing og intelligens




Funktion
Hvad det gør




🎯 Smart 4-lags fallback
Auto-rute: Abonnement → API-nøgle → Billig → Gratis


📊 Kvotesporing i realtid
Live token count + nulstil nedtælling pr. udbyder


🔄 Formatoversættelse
OpenAI ↔ Claude ↔ Gemini ↔ Svar med skemasikre konverteringer


👥 Multi-Account Support
Flere konti pr. udbyder med intelligent valg


🔄 Automatisk token-opdatering
OAuth-tokens opdateres automatisk med genforsøg


🎨 Tilpassede kombinationer
6 balanceringsstrategier + fallback kædekontrol


🌐 Wildcard-router
provider/* dynamisk routing


🧠 Tænker på budgetkontrol
Grænser for gennemstrømning, automatisk, brugerdefineret og adaptiv ræsonnement


🔀 Modelaliaser
Indbygget + brugerdefineret model aliasing og migration sikkerhed


⚡ Baggrundsforringelse
Send baggrundsopgaver med lav prioritet til billigere modeller


💬 System Prompt Injection
Globale adfærdskontroller anvendes konsekvent


📄 Responses API-kompatibilitet
Fuld /v1/responses-understøttelse af Codex og avancerede agentarbejdsgange



🎵 Multi-Modal API'er

| Funktion | Hvad det gør || -------------------------- | -------------------------------------------------------------------- |
| 🖼️ Billedgenerering | /v1/images/generations med cloud og lokale backends |
| 📐 Indlejringer | /v1/embeddings til søgning og RAG-rørledninger |
| 🎤 Lydtransskription | /v1/audio/transcriptions (Whisper og yderligere udbydere) |
| 🔊 Tekst-til-tale | /v1/audio/speech (flere motorer/udbydere) |
| 🎬 Videogenerering | /v1/videos/generations (ComfyUI + SD WebUI-arbejdsgange) |
| 🎵 Music Generation | /v1/music/generations (ComfyUI-arbejdsgange) |
| 🛡️ Moderationer | /v1/moderations sikkerhedstjek |
| 🔀 Omrangering | /v1/rerank for relevansscoring |
🛡️ Resiliens, sikkerhed og styring




Funktion
Hvad det gør




🔌 Maksimalafbrydere
Trip/recover på udbyderniveau med tærskelkontrol


🛡️ Anti-tordenbesætning
Mutex + semaforbeskyttelse ved genforsøg/rate hændelser


🧠 Semantisk + signaturcache
Reduktion af omkostninger/latens med to cachelag


⚡ Anmod om idempotens
Dobbelt beskyttelsesvindue


🔒 TLS Fingerprint Spoofing
Bedre kompatibilitet med anti-bot-filtrerede udbydere


🌐 IP-filtrering
Tilladelsesliste/blokeringslistekontrol for udsatte implementeringer


📊 Redigerbare satsgrænser
Konfigurerbare grænser på globalt niveau/udbyderniveau med persistens


🔑 API Key Management + Scoping
Sikker nøgleudstedelse/rotation og model-/leverandørkontrol


🛡️ Beskyttet /models
Valgfri godkendelse og udbyderskjul til modelkatalog



📊 Observerbarhed og analyse




Funktion
Hvad det gør




📝 Forespørgsel + Proxylogning
Fuld anmodning/svar og proxy-logning


📋 Unified Logs Dashboard
Anmodning, proxy, revision og konsolvisning på én side


🔍 Anmod om telemetri
p50/p95/p99 latens og anmodningssporing


🏥 Sundhedskontrolpanel
Oppetid, breaker-tilstande, lockouts, cache-statistik


💰 Omkostningssporing
Budgetkontrol og prisfastsættelse pr. model


📈 Analytiske visualiseringer
Model-/udbyderbrugsindsigt og trendvisninger


🧪 Evalueringsramme
Gyldne sæt-test med konfigurerbare matchstrategier



☁️ Implementering og platform

| Funktion                               | Hvad det gør                                                   |
| -------------------------------------- | -------------------------------------------------------------- | --- | ----------------- | ------------------------------------------------ |
| 🌐 Deploy hvor som helst           | Localhost, VPS, Docker, Cloud-miljøer                          |     | 💾 Cloud Sync | Synkronisering af konfiguration via cloud worker |
| 🔄 Sikkerhedskopiering/gendannelse | Eksport/import og gendannelsesstrømme                          |
| 🧙 Onboarding Wizard               | Første kørsel guidet opsætning                                 |
| 🔧 CLI Tools Dashboard             | Et-klik opsætning til populære kodningsværktøjer               |
| 🌐 i18n (30 sprog)                 | Fuldt dashboard + understøttelse af docs-sprog med RTL-dækning |
| 📂 Tilpasset datakatalog           | DATA_DIR tilsidesættelse af lagerplacering                   |
Feature Deep Dive

Smart fallback med praktisk omkostningskontrol

Combo: "my-coding-stack"
  1. cc/claude-opus-4-6
  2. nvidia/llama-3.3-70b
  3. glm/glm-4.7
  4. if/kimi-k2-thinking
Når kvote, sats eller sundhed svigter, flytter OmniRoute automatisk til den næste kandidat uden manuel skift.
Protokolstyring, der er synlig og funktionsdygtig


MCP + A2A kan findes i brugergrænsefladen og dokumenter (ikke skjult)
Protokolstatus API'er afslører live driftsdata (/api/mcp/*, /api/a2a/*)
Dashboards inkluderer handlinger for dag-2 operationer (kombinationsskift, nulstilling af breaker, annullering af opgave)

Oversætter + valideringsarbejdsgang

Oversætterområdet omfatter:

Legeplads: anmod om transformationstjek
Chattester: fuld anmodning/svar tur/retur
Testbænk: flere sager på én gang
Live Monitor: trafikvisning i realtid

Plus protokolvalidering med rigtige klienter via npm run test:protocols:e2e.

📖 MCP Server README — Værktøjsreference, IDE-konfigurationer og klienteksempler
📖 A2A Server README — Færdigheder, JSON-RPC-metoder, streaming og opgavelivscyklus

🧪 Evalueringer (evalueringer)

OmniRoute inkluderer en indbygget evalueringsramme til at teste LLM-svarkvaliteten mod et gyldent sæt. Få adgang til det via Analytics → Evals i dashboardet.
Indbygget gyldent sæt

Det forudindlæste "OmniRoute Golden Set" indeholder testcases til:

Hilsen, matematik, geografi, kodegenerering
JSON format compliance, oversættelse, markdown generation
Sikkerhedsafvisning (skadeligt indhold), optælling, boolsk logik

Evalueringsstrategier




Strategi
Beskrivelse
Eksempel




exact
Output skal matche nøjagtigt
"4"


contains
Output skal indeholde understreng (uafhængig af store og små bogstaver)
"Paris"


regex
Output skal matche regex-mønster
"1.*2.*3"


custom
Brugerdefineret JS-funktion returnerer sand/falsk
(output) => output.length > 10




📖 Opsætningsvejledning

Protokolopsætning (MCP + A2A)


🧩 MCP-opsætning (modelkontekstprotokol)
Start MCP-transport i stdio-tilstand:
omniroute --mcp
Anbefalet valideringsflow:

Tilslut din MCP-klient via stdio.
Kør omniroute_get_health.
Kør omniroute_list_combos.
Åbn /dashboard/mcp for at bekræfte hjerteslag, aktivitet og audit.

Nyttige API'er til automatisering:

GET /api/mcp/status
GET /api/mcp/tools
GET /api/mcp/audit
GET /api/mcp/audit/stats


🤝 A2A-opsætning (Agent2Agent)
Opdag agenten:
curl http://localhost:20128/.well-known/agent.json
Send en opgave:
curl -X POST http://localhost:20128/a2a \
  -H 'content-type: application/json' \
  -d '{"jsonrpc":"2.0","id":"setup-a2a","method":"message/send","params":{"skill":"quota-management","messages":[{"role":"user","content":"Summarize quota status."}]}}'
Administrer livscyklus:

GET /api/a2a/status
GET /api/a2a/tasks
GET /api/a2a/tasks/:id
POST /api/a2a/tasks/:id/cancel

Operationel UI:

/dashboard/a2a til observerbarhed af opgave/tilstand/strøm og røghandlinger



🧪 End-to-end protokolvalidering
Valider begge protokoller med rigtige klienter:
npm run test:protocols:e2e
Dette verificerer:

MCP SDK-klient forbinde/liste/opkald
A2A opdagelse/send/stream/hent/annuller
Krydstjek data i MCP-audit og A2A opgavestyring API'er



💳 Abonnementsudbydere
Claude Code (Pro/Max)

Dashboard → Providers → Connect Claude Code
→ OAuth login → Auto token refresh
→ 5-hour + weekly quota tracking

Models:
  cc/claude-opus-4-6
  cc/claude-sonnet-4-5-20250929
  cc/claude-haiku-4-5-20251001
Prof tip: Brug Opus til komplekse opgaver, Sonnet for hurtighed. OmniRoute sporer kvote pr. model!
OpenAI Codex (Plus/Pro)

Dashboard → Providers → Connect Codex
→ OAuth login (port 1455)
→ 5-hour + weekly reset

Models:
  cx/gpt-5.2-codex
  cx/gpt-5.1-codex-max
Gemini CLI (GRATIS 180K/måned!)

Dashboard → Providers → Connect Gemini CLI
→ Google OAuth
→ 180K completions/month + 1K/day

Models:
  gc/gemini-3-flash-preview
  gc/gemini-2.5-pro
Bedste værdi: Kæmpe gratis niveau! Brug dette før betalte niveauer.
GitHub Copilot

Dashboard → Providers → Connect GitHub
→ OAuth via GitHub
→ Monthly reset (1st of month)

Models:
  gh/gpt-5
  gh/claude-4.5-sonnet
  gh/gemini-3-pro


🔑 API nøgleudbydere
NVIDIA NIM (GRATIS 1000 kreditter!)


Tilmeld dig: build.nvidia.com
Få gratis API-nøgle (1000 slutningskreditter inkluderet)
Dashboard → Tilføj udbyder → NVIDIA NIM:

API-nøgle: nvapi-your-key



Modeller: nvidia/llama-3.3-70b-instruct, nvidia/mistral-7b-instruct og 50+ flere
Prof tip: OpenAI-kompatibel API — fungerer problemfrit med OmniRoutes formatoversættelse!
DeepSeek


Tilmeld dig: platform.deepseek.com
Hent API-nøgle
Dashboard → Tilføj udbyder → DeepSeek

Modeller: deepseek/deepseek-chat, deepseek/deepseek-coder
Groq (gratis niveau tilgængelig!)


Tilmeld dig: console.groq.com
Få API-nøgle (gratis niveau inkluderet)
Dashboard → Tilføj udbyder → Groq

Modeller: groq/llama-3.3-70b, groq/mixtral-8x7b
Prof tip: Ultrahurtig slutning — bedst til realtidskodning!
OpenRouter (100+ modeller)


Tilmeld dig: openrouter.ai
Hent API-nøgle
Dashboard → Tilføj udbyder → OpenRouter

Modeller: Få adgang til mere end 100 modeller fra alle større udbydere via en enkelt API-nøgle.


💰 Billige udbydere (backup)
GLM-4.7 (Daglig nulstilling, $0,6/1 mio.)


Tilmeld dig: Zhipu AI
Hent API-nøgle fra Coding Plan
Dashboard → Tilføj API-nøgle:

Udbyder: glm
API-nøgle: your-key



Brug: glm/glm-4.7
Pro-tip: Coding Plan tilbyder 3× kvote til 1/7 pris! Nulstil dagligt 10:00.
MiniMax M2.1 (5 timers nulstilling, $0,20/1 mio.)


Tilmeld dig: MiniMax
Hent API-nøgle
Dashboard → Tilføj API-nøgle

Brug: minimax/MiniMax-M2.1
Prof tip: Billigste mulighed for lang sammenhæng (1M tokens)!
Kimi K2 ($9/måned lejlighed)


Abonner: Moonshot AI
Hent API-nøgle
Dashboard → Tilføj API-nøgle

Brug: kimi/kimi-latest
Prof tip: Fast $9/måned for 10M tokens = $0,90/1M effektive omkostninger!


🆓 GRATIS udbydere (nødbackup)
iFlow (8 GRATIS modeller)```bash

Dashboard → Connect iFlow
→ iFlow OAuth login
→ Unlimited usage
Models:
if/kimi-k2-thinking
if/qwen3-coder-plus
if/glm-4.7
if/minimax-m2
if/deepseek-r1

### Qwen (3 GRATIS modeller)

```bash
Dashboard → Connect Qwen
→ Device code authorization
→ Unlimited usage

Models:
  qw/qwen3-coder-plus
  qw/qwen3-coder-flash

Kiro (Claude GRATIS)

Dashboard → Connect Kiro
→ AWS Builder ID or Google/GitHub
→ Unlimited usage

Models:
  kr/claude-sonnet-4.5
  kr/claude-haiku-4.5


🎨 Opret kombinationer
Eksempel 1: Maksimer abonnement → Billig backup

Dashboard → Combos → Create New

Name: premium-coding
Models:
  1. cc/claude-opus-4-6 (Subscription primary)
  2. glm/glm-4.7 (Cheap backup, $0.6/1M)
  3. minimax/MiniMax-M2.1 (Cheapest fallback, $0.20/1M)

Use in CLI: premium-coding

Eksempel 2: Kun gratis (nul omkostninger)

Name: free-combo
Models:
  1. gc/gemini-3-flash-preview (180K free/month)
  2. if/kimi-k2-thinking (unlimited)
  3. qw/qwen3-coder-plus (unlimited)

Cost: $0 forever!



🔧 CLI-integration
Markør IDE

Settings → Models → Advanced:
  OpenAI API Base URL: http://localhost:20128/v1
  OpenAI API Key: [from OmniRoute dashboard]
  Model: cc/claude-opus-4-6

Claude Code

Brug siden CLI Tools i dashboardet til konfiguration med et enkelt klik, eller rediger ~/.claude/settings.json manuelt.
Codex CLI

export OPENAI_BASE_URL="http://localhost:20128"
export OPENAI_API_KEY="your-omniroute-api-key"

codex "your prompt"
OpenClaw

Mulighed 1 — Dashboard (anbefalet):
Dashboard → CLI Tools → OpenClaw → Select Model → Apply

Mulighed 2 — Manuel: Rediger ~/.openclaw/openclaw.json:
{
  "models": {
    "providers": {
      "omniroute": {
        "baseUrl": "http://127.0.0.1:20128/v1",
        "apiKey": "sk_omniroute",
        "api": "openai-completions"
      }
    }
  }
}

Bemærk: OpenClaw fungerer kun med lokale OmniRoute. Brug 127.0.0.1 i stedet for localhost for at undgå problemer med IPv6-opløsning.

Cline / Fortsæt / RooCode

Settings → API Configuration:
  Provider: OpenAI Compatible
  Base URL: http://localhost:20128/v1
  API Key: [from OmniRoute dashboard]
  Model: if/kimi-k2-thinking

OpenCode

Trin 1: Tilføj OmniRoute som en tilpasset udbyder:
opencode
/connect
# Select "Other" → Enter ID: "omniroute" → Enter your OmniRoute API key
Trin 2: Opret/rediger opencode.json i dit projektrod:
{
  "$schema": "https://opencode.ai/config.json",
  "provider": {
    "omniroute": {
      "npm": "@ai-sdk/openai-compatible",
      "name": "OmniRoute",
      "options": {
        "baseURL": "http://localhost:20128/v1"
      },
      "models": {
        "cc/claude-sonnet-4-20250514": { "name": "Claude Sonnet 4" },
        "gg/gemini-2.5-pro": { "name": "Gemini 2.5 Pro" },
        "if/kimi-k2-thinking": { "name": "Kimi K2 (Free)" }
      }
    }
  }
}
Trin 3: Vælg modellen i OpenCode:
/models
# Select any OmniRoute model from the list

Tip: Tilføj enhver tilgængelig model i dit OmniRoute /v1/models-endepunkt til models-sektionen. Brug formatet provider/model-id fra dit OmniRoute-dashboard.



🐛 Fejlfinding


Klik for at udvide fejlfindingsvejledning
"Sprogmodellen leverede ikke beskeder"

Udbyderkvote opbrugt → Tjek dashboardkvotesporing
Løsning: Brug combo fallback eller skift til et billigere niveau

Satsbegrænsende

Abonnementskontingent ude → Fallback til GLM/MiniMax
Tilføj kombination: cc/claude-opus-4-6 → glm/glm-4.7 → if/kimi-k2-thinking

OAuth-token er udløbet

Automatisk genopfrisket af OmniRoute
Hvis problemerne fortsætter: Dashboard → Udbyder → Genopret forbindelse

Høje omkostninger

Tjek brugsstatistik i Dashboard → Omkostninger
Skift primær model til GLM/MiniMax
Brug gratis niveau (Gemini CLI, iFlow) til ikke-kritiske opgaver

Dashboard/API-porte er forkerte

PORT er den kanoniske basisport (og API-port som standard)
API_PORT tilsidesætter kun OpenAI-kompatibel API-lytter
DASHBOARD_PORT tilsidesætter kun dashboard/Next.js-lytter
Indstil NEXT_PUBLIC_BASE_URL til dit dashboard/offentlige URL (til OAuth-tilbagekald)

Skysynkroniseringsfejl

Bekræft, at BASE_URL peger på din kørende instans
Bekræft CLOUD_URL-punkter til dit forventede cloud-endepunkt
Hold NEXT_PUBLIC_*-værdier på linje med værdier på serversiden

Første login virker ikke

Tjek INITIAL_PASSWORD i .env
Hvis den ikke er indstillet, er reserveadgangskoden 123456

Ingen anmodningslogfiler

Indstil ENABLE_REQUEST_LOGS=true i .env

Forbindelsestest viser "Ugyldig" for OpenAI-kompatible udbydere

Mange udbydere eksponerer ikke et /models-endepunkt
OmniRoute v1.0.6+ inkluderer fallback-validering via chatafslutninger
Sørg for, at basis-URL inkluderer /v1 suffiks

🔐 OAuth



⚠️ VIGTIGT til brugere af OmniRoute med VPS/Docker/server-fjernbetjening

OAuth

Som credenciais OAuth embutidas no OmniRoute estão cadastradas apenas para localhost. Quando você acessa o OmniRoute em um servidor remoto (ex: https://omniroute.meuservidor.com), o Google afviser en autenticação com:
Error 400: redirect_uri_mismatch

Løsning: Konfigurer OAuth-tilgængelighed

Você precisa criar um OAuth 2.0 Client ID ingen Google Cloud Console med en URI, der udfører denne service.
Passo a passo

1. Adgang til Google Cloud Console
Abra: https://console.cloud.google.com/apis/credentials
2. Crie um novo OAuth 2.0 Client ID

Klik på dem "+ Opret legitimationsoplysninger" → "OAuth-klient-id"
Tipo de aplicativo: "Webapplikation"
Navn: escolha qualquer nome (eks.: OmniRoute Remote)

3. Adicione som autoriseret omdirigerings-URI
Ingen campo "Autoriseret omdirigerings-URI'er", adicione:
https://seu-servidor.com/callback


Substitua seu-servidor.com pelo domínio eller IP do seu servidor (inklusive en porta se necessário, ex: http://45.33.32.156:20128/callback).

4. Salve e copy as credenciais
Após criar, o Google mostrará o Client ID e o Client Secret.
5. Konfigurer som variáveis de ambiente
Ingen seu .env (denne variáveis de ambiente do Docker):
# Para Antigravity:
ANTIGRAVITY_OAUTH_CLIENT_ID=seu-client-id.apps.googleusercontent.com
ANTIGRAVITY_OAUTH_CLIENT_SECRET=GOCSPX-seu-secret

# Para Gemini CLI:
GEMINI_OAUTH_CLIENT_ID=seu-client-id.apps.googleusercontent.com
GEMINI_OAUTH_CLIENT_SECRET=GOCSPX-seu-secret
GEMINI_CLI_OAUTH_CLIENT_SECRET=GOCSPX-seu-secret
6. Reinicie o OmniRoute
# Se usando npm:
npm run dev

# Se usando Docker:
docker restart omniroute
7. Tente conectar novamente
Dashboard → Udbydere → Antigravity (ou Gemini CLI) → OAuth
Agora eller Google redirecionará corretamente para https://seu-servidor.com/callback og autenticação funcionará.

Midlertidig løsning (som konfigureret tiltrods próprias)

Se não quiser criar credenciais próprias agora, ainda é possível usar o fluxo manual de URL:

O OmniRoute abrirá en URL de autorização til Google
Após você autorizar, o Google tentará redirecionar para localhost (que falha no servidor remoto)
Kopier en URL komplet da barra de endereço do sin browser (mesmo que a página não carregue)
Cole essa URL no campo que aparece no modal de conexão do OmniRoute
Klik på "Forbind"


Este workaround funciona porque or código de autorização na URL é válido independente do redirect ter carregado or não.



🛠️


Klik for at udvide tekniske stakdetaljer

Runtime: Node.js 18–22 LTS (⚠️ Node.js 24+ er ikke understøttet — better-sqlite3 native binære filer er inkompatible)
Sprog: TypeScript 5.9 — 100 % TypeScript på tværs af src/ og open-sse/ (nul any i kernemoduler siden v2.0)
Framework: Next.js 16 + React 19 + Tailwind CSS 4
Database: LowDB (JSON) + SQLite (domænetilstand + proxylogfiler + MCP-revision + routingbeslutninger)
Skemaer: Zod (MCP-værktøj I/O-validering, API-kontrakter)
Protokoller: MCP (stdio/HTTP) + A2A v0.3 (JSON-RPC 2.0 + SSE)
Streaming: Server-sendte hændelser (SSE)
Auth: OAuth 2.0 (PKCE) + JWT + API-nøgler + MCP Scoped Authorization
Test: Node.js testløber + Vitest (900+ tests inklusive enhed, integration, E2E)- CI/CD: GitHub-handlinger (automatisk npm-udgivelse + Docker Hub ved udgivelse)
Websted: omniroute.online
Pakke: npmjs.com/package/omniroute
Docker: hub.docker.com/r/diegosouzapw/omniroute
Resiliens: Circuit breaker, eksponentiel backoff, anti-tordenbesætning, TLS spoofing, auto-combo selvhelbredelse



📖 Dokumentation




Dokument
Beskrivelse




Brugervejledning
Udbydere, kombinationer, CLI-integration, implementering


API-reference
Alle endepunkter med eksempler


MCP-server
16 MCP-værktøjer, IDE-konfigurationer, Python/TS/Go-klienter


A2A-server
JSON-RPC 2.0 protokol, færdigheder, streaming, opgavestyring


Auto-kombimotor
6-faktor scoring, tilstandspakker, selvhelbredende


Fejlfinding
Almindelige problemer og løsninger


Arkitektur
Systemarkitektur og indre


Bidrager
Udviklingsopsætning og retningslinjer


OpenAPI Spec
OpenAPI 3.0-specifikation


Sikkerhedspolitik
Sårbarhedsrapportering og sikkerhedspraksis


VM-implementering
Komplet guide: VM + nginx + Cloudflare opsætning


Feature Gallery
Visuel dashboard-rundvisning med skærmbilleder


Udgivelsestjekliste
Pre-release valideringstrin




🗺️

OmniRoute har 210+ funktioner planlagt på tværs af flere udviklingsfaser. Her er nøgleområderne:



Kategori
Planlagte funktioner
Højdepunkter




🧠 Routing & intelligens
25+
Routing med laveste latens, tag-baseret routing, kvote preflight, valg af P2C-konto


🔒 Sikkerhed og overholdelse
20+
SSRF-hærdning, tilsløring af legitimationsoplysninger, hastighedsgrænse pr. slutpunkt, styringsnøgleomfang


📊 Observabilitet
15+
OpenTelemetry-integration, kvoteovervågning i realtid, omkostningssporing pr. model


🔄 Udbyderintegrationer
20+
Dynamisk modelregistrering, leverandørnedkøling, multi-konto Codex, Copilot-kvoteparsing


⚡ Ydeevne
15+
Dobbelt cachelag, promptcache, svarcache, streaming keepalive, batch API


🌐 Økosystem
10+
WebSocket API, config hot-reload, distribueret config butik, kommerciel tilstand



🔜 Kommer snart- 🔗 OpenCode-integration — Native udbyderunderstøttelse af OpenCode AI-kodnings-IDE


🔗 TRAE-integration — Fuld understøttelse af TRAE AI-udviklingsrammen
📦 Batch API — Asynkron batchbehandling til masseanmodninger
🎯 Tag-baseret Routing — Ruteanmodninger baseret på tilpassede tags og metadata
💰 Laveste omkostningsstrategi — Vælg automatisk den billigste tilgængelige udbyder


📝 Fuld funktionsspecifikationer tilgængelige i docs/new-features/ (217 detaljerede specifikationer)


👥 Bidragydere


Sådan bidrager du


Fork depotet
Opret din funktionsgren (git checkout -b feature/amazing-feature)
Bekræft dine ændringer (git commit -m 'Add amazing feature')
Skub til grenen (git push origin feature/amazing-feature)
Åbn en pull-anmodning

Se CONTRIBUTING.md for detaljerede retningslinjer.
Frigiver en ny version

# Create a release — npm publish happens automatically
gh release create v2.0.0 --title "v2.0.0" --generate-notes

📊 Stjernehistorie


 
   
   
   
 


🙏 Tak

Særlig tak til 9router af decolua — det originale projekt, der inspirerede denne gaffel. OmniRoute bygger på det utrolige fundament med yderligere funktioner, multimodale API'er og en fuld TypeScript-omskrivning.
Særlig tak til CLIProxyAPI — den originale Go-implementering, der inspirerede denne JavaScript-port.

📄 Licens

MIT-licens - se LICENS for detaljer.


  _{Bygget med ❤️ for udviklere, der koder 24/7}
  

  _{omniroute.online}

Funktion	Hvad det gør
🎯 Smart 4-lags fallback	Auto-rute: Abonnement → API-nøgle → Billig → Gratis
📊 Kvotesporing i realtid	Live token count + nulstil nedtælling pr. udbyder
🔄 Formatoversættelse	OpenAI ↔ Claude ↔ Gemini ↔ Svar med skemasikre konverteringer
👥 Multi-Account Support	Flere konti pr. udbyder med intelligent valg
🔄 Automatisk token-opdatering	OAuth-tokens opdateres automatisk med genforsøg
🎨 Tilpassede kombinationer	6 balanceringsstrategier + fallback kædekontrol
🌐 Wildcard-router	`provider/*` dynamisk routing
🧠 Tænker på budgetkontrol	Grænser for gennemstrømning, automatisk, brugerdefineret og adaptiv ræsonnement
🔀 Modelaliaser	Indbygget + brugerdefineret model aliasing og migration sikkerhed
⚡ Baggrundsforringelse	Send baggrundsopgaver med lav prioritet til billigere modeller
💬 System Prompt Injection	Globale adfærdskontroller anvendes konsekvent
📄 Responses API-kompatibilitet	Fuld `/v1/responses`-understøttelse af Codex og avancerede agentarbejdsgange

Strategi	Beskrivelse	Eksempel
`exact`	Output skal matche nøjagtigt	`"4"`
`contains`	Output skal indeholde understreng (uafhængig af store og små bogstaver)	`"Paris"`
`regex`	Output skal matche regex-mønster	`"1.2.3"`
`custom`	Brugerdefineret JS-funktion returnerer sand/falsk	`(output) => output.length > 10`

Kommando	Beskrivelse
`omniroute`	Start server (`PORT=20128`, API og dashboard på samme port)
`omniroute --port 3000`	Indstil kanonisk/API-port til 3000
`omniroute --mcp`	Start MCP-server (stdio-transport)
`omniroute --no-open`	Åbn ikke browseren automatisk
`omniroute --help`	Vis hjælp

Billede	Tag	Størrelse	Beskrivelse
`diegosouzapw/omniroute`	`latest`	~250MB	Seneste stabile udgivelse
`diegosouzapw/omniroute`	`1.0.3`	~250MB	Nuværende version

Tier	Udbyder	Omkostninger	Kvote nulstil	Bedst til
💳 ABONNEMENT	Claude Code (Pro)	20 USD/md.	5 timer + ugentlig	Allerede abonneret
	Codex (Plus/Pro)	$20-200/md.	5 timer + ugentlig	OpenAI-brugere
	Gemini CLI	GRATIS	180K/md + 1K/dag	Alle sammen!
	GitHub Copilot	$10-19/md.	Månedlig	GitHub-brugere
🔑 API NØGLE	NVIDIA NIM	GRATIS (1000 kreditter)	Engangs	Gratis tier test
	DeepSeek	Betal pr. brug	Ingen	Bedste pris/kvalitet
	Groq	Gratis niveau + betalt	Sats begrænset	Ultrahurtig slutning
	xAI (Grok)	Betal pr. brug	Ingen	Grok modeller
	Mistral	Gratis niveau + betalt	Sats begrænset	Europæisk AI
	OpenRouter	Betal pr. brug	Ingen	100+ modeller
💰 BILLIG	GLM-4.7	0,6 USD/1 mio.	Dagligt 10:00	Budget backup
	MiniMax M2.1	$0,2/1 mio.	5-timers rullende	Billigste mulighed
	Kimi K2	9 USD/md. lejlighed	10M tokens/md.	Forudsigelige omkostninger
🆓 GRATIS	iFlow	$0	Ubegrænset	8 modeller gratis
	Qwen	$0	Ubegrænset	3 modeller gratis
	Kiro	$0	Ubegrænset	Claude gratis

Funktion	Hvad det gør
🔌 Maksimalafbrydere	Trip/recover på udbyderniveau med tærskelkontrol
🛡️ Anti-tordenbesætning	Mutex + semaforbeskyttelse ved genforsøg/rate hændelser
🧠 Semantisk + signaturcache	Reduktion af omkostninger/latens med to cachelag
⚡ Anmod om idempotens	Dobbelt beskyttelsesvindue
🔒 TLS Fingerprint Spoofing	Bedre kompatibilitet med anti-bot-filtrerede udbydere
🌐 IP-filtrering	Tilladelsesliste/blokeringslistekontrol for udsatte implementeringer
📊 Redigerbare satsgrænser	Konfigurerbare grænser på globalt niveau/udbyderniveau med persistens
🔑 API Key Management + Scoping	Sikker nøgleudstedelse/rotation og model-/leverandørkontrol
🛡️ Beskyttet `/models`	Valgfri godkendelse og udbyderskjul til modelkatalog

Funktion	Hvad det gør
📝 Forespørgsel + Proxylogning	Fuld anmodning/svar og proxy-logning
📋 Unified Logs Dashboard	Anmodning, proxy, revision og konsolvisning på én side
🔍 Anmod om telemetri	p50/p95/p99 latens og anmodningssporing
🏥 Sundhedskontrolpanel	Oppetid, breaker-tilstande, lockouts, cache-statistik
💰 Omkostningssporing	Budgetkontrol og prisfastsættelse pr. model
📈 Analytiske visualiseringer	Model-/udbyderbrugsindsigt og trendvisninger
🧪 Evalueringsramme	Gyldne sæt-test med konfigurerbare matchstrategier

Dokument	Beskrivelse
Brugervejledning	Udbydere, kombinationer, CLI-integration, implementering
API-reference	Alle endepunkter med eksempler
MCP-server	16 MCP-værktøjer, IDE-konfigurationer, Python/TS/Go-klienter
A2A-server	JSON-RPC 2.0 protokol, færdigheder, streaming, opgavestyring
Auto-kombimotor	6-faktor scoring, tilstandspakker, selvhelbredende
Fejlfinding	Almindelige problemer og løsninger
Arkitektur	Systemarkitektur og indre
Bidrager	Udviklingsopsætning og retningslinjer
OpenAPI Spec	OpenAPI 3.0-specifikation
Sikkerhedspolitik	Sårbarhedsrapportering og sikkerhedspraksis
VM-implementering	Komplet guide: VM + nginx + Cloudflare opsætning
Feature Gallery	Visuel dashboard-rundvisning med skærmbilleder
Udgivelsestjekliste	Pre-release valideringstrin

Kategori	Planlagte funktioner	Højdepunkter
🧠 Routing & intelligens	25+	Routing med laveste latens, tag-baseret routing, kvote preflight, valg af P2C-konto
🔒 Sikkerhed og overholdelse	20+	SSRF-hærdning, tilsløring af legitimationsoplysninger, hastighedsgrænse pr. slutpunkt, styringsnøgleomfang
📊 Observabilitet	15+	OpenTelemetry-integration, kvoteovervågning i realtid, omkostningssporing pr. model
🔄 Udbyderintegrationer	20+	Dynamisk modelregistrering, leverandørnedkøling, multi-konto Codex, Copilot-kvoteparsing
⚡ Ydeevne	15+	Dobbelt cachelag, promptcache, svarcache, streaming keepalive, batch API
🌐 Økosystem	10+	WebSocket API, config hot-reload, distribueret config butik, kommerciel tilstand

FilesExpand file tree

README.da.md

Latest commit

History

README.da.md

File metadata and controls

🚀 OmniRoute — Den gratis AI-gateway

Stop aldrig med at kode. Smart routing til GRATIS og billige AI-modeller med automatisk fallback.

🖼️ Hovedbetjeningspanel

📸 Dashboard Preview

🤖 Gratis AI-udbyder til dine foretrukne kodningsagenter

🤔 Hvorfor OmniRoute?

📧 Support> 💬 Tilmeld dig vores fællesskab! WhatsApp Group — Få hjælp, del tips, og hold dig opdateret.

🔄 Sådan virker det

🎯 Hvad OmniRoute løser — 30 rigtige smertepunkter og brugssager

Eksempler på Playbooks

⚡ Hurtig start

1) Installer og kør

2) Tilslut udbydere og opret din API-nøgle

3) Peg dit kodningsværktøj til OmniRoute

4) Aktiver og valider protokoller (v2.0)

5) Valider alt ende-til-ende (anbefales)

Alternativ: Kør fra kilden

🐳 Docker

🖥️

Hurtig start

Systembakke

💰 Prissætning på et øjeblik

💡 Nøglefunktioner

🤖 Agent- og protokoloperationer (v2.0)| Funktion | Hvad det gør |

🧠 Routing og intelligens

🎵 Multi-Modal API'er

🛡️ Resiliens, sikkerhed og styring

📊 Observerbarhed og analyse

☁️ Implementering og platform

Feature Deep Dive

Smart fallback med praktisk omkostningskontrol

Protokolstyring, der er synlig og funktionsdygtig

Oversætter + valideringsarbejdsgang

🧪 Evalueringer (evalueringer)

Indbygget gyldent sæt

Evalueringsstrategier

📖 Opsætningsvejledning

Protokolopsætning (MCP + A2A)

Claude Code (Pro/Max)

OpenAI Codex (Plus/Pro)

Gemini CLI (GRATIS 180K/måned!)

GitHub Copilot

NVIDIA NIM (GRATIS 1000 kreditter!)

DeepSeek

Groq (gratis niveau tilgængelig!)

OpenRouter (100+ modeller)

GLM-4.7 (Daglig nulstilling, $0,6/1 mio.)

MiniMax M2.1 (5 timers nulstilling, $0,20/1 mio.)

Kimi K2 ($9/måned lejlighed)

iFlow (8 GRATIS modeller)```bash

Kiro (Claude GRATIS)

Eksempel 1: Maksimer abonnement → Billig backup

Eksempel 2: Kun gratis (nul omkostninger)

Markør IDE

Claude Code

Codex CLI

OpenClaw

Cline / Fortsæt / RooCode

OpenCode

🐛 Fejlfinding

🔐 OAuth

OAuth

Løsning: Konfigurer OAuth-tilgængelighed

Passo a passo

Midlertidig løsning (som konfigureret tiltrods próprias)

🛠️

📖 Dokumentation

🗺️

🔜 Kommer snart- 🔗 OpenCode-integration — Native udbyderunderstøttelse af OpenCode AI-kodnings-IDE

👥 Bidragydere

Sådan bidrager du

Frigiver en ny version

📊 Stjernehistorie

🙏 Tak