🌐 Languages: 🇺🇸 English | 🇧🇷 Português (Brasil) | 🇪🇸 Español | 🇫🇷 Français | 🇮🇹 Italiano | 🇷🇺 Русский | 🇨🇳 中文 (简体) | 🇩🇪 Deutsch | 🇮🇳 हिन्दी | 🇹🇭 ไทย | 🇺🇦 Українська | 🇸🇦 العربية | 🇯🇵 日本語 | 🇻🇳 Tiếng Việt | 🇧🇬 Български | 🇩🇰 Dansk | 🇫🇮 Suomi | 🇮🇱 עברית | 🇭🇺 Magyar | 🇮🇩 Bahasa Indonesia | 🇰🇷 한국어 | 🇲🇾 Bahasa Melayu | 🇳🇱 Nederlands | 🇳🇴 Norsk | 🇵🇹 Português (Portugal) | 🇷🇴 Română | 🇵🇱 Polski | 🇸🇰 Slovenčina | 🇸🇪 Svenska | 🇵🇭 Filipino
Komplett guide för att konfigurera leverantörer, skapa kombinationer, integrera CLI-verktyg och distribuera OmniRoute.
- Pricing at a Glance
- Use Cases
- Provider Setup
- CLI Integration
- Deployment
- Available Models
- Advanced Features
| Nivå | Leverantör | Kostnad | Kvotåterställning | Bäst för |
|---|---|---|---|---|
| 💳 PRENUMERATION | Claude Code (Pro) | 20 USD/månad | 5h + veckovis | Har redan prenumererat |
| Codex (Plus/Pro) | 20-200 USD/månad | 5h + veckovis | OpenAI-användare | |
| Gemini CLI | GRATIS | 180K/månad + 1K/dag | Alla! | |
| GitHub Copilot | 10-19 USD/månad | Månatlig | GitHub-användare | |
| 🔑 API-NYCKEL | DeepSeek | Betala per användning | Inga | Billigt resonemang |
| Groq | Betala per användning | Inga | Ultrasnabb slutledning | |
| xAI (Grok) | Betala per användning | Inga | Grok 4 resonemang | |
| Mistral | Betala per användning | Inga | EU-värdade modeller | |
| Förvirring | Betala per användning | Inga | Sökförstärkt | |
| Tillsammans AI | Betala per användning | Inga | Modeller med öppen källkod | |
| Fireworks AI | Betala per användning | Inga | Fast FLUX bilder | |
| Cerebras | Betala per användning | Inga | Wafer-skala hastighet | |
| Sammanhålla | Betala per användning | Inga | Kommando R+ RAG | |
| NVIDIA NIM | Betala per användning | Inga | Företagsmodeller | |
| 💰 BILLIGT | GLM-4.7 | $0,6/1M | Dagligen 10:00 | Budget backup |
| MiniMax M2.1 | $0,2/1M | 5-timmars rullande | Billigaste alternativet | |
| Kimi K2 | 9 USD/mån lägenhet | 10 miljoner tokens/månad | Förutsägbar kostnad | |
| 🆓 GRATIS | iFlow | $0 | Obegränsad | 8 modeller gratis |
| Qwen | $0 | Obegränsad | 3 modeller gratis | |
| Kiro | $0 | Obegränsad | Claude gratis |
💡 Proffstips: Börja med Gemini CLI (180K gratis/månad) + iFlow (obegränsat gratis) combo = $0 kostnad!
Problem: Kvoten går ut oanvänd, hastighetsgränser under tung kodning
Combo: "maximize-claude"
1. cc/claude-opus-4-6 (use subscription fully)
2. glm/glm-4.7 (cheap backup when quota out)
3. if/kimi-k2-thinking (free emergency fallback)
Monthly cost: $20 (subscription) + ~$5 (backup) = $25 total
vs. $20 + hitting limits = frustration
Problem: Har inte råd med prenumerationer, behöver pålitlig AI-kodning
Combo: "free-forever"
1. gc/gemini-3-flash (180K free/month)
2. if/kimi-k2-thinking (unlimited free)
3. qw/qwen3-coder-plus (unlimited free)
Monthly cost: $0
Quality: Production-ready models
Problem: Deadlines, har inte råd med driftstopp
Combo: "always-on"
1. cc/claude-opus-4-6 (best quality)
2. cx/gpt-5.2-codex (second subscription)
3. glm/glm-4.7 (cheap, resets daily)
4. minimax/MiniMax-M2.1 (cheapest, 5h reset)
5. if/kimi-k2-thinking (free unlimited)
Result: 5 layers of fallback = zero downtime
Monthly cost: $20-200 (subscriptions) + $10-20 (backup)
Problem: Behöver AI-assistent i meddelandeappar, helt gratis
Combo: "openclaw-free"
1. if/glm-4.7 (unlimited free)
2. if/minimax-m2.1 (unlimited free)
3. if/kimi-k2-thinking (unlimited free)
Monthly cost: $0
Access via: WhatsApp, Telegram, Slack, Discord, iMessage, Signal...
Dashboard → Providers → Connect Claude Code
→ OAuth login → Auto token refresh
→ 5-hour + weekly quota tracking
Models:
cc/claude-opus-4-6
cc/claude-sonnet-4-5-20250929
cc/claude-haiku-4-5-20251001Proffstips: Använd Opus för komplexa uppgifter, Sonnet för snabbhet. OmniRoute spårar kvot per modell!
Dashboard → Providers → Connect Codex
→ OAuth login (port 1455)
→ 5-hour + weekly reset
Models:
cx/gpt-5.2-codex
cx/gpt-5.1-codex-maxDashboard → Providers → Connect Gemini CLI
→ Google OAuth
→ 180K completions/month + 1K/day
Models:
gc/gemini-3-flash-preview
gc/gemini-2.5-proBäst värde: Enorma gratis nivå! Använd detta före betalda nivåer.
Dashboard → Providers → Connect GitHub
→ OAuth via GitHub
→ Monthly reset (1st of month)
Models:
gh/gpt-5
gh/claude-4.5-sonnet
gh/gemini-3-pro- Registrera dig: Zhipu AI
- Hämta API-nyckel från Coding Plan
- Instrumentpanel → Lägg till API-nyckel: Leverantör:
glm, API-nyckel:your-key
Användning: glm/glm-4.7 — Proffstips: Coding Plan erbjuder 3× kvot till 1/7 kostnad! Återställ dagligen 10:00.
- Registrera dig: MiniMax
- Hämta API-nyckel → Dashboard → Lägg till API-nyckel
Använd: minimax/MiniMax-M2.1 — Proffstips: Billigaste alternativet för långa sammanhang (1M tokens)!
- Prenumerera: Moonshot AI
- Hämta API-nyckel → Dashboard → Lägg till API-nyckel
Användning: kimi/kimi-latest — Proffstips: Fast $9/månad för 10 miljoner tokens = $0,90/1 miljon effektiv kostnad!
Dashboard → Connect iFlow → OAuth login → Unlimited usage
Models: if/kimi-k2-thinking, if/qwen3-coder-plus, if/glm-4.7, if/minimax-m2, if/deepseek-r1Dashboard → Connect Qwen → Device code auth → Unlimited usage
Models: qw/qwen3-coder-plus, qw/qwen3-coder-flashDashboard → Connect Kiro → AWS Builder ID or Google/GitHub → Unlimited
Models: kr/claude-sonnet-4.5, kr/claude-haiku-4.5Dashboard → Combos → Create New
Name: premium-coding
Models:
1. cc/claude-opus-4-6 (Subscription primary)
2. glm/glm-4.7 (Cheap backup, $0.6/1M)
3. minimax/MiniMax-M2.1 (Cheapest fallback, $0.20/1M)
Use in CLI: premium-coding
Name: free-combo
Models:
1. gc/gemini-3-flash-preview (180K free/month)
2. if/kimi-k2-thinking (unlimited)
3. qw/qwen3-coder-plus (unlimited)
Cost: $0 forever!
Settings → Models → Advanced:
OpenAI API Base URL: http://localhost:20128/v1
OpenAI API Key: [from omniroute dashboard]
Model: cc/claude-opus-4-6
Redigera ~/.claude/config.json:
{
"anthropic_api_base": "http://localhost:20128/v1",
"anthropic_api_key": "your-omniroute-api-key"
}export OPENAI_BASE_URL="http://localhost:20128"
export OPENAI_API_KEY="your-omniroute-api-key"
codex "your prompt"Redigera ~/.openclaw/openclaw.json:
{
"agents": {
"defaults": {
"model": { "primary": "omniroute/if/glm-4.7" }
}
},
"models": {
"providers": {
"omniroute": {
"baseUrl": "http://localhost:20128/v1",
"apiKey": "your-omniroute-api-key",
"api": "openai-completions",
"models": [{ "id": "if/glm-4.7", "name": "glm-4.7" }]
}
}
}
}Eller använd Dashboard: CLI Tools → OpenClaw → Auto-config
Provider: OpenAI Compatible
Base URL: http://localhost:20128/v1
API Key: [from dashboard]
Model: cc/claude-opus-4-6
git clone https://github.com/diegosouzapw/OmniRoute.git
cd OmniRoute && npm install && npm run build
export JWT_SECRET="your-secure-secret-change-this"
export INITIAL_PASSWORD="your-password"
export DATA_DIR="/var/lib/omniroute"
export PORT="20128"
export HOSTNAME="0.0.0.0"
export NODE_ENV="production"
export NEXT_PUBLIC_BASE_URL="http://localhost:20128"
export API_KEY_SECRET="endpoint-proxy-api-key-secret"
npm run start
# Or: pm2 start npm --name omniroute -- start# Build image (default = runner-cli with codex/claude/droid preinstalled)
docker build -t omniroute:cli .
# Portable mode (recommended)
docker run -d --name omniroute -p 20128:20128 --env-file ./.env -v omniroute-data:/app/data omniroute:cliFör värdintegrerat läge med CLI-binärer, se Docker-sektionen i huvuddokumenten.
| Variabel | Standard | Beskrivning |
|---|---|---|
JWT_SECRET |
omniroute-default-secret-change-me |
JWT-signeringshemlighet (förändring i produktion) |
INITIAL_PASSWORD |
123456 |
Första inloggningslösenordet |
DATA_DIR |
~/.omniroute |
Datakatalog (db, användning, loggar) |
PORT |
ram standard | Serviceport (20128 i exempel) |
HOSTNAME |
ram standard | Bind värd (Docker har som standard 0.0.0.0) |
NODE_ENV |
runtime default | Ställ in production för distribution |
BASE_URL |
http://localhost:20128 |
Intern bas-URL på serversidan |
CLOUD_URL |
https://omniroute.dev |
Bas-URL för molnsynkroniseringsslutpunkt |
API_KEY_SECRET |
endpoint-proxy-api-key-secret |
HMAC-hemlighet för genererade API-nycklar |
REQUIRE_API_KEY |
false |
Framtvinga Bearer API-nyckel på /v1/* |
ENABLE_REQUEST_LOGS |
false |
Aktiverar förfrågnings-/svarsloggar |
AUTH_COOKIE_SECURE |
false |
Tvinga Secure auth-cookie (bakom HTTPS omvänd proxy) |
För den fullständiga referensen till miljövariabeln, se README.
Visa alla tillgängliga modeller
Claude Code (cc/) — Pro/Max: cc/claude-opus-4-6, cc/claude-sonnet-4-5-20250929, cc/claude-haiku-4-5-20251001
Codex (cx/) — Plus/Pro: cx/gpt-5.2-codex, cx/gpt-5.1-codex-max
Gemini CLI (gc/) — GRATIS: gc/gemini-3-flash-preview, gc/gemini-2.5-pro
GitHub Copilot (gh/): gh/gpt-5, gh/claude-4.5-sonnet
GLM (glm/) — $0,6/1M: glm/glm-4.7
MiniMax (minimax/) — $0,2/1M: minimax/MiniMax-M2.1
iFlow (if/) — GRATIS: if/kimi-k2-thinking, if/qwen3-coder-plus, if/deepseek-r1
Qwen (qw/) — GRATIS: qw/qwen3-coder-plus, qw/qwen3-coder-flash
Kiro (kr/) — GRATIS: kr/claude-sonnet-4.5, kr/claude-haiku-4.5
DeepSeek (ds/): ds/deepseek-chat, ds/deepseek-reasoner
Groq (groq/): groq/llama-3.3-70b-versatile, groq/llama-4-maverick-17b-128e-instruct
xAI (xai/): xai/grok-4, xai/grok-4-0709-fast-reasoning, xai/grok-code-mini
Mistral (mistral/): mistral/mistral-large-2501, mistral/codestral-2501
Förvirring (pplx/): pplx/sonar-pro, pplx/sonar
Together AI (together/): together/meta-llama/Llama-3.3-70B-Instruct-Turbo
Fireworks AI (fireworks/): fireworks/accounts/fireworks/models/deepseek-v3p1
Cerebras (cerebras/): cerebras/llama-3.3-70b
Kohere (cohere/): cohere/command-r-plus-08-2024
NVIDIA NIM (nvidia/): nvidia/nvidia/llama-3.3-70b-instruct
Lägg till valfritt modell-ID till valfri leverantör utan att vänta på en appuppdatering:
# Via API
curl -X POST http://localhost:20128/api/provider-models \
-H "Content-Type: application/json" \
-d '{"provider": "openai", "modelId": "gpt-4.5-preview", "modelName": "GPT-4.5 Preview"}'
# List: curl http://localhost:20128/api/provider-models?provider=openai
# Remove: curl -X DELETE "http://localhost:20128/api/provider-models?provider=openai&model=gpt-4.5-preview"Eller använd Dashboard: Leverantörer → [Leverantör] → Anpassade modeller.
Ruttförfrågningar direkt till en specifik leverantör med modellvalidering:
POST http://localhost:20128/v1/providers/openai/chat/completions
POST http://localhost:20128/v1/providers/openai/embeddings
POST http://localhost:20128/v1/providers/fireworks/images/generationsProviderprefixet läggs till automatiskt om det saknas. Omatchade modeller returnerar 400.
# Set global proxy
curl -X PUT http://localhost:20128/api/settings/proxy \
-d '{"global": {"type":"http","host":"proxy.example.com","port":"8080"}}'
# Per-provider proxy
curl -X PUT http://localhost:20128/api/settings/proxy \
-d '{"providers": {"openai": {"type":"socks5","host":"proxy.example.com","port":"1080"}}}'
# Test proxy
curl -X POST http://localhost:20128/api/settings/proxy/test \
-d '{"proxy":{"type":"socks5","host":"proxy.example.com","port":"1080"}}'Tillrang: Nyckelspecifik → Kombinationsspecifik → Leverantörsspecifik → Global → Miljö.
curl http://localhost:20128/api/models/catalogReturnerar modeller grupperade efter leverantör med typer (chat, embedding, image).
- Synkronisera leverantörer, kombinationer och inställningar mellan enheter
- Automatisk bakgrundssynkronisering med timeout + felsnabb
- Föredrar serversidan
BASE_URL/CLOUD_URLi produktion
- Semantisk cache — Autocachar icke-strömmande, temperatur=0 svar (förbikoppla med
X-OmniRoute-No-Cache: true) - Begär idempotens — Avduplicerar förfrågningar inom 5s via
Idempotency-KeyellerX-Request-Idheader - Förloppsspårning — Opt-in SSE
event: progress-händelser viaX-OmniRoute-Progress: trueheader
Åtkomst via Dashboard → Översättare. Felsöka och visualisera hur OmniRoute översätter API-förfrågningar mellan leverantörer.
| Läge | Syfte |
|---|---|
| Lekplats | Välj käll-/målformat, klistra in en begäran och se den översatta utdata direkt |
| Chatttestare | Skicka livechattmeddelanden via proxyn och inspektera hela begäran/svarscykeln |
| Testbänk | Kör batchtester över flera formatkombinationer för att verifiera översättningens korrekthet |
| Live Monitor | Se översättningar i realtid när förfrågningar flödar genom proxyn |
Användningsfall:
- Felsök varför en specifik kombination av klient/leverantör misslyckas
- Verifiera att tanketaggar, verktygsanrop och systemuppmaningar översätts korrekt
- Jämför formatskillnader mellan OpenAI, Claude, Gemini och Responses API-format
Konfigurera via Dashboard → Inställningar → Routing.
| Strategi | Beskrivning |
|---|---|
| Fyll först | Använder konton i prioritetsordning – primärt konto hanterar alla förfrågningar tills det inte är tillgängligt |
| Round Robin | Går igenom alla konton med en konfigurerbar sticky limit (standard: 3 samtal per konto) |
| P2C (Power of Two Choices) | Väljer 2 slumpmässiga konton och vägar till det friskare — balanserar belastning med medvetenhet om hälsa |
| Slumpmässig | Väljer slumpmässigt ett konto för varje begäran med Fisher-Yates shuffle |
| Minst använda | Rutter till kontot med den äldsta lastUsedAt tidsstämpeln, fördelar trafiken jämnt |
| Kostnadsoptimerad | Rutter till kontot med lägst prioritetsvärde, optimerar för lägsta kostnadsleverantörer |
Skapa jokerteckenmönster för att mappa om modellnamn:
Pattern: claude-sonnet-* → Target: cc/claude-sonnet-4-5-20250929
Pattern: gpt-* → Target: gh/gpt-5.1-codex
Jokertecken stöder * (alla tecken) och ? (enkeltecken).
Definiera globala reservkedjor som gäller för alla förfrågningar:
Chain: production-fallback
1. cc/claude-opus-4-6
2. gh/gpt-5.1-codex
3. glm/glm-4.7
Konfigurera via Dashboard → Inställningar → Resilience.
OmniRoute implementerar motståndskraft på leverantörsnivå med fyra komponenter:
-
Provider Profiles — Konfiguration per leverantör för:
- Feltröskel (hur många fel före öppning)
- Nedkylningstid
- Känslighet för detektering av hastighetsgräns
- Exponentiell backoff-parametrar
-
Redigerbara hastighetsgränser — Standardinställningar på systemnivå som kan konfigureras i instrumentpanelen:
- Requests Per Minute (RPM) — Maximalt antal förfrågningar per minut och konto
- Minsta tid mellan förfrågningar — Minsta mellanrum i millisekunder mellan förfrågningar
- Max samtidiga förfrågningar — Maximalt antal samtidiga förfrågningar per konto
- Klicka på Redigera för att ändra och sedan på Spara eller Avbryt. Värden kvarstår via resilience API.
-
Circuit Breaker — Spårar fel per leverantör och öppnar automatiskt kretsen när ett tröskelvärde nås:
- STÄNGD (frisk) — Begäran flyter normalt
- ÖPPEN — Leverantören är tillfälligt blockerad efter upprepade fel
- HALF_OPEN — Testar om leverantören har återhämtat sig
-
Policy & Locked Identifiers — Visar strömbrytarens status och låsta identifierare med tvångsupplåsning.
-
Rate Limit Auto-Detection — Övervakar
429ochRetry-Afterrubriker för att proaktivt undvika att nå leverantörshastighetsgränser.
Proffstips: Använd knappen Återställ alla för att rensa alla strömbrytare och nedkylningar när en leverantör återhämtar sig efter ett avbrott.
Hantera säkerhetskopiering av databas i Dashboard → Inställningar → System och lagring.
| Åtgärd | Beskrivning |
|---|---|
| Exportera databas | Laddar ned den aktuella SQLite-databasen som en .sqlite-fil |
| Exportera alla (.tar.gz) | Laddar ner ett fullständigt säkerhetskopieringsarkiv inklusive: databas, inställningar, kombinationer, leverantörsanslutningar (inga referenser), API-nyckelmetadata |
| Importera databas | Ladda upp en .sqlite fil för att ersätta den aktuella databasen. En säkerhetskopia före import skapas automatiskt |
# API: Export database
curl -o backup.sqlite http://localhost:20128/api/db-backups/export
# API: Export all (full archive)
curl -o backup.tar.gz http://localhost:20128/api/db-backups/exportAll
# API: Import database
curl -X POST http://localhost:20128/api/db-backups/import \
-F "file=@backup.sqlite"Importvalidering: Den importerade filen är validerad för integritet (SQLite pragmakontroll), obligatoriska tabeller (provider_connections, provider_nodes, combos, api_keys) och storlek (max 100 MB).
Användningsfall:
- Migrera OmniRoute mellan maskiner
- Skapa externa säkerhetskopior för katastrofåterställning
- Dela konfigurationer mellan teammedlemmar (exportera alla → dela arkiv)
Inställningssidan är organiserad i 5 flikar för enkel navigering:
| Tab | Innehåll |
|---|---|
| Säkerhet | Inställningar för inloggning/lösenord, IP-åtkomstkontroll, API-auth för /models och leverantörsblockering |
| Ruttning | Global routingstrategi (6 alternativ), jokerteckenmodellalias, reservkedjor, kombinationsstandarder |
| Resiliens | Leverantörsprofiler, redigerbara hastighetsgränser, strömbrytarstatus, policyer och låsta identifierare |
| AI | Tänkande budgetkonfiguration, global systempromptinjektion, promptcachestatistik |
| Avancerat | Global proxykonfiguration (HTTP/SOCKS5) |
Åtkomst via Dashboard → Kostnader.
| Tab | Syfte |
|---|---|
| Budget | Ställ in utgiftsgränser per API-nyckel med dagliga/veckovisa/månatliga budgetar och realtidsspårning |
| Priser | Visa och redigera modellprisposter — kostnad per 1000 in-/utdata-tokens per leverantör |
# API: Set a budget
curl -X POST http://localhost:20128/api/usage/budget \
-H "Content-Type: application/json" \
-d '{"keyId": "key-123", "limit": 50.00, "period": "monthly"}'
# API: Get current budget status
curl http://localhost:20128/api/usage/budgetKostnadsspårning: Varje begäran loggar tokenanvändning och beräknar kostnaden med hjälp av pristabellen. Visa uppdelningar i Dashboard → Användning efter leverantör, modell och API-nyckel.
OmniRoute stöder ljudtranskription via den OpenAI-kompatibla slutpunkten:
POST /v1/audio/transcriptions
Authorization: Bearer your-api-key
Content-Type: multipart/form-data
# Example with curl
curl -X POST http://localhost:20128/v1/audio/transcriptions \
-H "Authorization: Bearer your-api-key" \
-F "file=@audio.mp3" \
-F "model=deepgram/nova-3"Tillgängliga leverantörer: Deepgram (deepgram/), AssemblyAI (assemblyai/).
Ljudformat som stöds: mp3, wav, m4a, flac, ogg, webm.
Konfigurera balansering per kombination i Dashboard → Kombinationer → Skapa/Redigera → Strategi.
| Strategi | Beskrivning |
|---|---|
| Round-Robin | Roterar genom modeller sekventiellt |
| Prioritet | Försöker alltid den första modellen; faller tillbaka endast på fel |
| Slumpmässig | Väljer en slumpmässig modell från kombinationen för varje begäran |
| Viktad | Rutter proportionellt baserade på tilldelade vikter per modell |
| Minst använda | Rutter till modellen med de minsta senaste förfrågningarna (använder kombinationsmått) |
| Kostnadsoptimerad | Rutter till den billigaste tillgängliga modellen (använder pristabell) |
Globala kombinationsstandarder kan ställas in i Dashboard → Inställningar → Routing → Combo Defaults.
Åtkomst via Dashboard → Hälsa. Systemhälsoöversikt i realtid med 6 kort:
| Kort | Vad den visar |
|---|---|
| Systemstatus | Drifttid, version, minnesanvändning, datakatalog |
| Providers hälsa | Tillstånd för strömbrytare per leverantör (stängd/öppen/halvöppen) |
| Taxegränser | Aktiva nedkylningar per konto med återstående tid |
| Aktiva låsningar | Leverantörer tillfälligt blockerade av lockoutpolicyn |
| Signaturcache | Dedupliceringscachestatistik (aktiva nycklar, träffhastighet) |
| Latens-telemetri | p50/p95/p99 latensaggregation per leverantör |
Proffstips: Hälsosidan uppdateras automatiskt var tionde sekund. Använd strömbrytarkortet för att identifiera vilka leverantörer som har problem.