🌐 Languages: 🇺🇸 English | 🇧🇷 Português (Brasil) | 🇪🇸 Español | 🇫🇷 Français | 🇮🇹 Italiano | 🇷🇺 Русский | 🇨🇳 中文 (简体) | 🇩🇪 Deutsch | 🇮🇳 हिन्दी | 🇹🇭 ไทย | 🇺🇦 Українська | 🇸🇦 العربية | 🇯🇵 日本語 | 🇻🇳 Tiếng Việt | 🇧🇬 Български | 🇩🇰 Dansk | 🇫🇮 Suomi | 🇮🇱 עברית | 🇭🇺 Magyar | 🇮🇩 Bahasa Indonesia | 🇰🇷 한국어 | 🇲🇾 Bahasa Melayu | 🇳🇱 Nederlands | 🇳🇴 Norsk | 🇵🇹 Português (Portugal) | 🇷🇴 Română | 🇵🇱 Polski | 🇸🇰 Slovenčina | 🇸🇪 Svenska | 🇵🇭 Filipino
Komplett veiledning for å konfigurere leverandører, lage kombinasjoner, integrere CLI-verktøy og distribuere OmniRoute.
- Pricing at a Glance
- Use Cases
- Provider Setup
- CLI Integration
- Deployment
- Available Models
- Advanced Features
| Nivå | Leverandør | Kostnad | Kvote Tilbakestill | Best for |
|---|---|---|---|---|
| 💳 ABONNEMENT | Claude Code (Pro) | $20/md | 5t + ukentlig | Allerede abonnert |
| Codex (Pluss/Pro) | $20-200/md | 5t + ukentlig | OpenAI-brukere | |
| Gemini CLI | GRATIS | 180K/mnd + 1K/dag | Alle sammen! | |
| GitHub Copilot | $10-19/md | Månedlig | GitHub-brukere | |
| 🔑 API NØKKEL | DeepSeek | Betal per bruk | Ingen | Billig resonnement |
| Groq | Betal per bruk | Ingen | Ultrarask slutning | |
| xAI (Grok) | Betal per bruk | Ingen | Grok 4 resonnement | |
| Mistral | Betal per bruk | Ingen | EU-vertsbaserte modeller | |
| Forvirring | Betal per bruk | Ingen | Søkeutvidet | |
| Sammen AI | Betal per bruk | Ingen | Åpen kildekode-modeller | |
| Fyrverkeri AI | Betal per bruk | Ingen | Rask FLUX bilder | |
| Cerebras | Betal per bruk | Ingen | Wafer-skala hastighet | |
| Sammenheng | Betal per bruk | Ingen | Kommando R+ RAG | |
| NVIDIA NIM | Betal per bruk | Ingen | Bedriftsmodeller | |
| 💰 BILLIG | GLM-4.7 | $0,6/1M | Daglig 10:00 | Budsjett backup |
| MiniMax M2.1 | $0,2/1 million | 5-timers rullende | Billigste alternativ | |
| Kimi K2 | $9/md leilighet | 10 millioner tokens/mnd | Forutsigbar kostnad | |
| 🆓 GRATIS | iFlow | $0 | Ubegrenset | 8 modeller gratis |
| Qwen | $0 | Ubegrenset | 3 modeller gratis | |
| Kiro | $0 | Ubegrenset | Claude gratis |
💡 Profftips: Start med Gemini CLI (180K gratis/måned) + iFlow (ubegrenset gratis) kombinasjon = $0 kostnad!
Problem: Kvoten utløper ubrukt, satsgrenser under tung koding
Combo: "maximize-claude"
1. cc/claude-opus-4-6 (use subscription fully)
2. glm/glm-4.7 (cheap backup when quota out)
3. if/kimi-k2-thinking (free emergency fallback)
Monthly cost: $20 (subscription) + ~$5 (backup) = $25 total
vs. $20 + hitting limits = frustration
Problem: Har ikke råd til abonnementer, trenger pålitelig AI-koding
Combo: "free-forever"
1. gc/gemini-3-flash (180K free/month)
2. if/kimi-k2-thinking (unlimited free)
3. qw/qwen3-coder-plus (unlimited free)
Monthly cost: $0
Quality: Production-ready models
Problem: Tidsfrister, har ikke råd til nedetid
Combo: "always-on"
1. cc/claude-opus-4-6 (best quality)
2. cx/gpt-5.2-codex (second subscription)
3. glm/glm-4.7 (cheap, resets daily)
4. minimax/MiniMax-M2.1 (cheapest, 5h reset)
5. if/kimi-k2-thinking (free unlimited)
Result: 5 layers of fallback = zero downtime
Monthly cost: $20-200 (subscriptions) + $10-20 (backup)
Problem: Trenger AI-assistent i meldingsapper, helt gratis
Combo: "openclaw-free"
1. if/glm-4.7 (unlimited free)
2. if/minimax-m2.1 (unlimited free)
3. if/kimi-k2-thinking (unlimited free)
Monthly cost: $0
Access via: WhatsApp, Telegram, Slack, Discord, iMessage, Signal...
Dashboard → Providers → Connect Claude Code
→ OAuth login → Auto token refresh
→ 5-hour + weekly quota tracking
Models:
cc/claude-opus-4-6
cc/claude-sonnet-4-5-20250929
cc/claude-haiku-4-5-20251001Profftips: Bruk Opus for komplekse oppgaver, Sonnet for hastighet. OmniRoute sporer kvote per modell!
Dashboard → Providers → Connect Codex
→ OAuth login (port 1455)
→ 5-hour + weekly reset
Models:
cx/gpt-5.2-codex
cx/gpt-5.1-codex-maxDashboard → Providers → Connect Gemini CLI
→ Google OAuth
→ 180K completions/month + 1K/day
Models:
gc/gemini-3-flash-preview
gc/gemini-2.5-proMest verdi: Enormt gratis nivå! Bruk dette før betalte nivåer.
Dashboard → Providers → Connect GitHub
→ OAuth via GitHub
→ Monthly reset (1st of month)
Models:
gh/gpt-5
gh/claude-4.5-sonnet
gh/gemini-3-pro- Registrer deg: Zhipu AI
- Få API-nøkkel fra Coding Plan
- Dashboard → Legg til API-nøkkel: Leverandør:
glm, API-nøkkel:your-key
Bruk: glm/glm-4.7 — Profftips: Kodeplan tilbyr 3× kvote til 1/7 kostnad! Tilbakestill daglig 10:00.
- Registrer deg: MiniMax
- Hent API-nøkkel → Dashboard → Legg til API-nøkkel
Bruk: minimax/MiniMax-M2.1 — Profftips: Billigste alternativet for lang kontekst (1M tokens)!
- Abonner: Moonshot AI
- Hent API-nøkkel → Dashboard → Legg til API-nøkkel
Bruk: kimi/kimi-latest — Profftips: Fast $9/måned for 10M tokens = $0,90/1M effektiv kostnad!
Dashboard → Connect iFlow → OAuth login → Unlimited usage
Models: if/kimi-k2-thinking, if/qwen3-coder-plus, if/glm-4.7, if/minimax-m2, if/deepseek-r1Dashboard → Connect Qwen → Device code auth → Unlimited usage
Models: qw/qwen3-coder-plus, qw/qwen3-coder-flashDashboard → Connect Kiro → AWS Builder ID or Google/GitHub → Unlimited
Models: kr/claude-sonnet-4.5, kr/claude-haiku-4.5Dashboard → Combos → Create New
Name: premium-coding
Models:
1. cc/claude-opus-4-6 (Subscription primary)
2. glm/glm-4.7 (Cheap backup, $0.6/1M)
3. minimax/MiniMax-M2.1 (Cheapest fallback, $0.20/1M)
Use in CLI: premium-coding
Name: free-combo
Models:
1. gc/gemini-3-flash-preview (180K free/month)
2. if/kimi-k2-thinking (unlimited)
3. qw/qwen3-coder-plus (unlimited)
Cost: $0 forever!
Settings → Models → Advanced:
OpenAI API Base URL: http://localhost:20128/v1
OpenAI API Key: [from omniroute dashboard]
Model: cc/claude-opus-4-6
Rediger ~/.claude/config.json:
{
"anthropic_api_base": "http://localhost:20128/v1",
"anthropic_api_key": "your-omniroute-api-key"
}export OPENAI_BASE_URL="http://localhost:20128"
export OPENAI_API_KEY="your-omniroute-api-key"
codex "your prompt"Rediger ~/.openclaw/openclaw.json:
{
"agents": {
"defaults": {
"model": { "primary": "omniroute/if/glm-4.7" }
}
},
"models": {
"providers": {
"omniroute": {
"baseUrl": "http://localhost:20128/v1",
"apiKey": "your-omniroute-api-key",
"api": "openai-completions",
"models": [{ "id": "if/glm-4.7", "name": "glm-4.7" }]
}
}
}
}Eller bruk Dashboard: CLI Tools → OpenClaw → Auto-config
Provider: OpenAI Compatible
Base URL: http://localhost:20128/v1
API Key: [from dashboard]
Model: cc/claude-opus-4-6
git clone https://github.com/diegosouzapw/OmniRoute.git
cd OmniRoute && npm install && npm run build
export JWT_SECRET="your-secure-secret-change-this"
export INITIAL_PASSWORD="your-password"
export DATA_DIR="/var/lib/omniroute"
export PORT="20128"
export HOSTNAME="0.0.0.0"
export NODE_ENV="production"
export NEXT_PUBLIC_BASE_URL="http://localhost:20128"
export API_KEY_SECRET="endpoint-proxy-api-key-secret"
npm run start
# Or: pm2 start npm --name omniroute -- start# Build image (default = runner-cli with codex/claude/droid preinstalled)
docker build -t omniroute:cli .
# Portable mode (recommended)
docker run -d --name omniroute -p 20128:20128 --env-file ./.env -v omniroute-data:/app/data omniroute:cliFor vertsintegrert modus med CLI-binærfiler, se Docker-delen i hoveddokumentene.
| Variabel | Standard | Beskrivelse |
|---|---|---|
JWT_SECRET |
omniroute-default-secret-change-me |
JWT signeringshemmelighet (endring i produksjon) |
INITIAL_PASSWORD |
123456 |
Første påloggingspassord |
DATA_DIR |
~/.omniroute |
Datakatalog (db, bruk, logger) |
PORT |
standard rammeverk | Tjenesteport (20128 i eksempler) |
HOSTNAME |
standard rammeverk | Bind vert (Docker er standard til 0.0.0.0) |
NODE_ENV |
kjøretidsstandard | Sett production for distribusjon |
BASE_URL |
http://localhost:20128 |
Intern basis-URL på tjenersiden |
CLOUD_URL |
https://omniroute.dev |
Nettadresse for endepunkt for nettskysynkronisering |
API_KEY_SECRET |
endpoint-proxy-api-key-secret |
HMAC-hemmelighet for genererte API-nøkler |
REQUIRE_API_KEY |
false |
Håndhev Bearer API-nøkkel på /v1/* |
ENABLE_REQUEST_LOGS |
false |
Aktiverer forespørsels-/svarlogger |
AUTH_COOKIE_SECURE |
false |
Tving Secure auth-informasjonskapsel (bak HTTPS omvendt proxy) |
For hele miljøvariabelreferansen, se README.
Se alle tilgjengelige modeller
Claude-kode (cc/) — Pro/Max: cc/claude-opus-4-6, cc/claude-sonnet-4-5-20250929, cc/claude-haiku-4-5-20251001
Kodeks (cx/) — Pluss/Proff: cx/gpt-5.2-codex, cx/gpt-5.1-codex-max
Gemini CLI (gc/) — GRATIS: gc/gemini-3-flash-preview, gc/gemini-2.5-pro
GitHub Copilot (gh/): gh/gpt-5, gh/claude-4.5-sonnet
GLM (glm/) — $0,6/1M: glm/glm-4.7
MiniMax (minimax/) — $0,2/1M: minimax/MiniMax-M2.1
iFlow (if/) — GRATIS: if/kimi-k2-thinking, if/qwen3-coder-plus, if/deepseek-r1
Qwen (qw/) — GRATIS: qw/qwen3-coder-plus, qw/qwen3-coder-flash
Kiro (kr/) — GRATIS: kr/claude-sonnet-4.5, kr/claude-haiku-4.5
DeepSeek (ds/): ds/deepseek-chat, ds/deepseek-reasoner
Groq (groq/): groq/llama-3.3-70b-versatile, groq/llama-4-maverick-17b-128e-instruct
xAI (xai/): xai/grok-4, xai/grok-4-0709-fast-reasoning, xai/grok-code-mini
Mistral (mistral/): mistral/mistral-large-2501, mistral/codestral-2501
Forvirring (pplx/): pplx/sonar-pro, pplx/sonar
Together AI (together/): together/meta-llama/Llama-3.3-70B-Instruct-Turbo
Fireworks AI (fireworks/): fireworks/accounts/fireworks/models/deepseek-v3p1
Cerebras (cerebras/): cerebras/llama-3.3-70b
Kohere (cohere/): cohere/command-r-plus-08-2024
NVIDIA NIM (nvidia/): nvidia/nvidia/llama-3.3-70b-instruct
Legg til hvilken som helst modell-ID til en hvilken som helst leverandør uten å vente på en appoppdatering:
# Via API
curl -X POST http://localhost:20128/api/provider-models \
-H "Content-Type: application/json" \
-d '{"provider": "openai", "modelId": "gpt-4.5-preview", "modelName": "GPT-4.5 Preview"}'
# List: curl http://localhost:20128/api/provider-models?provider=openai
# Remove: curl -X DELETE "http://localhost:20128/api/provider-models?provider=openai&model=gpt-4.5-preview"Eller bruk Dashboard: Leverandører → [Leverandør] → Egendefinerte modeller.
Rute forespørsler direkte til en spesifikk leverandør med modellvalidering:
POST http://localhost:20128/v1/providers/openai/chat/completions
POST http://localhost:20128/v1/providers/openai/embeddings
POST http://localhost:20128/v1/providers/fireworks/images/generationsLeverandørprefikset blir automatisk lagt til hvis det mangler. Umatchede modeller returnerer 400.
# Set global proxy
curl -X PUT http://localhost:20128/api/settings/proxy \
-d '{"global": {"type":"http","host":"proxy.example.com","port":"8080"}}'
# Per-provider proxy
curl -X PUT http://localhost:20128/api/settings/proxy \
-d '{"providers": {"openai": {"type":"socks5","host":"proxy.example.com","port":"1080"}}}'
# Test proxy
curl -X POST http://localhost:20128/api/settings/proxy/test \
-d '{"proxy":{"type":"socks5","host":"proxy.example.com","port":"1080"}}'Forrang: Nøkkelspesifikk → Kombinasjonsspesifikk → Leverandørspesifikk → Global → Miljø.
curl http://localhost:20128/api/models/catalogReturnerer modeller gruppert etter leverandør med typer (chat, embedding, image).
- Synkroniser leverandører, kombinasjoner og innstillinger på tvers av enheter
- Automatisk bakgrunnssynkronisering med timeout + feil-rask
- Foretrekk server-side
BASE_URL/CLOUD_URLi produksjon
- Semantisk hurtigbuffer — Automatisk hurtigbufring uten strømming, temperatur=0 svar (omgå med
X-OmniRoute-No-Cache: true) - Request Idempotency — Dedupliserer forespørsler innen 5 sekunder via
Idempotency-KeyellerX-Request-Idheader - Fremdriftssporing — Meld deg på SSE
event: progresshendelser viaX-OmniRoute-Progress: trueheader
Tilgang via Dashboard → Oversetter. Feilsøk og visualiser hvordan OmniRoute oversetter API-forespørsler mellom leverandører.
| Modus | Formål |
|---|---|
| Lekeplass | Velg kilde-/målformater, lim inn en forespørsel og se den oversatte utgangen umiddelbart |
| Chattetester | Send live chat-meldinger gjennom proxyen og inspiser hele forespørsels-/svarsyklusen |
| Testbenk | Kjør batch-tester på tvers av flere formatkombinasjoner for å bekrefte oversettelsens korrekthet |
| Live Monitor | Se sanntidsoversettelser mens forespørsler strømmer gjennom proxyen |
Brukstilfeller:
- Feilsøk hvorfor en spesifikk klient/leverandør-kombinasjon mislykkes
- Bekreft at tankekoder, verktøykall og systemmeldinger oversettes riktig
- Sammenlign formatforskjeller mellom OpenAI, Claude, Gemini og Responses API-formater
Konfigurer via Dashboard → Innstillinger → Ruting.
| Strategi | Beskrivelse |
|---|---|
| Fyll først | Bruker kontoer i prioritert rekkefølge — primærkonto håndterer alle forespørsler inntil utilgjengelig |
| Round Robin | Bla gjennom alle kontoer med en konfigurerbar klebrig grense (standard: 3 samtaler per konto) |
| P2C (Power of Two Choices) | Velger 2 tilfeldige kontoer og ruter til den sunnere — balanserer belastning med bevissthet om helse |
| Tilfeldig | Velger tilfeldig en konto for hver forespørsel ved hjelp av Fisher-Yates shuffle |
| Minst brukt | Ruter til kontoen med det eldste lastUsedAt tidsstemplet, fordeler trafikk jevnt |
| Kostnadsoptimalisert | Ruter til kontoen med den laveste prioritetsverdien, optimalisering for de laveste kostnadsleverandørene |
Lag jokertegnmønstre for å tilordne modellnavn på nytt:
Pattern: claude-sonnet-* → Target: cc/claude-sonnet-4-5-20250929
Pattern: gpt-* → Target: gh/gpt-5.1-codex
Jokertegn støtter * (alle tegn) og ? (enkelttegn).
Definer globale reservekjeder som gjelder for alle forespørsler:
Chain: production-fallback
1. cc/claude-opus-4-6
2. gh/gpt-5.1-codex
3. glm/glm-4.7
Konfigurer via Dashboard → Innstillinger → Resiliens.
OmniRoute implementerer motstandskraft på leverandørnivå med fire komponenter:
-
Leverandørprofiler — Konfigurasjon per leverandør for:
- Feilterskel (hvor mange feil før åpning)
- Nedkjølingsvarighet
- Følsomhet for deteksjon av hastighetsgrense
- Eksponentielle backoff-parametere
-
Redigerbare rategrenser — Standardinnstillinger på systemnivå som kan konfigureres i dashbordet:
- Forespørsler per minutt (RPM) — Maksimalt antall forespørsler per minutt per konto
- Min time Between Requests — Minimumsavstand i millisekunder mellom forespørsler
- Maks samtidige forespørsler — Maksimalt antall samtidige forespørsler per konto
- Klikk på Rediger for å endre, deretter Lagre eller Avbryt. Verdiene vedvarer via resilience API.
-
Circuit Breaker — Sporer feil per leverandør og åpner automatisk kretsen når en terskel er nådd:
- STENGT (Sunn) — Forespørslene flyter normalt
- ÅPEN — Leverandøren er midlertidig blokkert etter gjentatte feil
- HALF_OPEN — Tester om leverandøren har kommet seg
-
Retningslinjer og låste identifikatorer — Viser strømbryterstatus og låste identifikatorer med tvangsopplåsingsfunksjon.
-
Rate Limit Auto-Detection — Overvåker
429ogRetry-Afteroverskrifter for å proaktivt unngå å treffe leverandørens takstgrenser.
Profftips: Bruk Tilbakestill alle-knappen for å fjerne alle strømbrytere og nedkjøling når en leverandør kommer seg etter et strømbrudd.
Administrer sikkerhetskopiering av databaser i Dashboard → Innstillinger → System og lagring.
| Handling | Beskrivelse |
|---|---|
| Eksporter database | Laster ned gjeldende SQLite-database som en .sqlite-fil |
| Eksporter alle (.tar.gz) | Laster ned et fullstendig sikkerhetskopiarkiv inkludert: database, innstillinger, kombinasjoner, leverandørtilkoblinger (ingen legitimasjon), API-nøkkelmetadata |
| Importer database | Last opp en .sqlite-fil for å erstatte gjeldende database. En forhåndsimport-sikkerhetskopi opprettes automatisk |
# API: Export database
curl -o backup.sqlite http://localhost:20128/api/db-backups/export
# API: Export all (full archive)
curl -o backup.tar.gz http://localhost:20128/api/db-backups/exportAll
# API: Import database
curl -X POST http://localhost:20128/api/db-backups/import \
-F "file=@backup.sqlite"Importvalidering: Den importerte filen er validert for integritet (SQLite pragmasjekk), nødvendige tabeller (provider_connections, provider_nodes, combos, api_keys) og størrelse (maks 100 MB).
Brukstilfeller:
- Migrer OmniRoute mellom maskiner
- Lag eksterne sikkerhetskopier for katastrofegjenoppretting
- Del konfigurasjoner mellom teammedlemmer (eksporter alle → del arkiv)
Innstillingssiden er organisert i 5 faner for enkel navigering:
| Tab | Innhold |
|---|---|
| Sikkerhet | Innstillinger for pålogging/passord, IP-tilgangskontroll, API-autentisering for /models og leverandørblokkering |
| Ruting | Global rutingstrategi (6 alternativer), jokertegnmodellaliaser, reservekjeder, kombinasjonsstandarder |
| Resiliens | Leverandørprofiler, redigerbare hastighetsgrenser, strømbryterstatus, retningslinjer og låste identifikatorer |
| AI | Tenker budsjettkonfigurasjon, global systempromptinjeksjon, promptbufferstatistikk |
| Avansert | Global proxy-konfigurasjon (HTTP/SOCKS5) |
Tilgang via Dashboard → Kostnader.
| Tab | Formål |
|---|---|
| Budsjett | Angi utgiftsgrenser per API-nøkkel med daglige/ukentlige/månedlige budsjetter og sanntidssporing |
| Pris | Se og rediger modellprisoppføringer — kostnad per 1K input/output tokens per leverandør |
# API: Set a budget
curl -X POST http://localhost:20128/api/usage/budget \
-H "Content-Type: application/json" \
-d '{"keyId": "key-123", "limit": 50.00, "period": "monthly"}'
# API: Get current budget status
curl http://localhost:20128/api/usage/budgetKostnadssporing: Hver forespørsel logger tokenbruk og beregner kostnad ved hjelp av pristabellen. Se oversikter i Dashboard → Bruk etter leverandør, modell og API-nøkkel.
OmniRoute støtter lydtranskripsjon via det OpenAI-kompatible endepunktet:
POST /v1/audio/transcriptions
Authorization: Bearer your-api-key
Content-Type: multipart/form-data
# Example with curl
curl -X POST http://localhost:20128/v1/audio/transcriptions \
-H "Authorization: Bearer your-api-key" \
-F "file=@audio.mp3" \
-F "model=deepgram/nova-3"Tilgjengelige leverandører: Deepgram (deepgram/), AssemblyAI (assemblyai/).
Støttede lydformater: mp3, wav, m4a, flac, ogg, webm.
Konfigurer balansering per kombinasjon i Dashboard → Combos → Opprett/Rediger → Strategi.
| Strategi | Beskrivelse |
|---|---|
| Round-Robin | Roterer gjennom modellene sekvensielt |
| Prioritet | Prøver alltid den første modellen; faller tilbake kun på feil |
| Tilfeldig | Velger en tilfeldig modell fra kombinasjonen for hver forespørsel |
| Vektet | Ruter proporsjonalt basert på tildelte vekter per modell |
| Minst brukt | Ruter til modellen med færrest nylige forespørsler (bruker kombinasjonsberegninger) |
| Kostnadsoptimalisert | Ruter til den billigste tilgjengelige modellen (bruker pristabell) |
Globale kombinasjonsstandarder kan angis i Dashboard → Innstillinger → Ruting → Combo-standarder.
Tilgang via Dashboard → Helse. Sanntids systemhelseoversikt med 6 kort:
| Kort | Hva det viser |
|---|---|
| Systemstatus | Oppetid, versjon, minnebruk, datakatalog |
| Leverandørs helse | Per leverandør effektbrytertilstand (lukket/åpen/halvåpen) |
| Satsgrenser | Aktive nedkjølingshastigheter per konto med gjenværende tid |
| Aktive Lockouts | Leverandører midlertidig blokkert av lockout-policyen |
| Signaturbuffer | Dedupliseringsbufferstatistikk (aktive nøkler, trefffrekvens) |
| Latens-telemetri | p50/p95/p99 latensaggregering per leverandør |
Profftips: Helsesiden oppdateres automatisk hvert 10. sekund. Bruk kretsbryterkortet til å identifisere hvilke leverandører som har problemer.