🚀 OmniRoute — Das kostenlose AI-Gateway

Höre nie auf zu programmieren. Intelligentes Routing zu KOSTENLOSEN und günstigen KI-Modellen mit automatischem Fallback.

Dein universeller API-Proxy — ein Endpoint, 36+ Anbieter, null Ausfallzeit.

Chat Completions • Embeddings • Bildgenerierung • Audio • Reranking • 100% TypeScript

🤖 Kostenloser KI-Anbieter für deine Lieblings-Coding-Agenten

Verbinde jedes KI-gesteuerte IDE- oder CLI-Tool über OmniRoute — kostenloses API-Gateway für unbegrenztes Programmieren.

OpenClaw _{⭐ 205K}	NanoBot _{⭐ 20.9K}	PicoClaw _{⭐ 14.6K}	ZeroClaw _{⭐ 9.9K}	IronClaw _{⭐ 2.1K}
OpenCode _{⭐ 106K}	Codex CLI _{⭐ 60.8K}	Claude Code _{⭐ 67.3K}	Gemini CLI _{⭐ 94.7K}	Kilo Code _{⭐ 15.5K}

_{📡 Alle Agenten verbinden sich über http://localhost:20128/v1 oder http://cloud.omniroute.online/v1 — eine Konfiguration, unbegrenzte Modelle und Kontingent}

🌐 Website • 🚀 Schnellstart • 💡 Funktionen • 📖 Doku • 💰 Preise

🤔 Warum OmniRoute?

Hör auf, Geld zu verschwenden und an Limits zu stoßen:

Abo-Kontingent verfällt jeden Monat ungenutzt
Rate-Limits stoppen dich mitten beim Programmieren
Teure APIs ($20-50/Monat pro Anbieter)
Manuelles Wechseln zwischen Anbietern

OmniRoute löst das:

✅ Abos maximieren — Kontingente tracken, alles vor dem Reset nutzen
✅ Automatischer Fallback — Abo → API Key → Günstig → Kostenlos, null Ausfallzeit
✅ Multi-Account — Round-Robin zwischen Konten pro Anbieter
✅ Universal — Funktioniert mit Claude Code, Codex, Gemini CLI, Cursor, Cline, OpenClaw, jedem CLI-Tool

🔄 So funktioniert's

┌─────────────┐
│  Dein CLI   │  (Claude Code, Codex, Gemini CLI, OpenClaw, Cursor, Cline...)
│   Tool      │
└──────┬──────┘
       │ http://localhost:20128/v1
       ↓
┌─────────────────────────────────────────┐
│         OmniRoute (Smart Router)         │
│  • Format-Übersetzung (OpenAI ↔ Claude) │
│  • Kontingent-Tracking + Embeddings + Bilder │
│  • Automatische Token-Erneuerung        │
└──────┬──────────────────────────────────┘
       │
       ├─→ [Tier 1: ABO] Claude Code, Codex, Gemini CLI
       │   ↓ Kontingent erschöpft
       ├─→ [Tier 2: API KEY] DeepSeek, Groq, xAI, Mistral, NVIDIA NIM usw.
       │   ↓ Budget-Limit
       ├─→ [Tier 3: GÜNSTIG] GLM ($0.6/1M), MiniMax ($0.2/1M)
       │   ↓ Budget-Limit
       └─→ [Tier 4: KOSTENLOS] iFlow, Qwen, Kiro (unbegrenzt)

Ergebnis: Nie aufhören zu programmieren, minimale Kosten

⚡ Schnellstart

1. Global installieren:

npm install -g omniroute
omniroute

🎉 Das Dashboard öffnet sich unter http://localhost:20128

Befehl	Beschreibung
`omniroute`	Server starten (Standardport 20128)
`omniroute --port 3000`	Benutzerdefinierten Port verwenden
`omniroute --no-open`	Browser nicht automatisch öffnen
`omniroute --help`	Hilfe anzeigen

2. KOSTENLOSEN Anbieter verbinden:

Dashboard → Anbieter → Claude Code oder Antigravity verbinden → OAuth Login → Fertig!

3. In deinem CLI-Tool verwenden:

Claude Code/Codex/Gemini CLI/OpenClaw/Cursor/Cline Einstellungen:
  Endpoint: http://localhost:20128/v1
  API Key: [vom Dashboard kopieren]
  Model: if/kimi-k2-thinking

Das war's! Beginne mit KOSTENLOSEN KI-Modellen zu programmieren.

Alternative — aus Quellcode ausführen:

cp .env.example .env
npm install
PORT=20128 NEXT_PUBLIC_BASE_URL=http://localhost:20128 npm run dev

🐳 Docker

OmniRoute ist als öffentliches Docker-Image auf Docker Hub verfügbar.

Schnellstart:

docker run -d \
  --name omniroute \
  --restart unless-stopped \
  -p 20128:20128 \
  -v omniroute-data:/app/data \
  diegosouzapw/omniroute:latest

Mit Umgebungsdatei:

# .env kopieren und bearbeiten
cp .env.example .env

docker run -d \
  --name omniroute \
  --restart unless-stopped \
  --env-file .env \
  -p 20128:20128 \
  -v omniroute-data:/app/data \
  diegosouzapw/omniroute:latest

Mit Docker Compose:

# Basisprofil (ohne CLI-Tools)
docker compose --profile base up -d

# CLI-Profil (Claude Code, Codex, OpenClaw integriert)
docker compose --profile cli up -d

Image	Tag	Größe	Beschreibung
`diegosouzapw/omniroute`	`latest`	~250MB	Letztes stabiles Release
`diegosouzapw/omniroute`	`1.0.6`	~250MB	Aktuelle Version

💰 Preisübersicht

Tier	Anbieter	Kosten	Kontingent-Reset	Am besten für
💳 ABO	Claude Code (Pro)	$20/Monat	5h + wöchentlich	Bereits abonniert
	Codex (Plus/Pro)	$20-200/Monat	5h + wöchentlich	OpenAI-Nutzer
	Gemini CLI	KOSTENLOS	180K/Monat + 1K/Tag	Alle!
	GitHub Copilot	$10-19/Monat	Monatlich	GitHub-Nutzer
🔑 API KEY	NVIDIA NIM	KOSTENLOS (1000 Credits)	Einmalig	Kostenloses Testen
	DeepSeek	Nach Verbrauch	Keiner	Bestes Preis-Leistung
	Groq	Gratis-Stufe + bezahlt	Begrenzt	Ultra-schnelle Inferenz
	xAI (Grok)	Nach Verbrauch	Keiner	Grok-Modelle
	Mistral	Gratis-Stufe + bezahlt	Begrenzt	Europäische KI
	OpenRouter	Nach Verbrauch	Keiner	100+ Modelle
💰 GÜNSTIG	GLM-4.7	$0.6/1M	Täglich 10h	Budget-Backup
	MiniMax M2.1	$0.2/1M	5h rotierend	Günstigste Option
	Kimi K2	$9/Monat fest	10M Token/Monat	Vorhersagbare Kosten
🆓 KOSTENLOS	iFlow	$0	Unbegrenzt	8 kostenlose Modelle
	Qwen	$0	Unbegrenzt	3 kostenlose Modelle
	Kiro	$0	Unbegrenzt	Kostenloses Claude

💡 Profi-Tipp: Starte mit Gemini CLI (180K gratis/Monat) + iFlow (unbegrenzt gratis) = $0 Kosten!

🎯 Anwendungsfälle

Fall 1: „Ich habe ein Claude Pro Abo"

Problem: Kontingent verfällt ungenutzt, Rate-Limits während intensivem Programmieren

Combo: "maximize-claude"
  1. cc/claude-opus-4-6        (Abo voll ausnutzen)
  2. glm/glm-4.7               (günstiges Backup bei erschöpftem Kontingent)
  3. if/kimi-k2-thinking       (kostenloser Notfall-Fallback)

Monatliche Kosten: $20 (Abo) + ~$5 (Backup) = $25 gesamt
vs. $20 + an Limits stoßen = Frustration

Fall 2: „Ich will null Kosten"

Problem: Kann sich Abos nicht leisten, braucht zuverlässige KI zum Programmieren

Combo: "free-forever"
  1. gc/gemini-3-flash         (180K gratis/Monat)
  2. if/kimi-k2-thinking       (unbegrenzt gratis)
  3. qw/qwen3-coder-plus       (unbegrenzt gratis)

Monatliche Kosten: $0
Qualität: Produktionsreife Modelle

Fall 3: „Ich muss 24/7 programmieren, ohne Unterbrechungen"

Problem: Enge Deadlines, kann sich keine Ausfallzeit leisten

Combo: "always-on"
  1. cc/claude-opus-4-6        (beste Qualität)
  2. cx/gpt-5.2-codex          (zweites Abo)
  3. glm/glm-4.7               (günstig, täglicher Reset)
  4. minimax/MiniMax-M2.1      (günstigste, 5h Reset)
  5. if/kimi-k2-thinking       (unbegrenzt kostenlos)

Ergebnis: 5 Fallback-Ebenen = null Ausfallzeit

Fall 4: „Ich will KOSTENLOSE KI in OpenClaw"

Problem: Braucht KI-Assistenz in Messaging-Apps, komplett kostenlos

Combo: "openclaw-free"
  1. if/glm-4.7                (unbegrenzt kostenlos)
  2. if/minimax-m2.1           (unbegrenzt kostenlos)
  3. if/kimi-k2-thinking       (unbegrenzt kostenlos)

Monatliche Kosten: $0
Zugang über: WhatsApp, Telegram, Slack, Discord, iMessage, Signal...

💡 Hauptfunktionen

🧠 Routing & Intelligenz

Funktion	Was es macht
🎯 Intelligenter 4-Tier-Fallback	Auto-Routing: Abo → API Key → Günstig → Kostenlos
📊 Echtzeit-Kontingent-Tracking	Live Token-Zählung + Reset-Countdown pro Anbieter
🔄 Format-Übersetzung	OpenAI ↔ Claude ↔ Gemini ↔ Cursor ↔ Kiro nahtlos
👥 Multi-Account-Unterstützung	Mehrere Konten pro Anbieter mit intelligenter Auswahl
🔄 Auto-Token-Erneuerung	OAuth-Token werden automatisch mit Wiederholungen erneuert
🎨 Benutzerdefinierte Combos	6 Strategien: fill-first, round-robin, p2c, random, least-used, cost-optimized
🧩 Benutzerdefinierte Modelle	Jede Modell-ID zu jedem Anbieter hinzufügen
🌐 Wildcard-Router	`provider/*` Muster dynamisch an jeden Anbieter routen
🧠 Reasoning-Budget	Passthrough, auto, custom und adaptive Modi für Reasoning-Modelle
💬 System Prompt Injection	Globaler System Prompt für alle Anfragen
📄 API Responses	Volle Unterstützung der OpenAI Responses API (`/v1/responses`) für Codex

🎵 Multi-Modale APIs

Funktion	Was es macht
🖼️ Bildgenerierung	`/v1/images/generations` — 4 Anbieter, 9+ Modelle
📐 Embeddings	`/v1/embeddings` — 6 Anbieter, 9+ Modelle
🎤 Audio-Transkription	`/v1/audio/transcriptions` — Whisper-kompatibel
🔊 Text-zu-Sprache	`/v1/audio/speech` — Multi-Anbieter Audiosynthese
🛡️ Moderationen	`/v1/moderations` — Sicherheitsüberprüfungen
🔀 Reranking	`/v1/rerank` — Dokumenten-Relevanz-Neuordnung

🛡️ Resilienz & Sicherheit

Funktion	Was es macht
🔌 Circuit Breaker	Auto-Öffnung/-Schließung pro Anbieter mit konfigurierbaren Schwellen
🛡️ Anti-Thundering Herd	Mutex + Semaphor Rate-Limit für API-Key-Anbieter
🧠 Semantischer Cache	Zwei-Ebenen-Cache (Signatur + Semantik) senkt Kosten und Latenz
⚡ Anfrage-Idempotenz	5s Dedup-Fenster für doppelte Anfragen
🔒 TLS-Fingerprint-Spoofing	Bot-Erkennung umgehen via wreq-js
🌐 IP-Filterung	Allowlist/Blocklist für API-Zugriffskontrolle
📊 Editierbare Rate-Limits	Konfigurierbare RPM, minimaler Abstand, max. Konkurrenz

📊 Observability & Analytics

Funktion	Was es macht
📝 Anfrage-Logs	Debug-Modus mit vollständigen Request/Response-Logs
💾 SQLite-Logs	Persistente Proxy-Logs überleben Neustarts
📊 Analytics-Dashboard	Recharts: Statistik-Karten, Nutzungsdiagramm, Anbieter-Tabelle
📈 Fortschritts-Tracking	Opt-in SSE-Fortschrittsereignisse für Streaming
🧪 LLM-Evaluierungen	Testen mit Golden Set und 4 Match-Strategien
🔍 Anfrage-Telemetrie	p50/p95/p99 Latenz-Aggregation + X-Request-Id Tracking
📋 Logs + Kontingente	Dedizierte Seiten für Log-Browsing und Kontingent-Tracking
🏥 Health Dashboard	Uptime, Circuit-Breaker-Status, Lockouts, Cache-Statistiken
💰 Kosten-Tracking	Budget-Management + Preiseinstellung pro Modell

☁️ Deployment & Sync

Funktion	Was es macht
💾 Cloud Sync	Einstellungen zwischen Geräten via Cloudflare Workers synchronisieren
🌐 Überall deployen	Localhost, VPS, Docker, Cloudflare Workers
🔑 API-Key-Verwaltung	API-Keys pro Anbieter generieren, rotieren und einschränken
🧙 Setup-Assistent	4-Schritte geführtes Setup für neue Nutzer
🔧 CLI Tools Dashboard	Ein-Klick-Konfiguration für Claude, Codex, Cline, OpenClaw, Kilo, Antigravity
🔄 DB-Backups	Automatisches Backup und Wiederherstellung aller Einstellungen

📖 Funktionsdetails

🎯 Intelligenter 4-Tier-Fallback

Erstelle Combos mit automatischem Fallback:

Combo: "my-coding-stack"
  1. cc/claude-opus-4-6        (dein Abo)
  2. nvidia/llama-3.3-70b      (kostenlose NVIDIA API)
  3. glm/glm-4.7               (günstiges Backup, $0.6/1M)
  4. if/kimi-k2-thinking       (kostenloser Fallback)

→ Wechselt automatisch bei erschöpftem Kontingent oder Fehlern

📊 Echtzeit-Kontingent-Tracking

Token-Verbrauch pro Anbieter
Reset-Countdown (5 Stunden, täglich, wöchentlich)
Kostenabschätzung für bezahlte Stufen
Monatliche Ausgabenberichte

🔄 Format-Übersetzung

Nahtlose Übersetzung zwischen Formaten:

OpenAI ↔ Claude ↔ Gemini ↔ OpenAI Responses
Dein CLI sendet OpenAI-Format → OmniRoute übersetzt → Anbieter empfängt natives Format
Funktioniert mit jedem Tool, das benutzerdefinierte OpenAI-Endpoints unterstützt

👥 Multi-Account-Unterstützung

Mehrere Konten pro Anbieter hinzufügen
Automatisches Round-Robin oder prioritätsbasiertes Routing
Fallback zum nächsten Konto bei Kontingent-Erschöpfung

🔄 Auto-Token-Erneuerung

OAuth-Token werden automatisch vor Ablauf erneuert
Keine manuelle Neuauthentifizierung nötig
Nahtlose Erfahrung über alle Anbieter

🎨 Benutzerdefinierte Combos

Unbegrenzte Modell-Kombinationen erstellen
6 Strategien: fill-first, round-robin, power-of-two-choices, random, least-used, cost-optimized
Combos zwischen Geräten mit Cloud Sync teilen

🏥 Health Dashboard

Systemstatus (Uptime, Version, Speichernutzung)
Circuit-Breaker-Status pro Anbieter (Closed/Open/Half-Open)
Rate-Limit-Status und aktive Lockouts
Signatur-Cache-Statistiken
Latenz-Telemetrie (p50/p95/p99) + Prompt-Cache
Gesundheitsstatus mit einem Klick zurücksetzen

🔧 Übersetzer-Playground

Debug, Test und Visualisierung von API-Format-Übersetzungen
Anfragen senden und sehen, wie OmniRoute zwischen Anbieter-Formaten übersetzt
Unschätzbar für Integrationsprobleme

💾 Cloud Sync

Anbieter, Combos und Einstellungen zwischen Geräten synchronisieren
Automatische Hintergrundsynchronisierung
Sichere verschlüsselte Speicherung

📖 Einrichtungsanleitung

💳 Abo-Anbieter

Claude Code (Pro/Max)

Dashboard → Anbieter → Claude Code verbinden
→ OAuth Login → Automatische Token-Erneuerung
→ 5h + wöchentliches Kontingent-Tracking

Modelle:
  cc/claude-opus-4-6
  cc/claude-sonnet-4-5-20250929
  cc/claude-haiku-4-5-20251001

Profi-Tipp: Opus für komplexe Aufgaben, Sonnet für Geschwindigkeit. OmniRoute trackt Kontingent pro Modell!

OpenAI Codex (Plus/Pro)

Dashboard → Anbieter → Codex verbinden
→ OAuth Login (Port 1455)
→ 5h + wöchentlicher Reset

Modelle:
  cx/gpt-5.2-codex
  cx/gpt-5.1-codex-max

Gemini CLI (KOSTENLOS 180K/Monat!)

Dashboard → Anbieter → Gemini CLI verbinden
→ Google OAuth
→ 180K Completions/Monat + 1K/Tag

Modelle:
  gc/gemini-3-flash-preview
  gc/gemini-2.5-pro

Bester Wert: Riesiger Gratis-Tarif! Vor bezahlten Stufen nutzen.

GitHub Copilot

Dashboard → Anbieter → GitHub verbinden
→ OAuth via GitHub
→ Monatlicher Reset (1. des Monats)

Modelle:
  gh/gpt-5
  gh/claude-4.5-sonnet
  gh/gemini-3-pro

🔑 API-Key-Anbieter

NVIDIA NIM (KOSTENLOS 1000 Credits!)

Registrieren: build.nvidia.com
Kostenlosen API-Key holen (1000 Inferenz-Credits inklusive)
Dashboard → Anbieter hinzufügen → NVIDIA NIM:
- API Key: nvapi-your-key

Modelle: nvidia/llama-3.3-70b-instruct, nvidia/mistral-7b-instruct und 50+ weitere

Profi-Tipp: OpenAI-kompatible API — funktioniert perfekt mit OmniRoutes Format-Übersetzung!

DeepSeek

Registrieren: platform.deepseek.com
API-Key holen
Dashboard → Anbieter hinzufügen → DeepSeek

Modelle: deepseek/deepseek-chat, deepseek/deepseek-coder

Groq (Gratis-Stufe verfügbar!)

Registrieren: console.groq.com
API-Key holen (Gratis-Stufe inklusive)
Dashboard → Anbieter hinzufügen → Groq

Modelle: groq/llama-3.3-70b, groq/mixtral-8x7b

Profi-Tipp: Ultra-schnelle Inferenz — am besten für Echtzeit-Programmierung!

OpenRouter (100+ Modelle)

Registrieren: openrouter.ai
API-Key holen
Dashboard → Anbieter hinzufügen → OpenRouter

Modelle: Zugang zu 100+ Modellen aller großen Anbieter über einen einzigen API-Key.

💰 Günstige Anbieter (Backup)

GLM-4.7 (Täglicher Reset, $0.6/1M)

Registrieren: Zhipu AI
API-Key aus dem Coding Plan holen
Dashboard → API Key hinzufügen:
- Anbieter: glm
- API Key: your-key

Nutze: glm/glm-4.7

Profi-Tipp: Der Coding Plan bietet 3× Kontingent zu 1/7 der Kosten! Täglicher Reset um 10:00.

MiniMax M2.1 (5h Reset, $0.20/1M)

Registrieren: MiniMax
API-Key holen
Dashboard → API Key hinzufügen

Nutze: minimax/MiniMax-M2.1

Profi-Tipp: Günstigste Option für langen Kontext (1M Token)!

Kimi K2 ($9/Monat fest)

Abonnieren: Moonshot AI
API-Key holen
Dashboard → API Key hinzufügen

Nutze: kimi/kimi-latest

Profi-Tipp: Feste $9/Monat für 10M Token = $0.90/1M effektive Kosten!

🆓 KOSTENLOSE Anbieter (Notfall-Backup)

iFlow (8 KOSTENLOSE Modelle)

Dashboard → iFlow verbinden
→ iFlow OAuth Login
→ Unbegrenzte Nutzung

Modelle:
  if/kimi-k2-thinking
  if/qwen3-coder-plus
  if/glm-4.7
  if/minimax-m2
  if/deepseek-r1

Qwen (3 KOSTENLOSE Modelle)

Dashboard → Qwen verbinden
→ Geräte-Code-Autorisierung
→ Unbegrenzte Nutzung

Modelle:
  qw/qwen3-coder-plus
  qw/qwen3-coder-flash

Kiro (Kostenloses Claude)

Dashboard → Kiro verbinden
→ AWS Builder ID oder Google/GitHub
→ Unbegrenzte Nutzung

Modelle:
  kr/claude-sonnet-4.5
  kr/claude-haiku-4.5

🎨 Combos erstellen

Beispiel 1: Abo maximieren → Günstiges Backup

Dashboard → Combos → Neues erstellen

Name: premium-coding
Modelle:
  1. cc/claude-opus-4-6 (Primäres Abo)
  2. glm/glm-4.7 (Günstiges Backup, $0.6/1M)
  3. minimax/MiniMax-M2.1 (Günstigster Fallback, $0.20/1M)

Im CLI nutzen: premium-coding

Beispiel 2: Nur Kostenlos (Null Kosten)

Name: free-combo
Modelle:
  1. gc/gemini-3-flash-preview (180K gratis/Monat)
  2. if/kimi-k2-thinking (unbegrenzt)
  3. qw/qwen3-coder-plus (unbegrenzt)

Kosten: Für immer $0!

🔧 CLI-Integration

Cursor IDE

Einstellungen → Modelle → Erweitert:
  OpenAI API Base URL: http://localhost:20128/v1
  OpenAI API Key: [aus OmniRoute Dashboard]
  Model: cc/claude-opus-4-6

Claude Code

Nutze die CLI Tools Seite im Dashboard für Ein-Klick-Konfiguration, oder bearbeite ~/.claude/settings.json manuell.

Codex CLI

export OPENAI_BASE_URL="http://localhost:20128"
export OPENAI_API_KEY="your-omniroute-api-key"

codex "your prompt"

OpenClaw

Option 1 — Dashboard (empfohlen):

Dashboard → CLI Tools → OpenClaw → Modell wählen → Anwenden

Option 2 — Manuell: ~/.openclaw/openclaw.json bearbeiten:

{
  "models": {
    "providers": {
      "omniroute": {
        "baseUrl": "http://127.0.0.1:20128/v1",
        "apiKey": "sk_omniroute",
        "api": "openai-completions"
      }
    }
  }
}

Hinweis: OpenClaw funktioniert nur mit lokalem OmniRoute. Verwende 127.0.0.1 statt localhost um IPv6-Auflösungsprobleme zu vermeiden.

Cline / Continue / RooCode

Einstellungen → API-Konfiguration:
  Anbieter: OpenAI Compatible
  Base URL: http://localhost:20128/v1
  API Key: [aus OmniRoute Dashboard]
  Model: if/kimi-k2-thinking

📊 Verfügbare Modelle

Alle verfügbaren Modelle anzeigen

Claude Code (cc/) - Pro/Max:

cc/claude-opus-4-6
cc/claude-sonnet-4-5-20250929
cc/claude-haiku-4-5-20251001

Codex (cx/) - Plus/Pro:

cx/gpt-5.2-codex
cx/gpt-5.1-codex-max

Gemini CLI (gc/) - KOSTENLOS:

gc/gemini-3-flash-preview
gc/gemini-2.5-pro

GitHub Copilot (gh/):

gh/gpt-5
gh/claude-4.5-sonnet

NVIDIA NIM (nvidia/) - KOSTENLOSE Credits:

nvidia/llama-3.3-70b-instruct
nvidia/mistral-7b-instruct
50+ weitere Modelle auf build.nvidia.com

GLM (glm/) - $0.6/1M:

glm/glm-4.7

MiniMax (minimax/) - $0.2/1M:

minimax/MiniMax-M2.1

iFlow (if/) - KOSTENLOS:

if/kimi-k2-thinking
if/qwen3-coder-plus
if/deepseek-r1
if/glm-4.7
if/minimax-m2

Qwen (qw/) - KOSTENLOS:

qw/qwen3-coder-plus
qw/qwen3-coder-flash

Kiro (kr/) - KOSTENLOS:

kr/claude-sonnet-4.5
kr/claude-haiku-4.5

OpenRouter (or/) - 100+ Modelle:

or/anthropic/claude-4-sonnet
or/google/gemini-2.5-pro
Jedes Modell von openrouter.ai/models

🧪 Evaluierungen (Evals)

OmniRoute enthält ein integriertes Evaluierungs-Framework zum Testen der LLM-Antwortqualität gegen ein Golden Set. Zugang über Analytics → Evals im Dashboard.

Integriertes Golden Set

Das vorgeladene „OmniRoute Golden Set" enthält 10 Testfälle:

Begrüßungen, Mathematik, Geographie, Code-Generierung
JSON-Formatkonformität, Übersetzung, Markdown
Sicherheitsablehnung (schädlicher Inhalt), Zählung, Boolesche Logik

Evaluierungsstrategien

Strategie	Beschreibung	Beispiel
`exact`	Ausgabe muss exakt übereinstimmen	`"4"`
`contains`	Ausgabe muss Teilzeichenfolge enthalten (case-insensitive)	`"Paris"`
`regex`	Ausgabe muss Regex-Muster entsprechen	`"1.2.3"`
`custom`	Benutzerdefinierte JS-Funktion gibt true/false zurück	`(output) => output.length > 10`

🐛 Fehlerbehebung

Klicke zum Erweitern der Fehlerbehebungsanleitung

„Language model did not provide messages"

Anbieter-Kontingent erschöpft → Kontingent-Tracker im Dashboard prüfen
Lösung: Combo mit Fallback nutzen oder zu günstigerer Stufe wechseln

Rate Limiting

Abo-Kontingent erschöpft → Fallback zu GLM/MiniMax
Combo hinzufügen: cc/claude-opus-4-6 → glm/glm-4.7 → if/kimi-k2-thinking

OAuth-Token abgelaufen

Wird automatisch von OmniRoute erneuert
Falls Problem bestehen bleibt: Dashboard → Anbieter → Neu verbinden

Hohe Kosten

Nutzungsstatistiken unter Dashboard → Kosten prüfen
Primärmodell auf GLM/MiniMax umstellen
Gratis-Stufe (Gemini CLI, iFlow) für unkritische Aufgaben nutzen

Dashboard öffnet sich auf falschem Port

PORT=20128 und NEXT_PUBLIC_BASE_URL=http://localhost:20128 setzen

Cloud-Sync-Fehler

Prüfe dass BASE_URL auf deine laufende Instanz zeigt
Prüfe dass CLOUD_URL auf den erwarteten Cloud-Endpoint zeigt
NEXT_PUBLIC_* Werte mit Serverwerten synchron halten

Erster Login funktioniert nicht

INITIAL_PASSWORD in .env prüfen
Falls nicht gesetzt, Standard-Passwort ist 123456

Keine Anfrage-Logs

ENABLE_REQUEST_LOGS=true in .env setzen

Verbindungstest zeigt „Invalid" für OpenAI-kompatible Anbieter

Viele Anbieter stellen den /models Endpoint nicht bereit
OmniRoute v1.0.6+ enthält Fallback-Validierung via Chat Completions
Stelle sicher, dass die Base URL den /v1 Suffix enthält

🛠️ Technologie-Stack

Runtime: Node.js 20+
Sprache: TypeScript 5.9 — 100% TypeScript in src/ und open-sse/ (v1.0.6)
Framework: Next.js 16 + React 19 + Tailwind CSS 4
Datenbank: LowDB (JSON) + SQLite (Domain-Status + Proxy-Logs)
Streaming: Server-Sent Events (SSE)
Auth: OAuth 2.0 (PKCE) + JWT + API Keys
Testing: Node.js Test Runner (368+ Unit-Tests)
CI/CD: GitHub Actions (automatische npm + Docker Hub Veröffentlichung bei Release)
Website: omniroute.online
Paket: npmjs.com/package/omniroute
Docker: hub.docker.com/r/diegosouzapw/omniroute
Resilienz: Circuit Breaker, exponentieller Backoff, Anti-Thundering Herd, TLS-Spoofing

📖 Dokumentation

Dokument	Beschreibung
Benutzerhandbuch	Anbieter, Combos, CLI-Integration, Deploy
API-Referenz	Alle Endpoints mit Beispielen
Fehlerbehebung	Häufige Probleme und Lösungen
Architektur	Systemarchitektur und Interna
Mitwirken	Entwicklungs-Setup und Richtlinien
OpenAPI-Spezifikation	OpenAPI 3.0 Spezifikation
Sicherheitsrichtlinie	Schwachstellen melden und Sicherheitspraktiken

📧 Support

💬 Treten Sie unserer Community bei! WhatsApp-Gruppe — Hilfe bekommen, Tipps teilen und auf dem Laufenden bleiben.

Website: omniroute.online
GitHub: github.com/diegosouzapw/OmniRoute
Issues: github.com/diegosouzapw/OmniRoute/issues
WhatsApp: Community-Gruppe
WhatsApp: Community-Gruppe
Originalprojekt: 9router von decolua

👥 Mitwirkende

Wie du mitwirken kannst

Repository forken
Feature-Branch erstellen (git checkout -b feature/amazing-feature)
Änderungen committen (git commit -m 'Add amazing feature')
Branch pushen (git push origin feature/amazing-feature)
Pull Request öffnen

Siehe CONTRIBUTING.md für detaillierte Richtlinien.

Neue Version veröffentlichen

# Release erstellen — npm-Veröffentlichung erfolgt automatisch
gh release create v1.0.6 --title "v1.0.6" --generate-notes

📊 Star-Verlauf

🙏 Danksagungen

Besonderer Dank an 9router von decolua — das Originalprojekt, das diesen Fork inspiriert hat. OmniRoute baut auf diesem unglaublichen Fundament auf mit zusätzlichen Funktionen, Multi-Modalen APIs und einem vollständigen TypeScript-Rewrite.

Besonderer Dank an CLIProxyAPI — die ursprüngliche Go-Implementierung, die diese JavaScript-Portierung inspiriert hat.

📄 Lizenz

MIT-Lizenz — siehe LICENSE für Details.

_{Mit ❤️ gemacht für Entwickler, die 24/7 programmieren}
_{omniroute.online}

FilesExpand file tree

README.de.md

Latest commit

History