Skip to content

Latest commit

 

History

History
1000 lines (723 loc) · 35.7 KB

File metadata and controls

1000 lines (723 loc) · 35.7 KB
OmniRoute Dashboard

🚀 OmniRoute — Das kostenlose AI-Gateway

Höre nie auf zu programmieren. Intelligentes Routing zu KOSTENLOSEN und günstigen KI-Modellen mit automatischem Fallback.

Dein universeller API-Proxy — ein Endpoint, 36+ Anbieter, null Ausfallzeit.

Chat Completions • Embeddings • Bildgenerierung • Audio • Reranking • 100% TypeScript


🤖 Kostenloser KI-Anbieter für deine Lieblings-Coding-Agenten

Verbinde jedes KI-gesteuerte IDE- oder CLI-Tool über OmniRoute — kostenloses API-Gateway für unbegrenztes Programmieren.

OpenClaw
OpenClaw

⭐ 205K
NanoBot
NanoBot

⭐ 20.9K
PicoClaw
PicoClaw

⭐ 14.6K
ZeroClaw
ZeroClaw

⭐ 9.9K
IronClaw
IronClaw

⭐ 2.1K
OpenCode
OpenCode

⭐ 106K
Codex CLI
Codex CLI

⭐ 60.8K
Claude Code
Claude Code

⭐ 67.3K
Gemini CLI
Gemini CLI

⭐ 94.7K
Kilo Code
Kilo Code

⭐ 15.5K

📡 Alle Agenten verbinden sich über http://localhost:20128/v1 oder http://cloud.omniroute.online/v1 — eine Konfiguration, unbegrenzte Modelle und Kontingent


npm version Docker Hub License Website WhatsApp

🌐 Website🚀 Schnellstart💡 Funktionen📖 Doku💰 Preise

🌐 Verfügbar in: 🇺🇸 English | 🇧🇷 Português (Brasil) | 🇪🇸 Español | 🇫🇷 Français | 🇮🇹 Italiano | 🇷🇺 Русский | 🇨🇳 中文 (简体) | 🇩🇪 Deutsch | 🇮🇳 हिन्दी | 🇹🇭 ไทย | 🇺🇦 Українська | 🇸🇦 العربية | 🇯🇵 日本語 | 🇻🇳 Tiếng Việt | 🇧🇬 Български | 🇩🇰 Dansk | 🇫🇮 Suomi | 🇮🇱 עברית | 🇭🇺 Magyar | 🇮🇩 Bahasa Indonesia | 🇰🇷 한국어 | 🇲🇾 Bahasa Melayu | 🇳🇱 Nederlands | 🇳🇴 Norsk | 🇵🇹 Português (Portugal) | 🇷🇴 Română | 🇵🇱 Polski | 🇸🇰 Slovenčina | 🇸🇪 Svenska | 🇵🇭 Filipino


🤔 Warum OmniRoute?

Hör auf, Geld zu verschwenden und an Limits zu stoßen:

  • Abo-Kontingent verfällt jeden Monat ungenutzt
  • Rate-Limits stoppen dich mitten beim Programmieren
  • Teure APIs ($20-50/Monat pro Anbieter)
  • Manuelles Wechseln zwischen Anbietern

OmniRoute löst das:

  • Abos maximieren — Kontingente tracken, alles vor dem Reset nutzen
  • Automatischer Fallback — Abo → API Key → Günstig → Kostenlos, null Ausfallzeit
  • Multi-Account — Round-Robin zwischen Konten pro Anbieter
  • Universal — Funktioniert mit Claude Code, Codex, Gemini CLI, Cursor, Cline, OpenClaw, jedem CLI-Tool

🔄 So funktioniert's

┌─────────────┐
│  Dein CLI   │  (Claude Code, Codex, Gemini CLI, OpenClaw, Cursor, Cline...)
│   Tool      │
└──────┬──────┘
       │ http://localhost:20128/v1
       ↓
┌─────────────────────────────────────────┐
│         OmniRoute (Smart Router)         │
│  • Format-Übersetzung (OpenAI ↔ Claude) │
│  • Kontingent-Tracking + Embeddings + Bilder │
│  • Automatische Token-Erneuerung        │
└──────┬──────────────────────────────────┘
       │
       ├─→ [Tier 1: ABO] Claude Code, Codex, Gemini CLI
       │   ↓ Kontingent erschöpft
       ├─→ [Tier 2: API KEY] DeepSeek, Groq, xAI, Mistral, NVIDIA NIM usw.
       │   ↓ Budget-Limit
       ├─→ [Tier 3: GÜNSTIG] GLM ($0.6/1M), MiniMax ($0.2/1M)
       │   ↓ Budget-Limit
       └─→ [Tier 4: KOSTENLOS] iFlow, Qwen, Kiro (unbegrenzt)

Ergebnis: Nie aufhören zu programmieren, minimale Kosten

⚡ Schnellstart

1. Global installieren:

npm install -g omniroute
omniroute

🎉 Das Dashboard öffnet sich unter http://localhost:20128

Befehl Beschreibung
omniroute Server starten (Standardport 20128)
omniroute --port 3000 Benutzerdefinierten Port verwenden
omniroute --no-open Browser nicht automatisch öffnen
omniroute --help Hilfe anzeigen

2. KOSTENLOSEN Anbieter verbinden:

Dashboard → Anbieter → Claude Code oder Antigravity verbinden → OAuth Login → Fertig!

3. In deinem CLI-Tool verwenden:

Claude Code/Codex/Gemini CLI/OpenClaw/Cursor/Cline Einstellungen:
  Endpoint: http://localhost:20128/v1
  API Key: [vom Dashboard kopieren]
  Model: if/kimi-k2-thinking

Das war's! Beginne mit KOSTENLOSEN KI-Modellen zu programmieren.

Alternative — aus Quellcode ausführen:

cp .env.example .env
npm install
PORT=20128 NEXT_PUBLIC_BASE_URL=http://localhost:20128 npm run dev

🐳 Docker

OmniRoute ist als öffentliches Docker-Image auf Docker Hub verfügbar.

Schnellstart:

docker run -d \
  --name omniroute \
  --restart unless-stopped \
  -p 20128:20128 \
  -v omniroute-data:/app/data \
  diegosouzapw/omniroute:latest

Mit Umgebungsdatei:

# .env kopieren und bearbeiten
cp .env.example .env

docker run -d \
  --name omniroute \
  --restart unless-stopped \
  --env-file .env \
  -p 20128:20128 \
  -v omniroute-data:/app/data \
  diegosouzapw/omniroute:latest

Mit Docker Compose:

# Basisprofil (ohne CLI-Tools)
docker compose --profile base up -d

# CLI-Profil (Claude Code, Codex, OpenClaw integriert)
docker compose --profile cli up -d
Image Tag Größe Beschreibung
diegosouzapw/omniroute latest ~250MB Letztes stabiles Release
diegosouzapw/omniroute 1.0.6 ~250MB Aktuelle Version

💰 Preisübersicht

Tier Anbieter Kosten Kontingent-Reset Am besten für
💳 ABO Claude Code (Pro) $20/Monat 5h + wöchentlich Bereits abonniert
Codex (Plus/Pro) $20-200/Monat 5h + wöchentlich OpenAI-Nutzer
Gemini CLI KOSTENLOS 180K/Monat + 1K/Tag Alle!
GitHub Copilot $10-19/Monat Monatlich GitHub-Nutzer
🔑 API KEY NVIDIA NIM KOSTENLOS (1000 Credits) Einmalig Kostenloses Testen
DeepSeek Nach Verbrauch Keiner Bestes Preis-Leistung
Groq Gratis-Stufe + bezahlt Begrenzt Ultra-schnelle Inferenz
xAI (Grok) Nach Verbrauch Keiner Grok-Modelle
Mistral Gratis-Stufe + bezahlt Begrenzt Europäische KI
OpenRouter Nach Verbrauch Keiner 100+ Modelle
💰 GÜNSTIG GLM-4.7 $0.6/1M Täglich 10h Budget-Backup
MiniMax M2.1 $0.2/1M 5h rotierend Günstigste Option
Kimi K2 $9/Monat fest 10M Token/Monat Vorhersagbare Kosten
🆓 KOSTENLOS iFlow $0 Unbegrenzt 8 kostenlose Modelle
Qwen $0 Unbegrenzt 3 kostenlose Modelle
Kiro $0 Unbegrenzt Kostenloses Claude

💡 Profi-Tipp: Starte mit Gemini CLI (180K gratis/Monat) + iFlow (unbegrenzt gratis) = $0 Kosten!


🎯 Anwendungsfälle

Fall 1: „Ich habe ein Claude Pro Abo"

Problem: Kontingent verfällt ungenutzt, Rate-Limits während intensivem Programmieren

Combo: "maximize-claude"
  1. cc/claude-opus-4-6        (Abo voll ausnutzen)
  2. glm/glm-4.7               (günstiges Backup bei erschöpftem Kontingent)
  3. if/kimi-k2-thinking       (kostenloser Notfall-Fallback)

Monatliche Kosten: $20 (Abo) + ~$5 (Backup) = $25 gesamt
vs. $20 + an Limits stoßen = Frustration

Fall 2: „Ich will null Kosten"

Problem: Kann sich Abos nicht leisten, braucht zuverlässige KI zum Programmieren

Combo: "free-forever"
  1. gc/gemini-3-flash         (180K gratis/Monat)
  2. if/kimi-k2-thinking       (unbegrenzt gratis)
  3. qw/qwen3-coder-plus       (unbegrenzt gratis)

Monatliche Kosten: $0
Qualität: Produktionsreife Modelle

Fall 3: „Ich muss 24/7 programmieren, ohne Unterbrechungen"

Problem: Enge Deadlines, kann sich keine Ausfallzeit leisten

Combo: "always-on"
  1. cc/claude-opus-4-6        (beste Qualität)
  2. cx/gpt-5.2-codex          (zweites Abo)
  3. glm/glm-4.7               (günstig, täglicher Reset)
  4. minimax/MiniMax-M2.1      (günstigste, 5h Reset)
  5. if/kimi-k2-thinking       (unbegrenzt kostenlos)

Ergebnis: 5 Fallback-Ebenen = null Ausfallzeit

Fall 4: „Ich will KOSTENLOSE KI in OpenClaw"

Problem: Braucht KI-Assistenz in Messaging-Apps, komplett kostenlos

Combo: "openclaw-free"
  1. if/glm-4.7                (unbegrenzt kostenlos)
  2. if/minimax-m2.1           (unbegrenzt kostenlos)
  3. if/kimi-k2-thinking       (unbegrenzt kostenlos)

Monatliche Kosten: $0
Zugang über: WhatsApp, Telegram, Slack, Discord, iMessage, Signal...

💡 Hauptfunktionen

🧠 Routing & Intelligenz

Funktion Was es macht
🎯 Intelligenter 4-Tier-Fallback Auto-Routing: Abo → API Key → Günstig → Kostenlos
📊 Echtzeit-Kontingent-Tracking Live Token-Zählung + Reset-Countdown pro Anbieter
🔄 Format-Übersetzung OpenAI ↔ Claude ↔ Gemini ↔ Cursor ↔ Kiro nahtlos
👥 Multi-Account-Unterstützung Mehrere Konten pro Anbieter mit intelligenter Auswahl
🔄 Auto-Token-Erneuerung OAuth-Token werden automatisch mit Wiederholungen erneuert
🎨 Benutzerdefinierte Combos 6 Strategien: fill-first, round-robin, p2c, random, least-used, cost-optimized
🧩 Benutzerdefinierte Modelle Jede Modell-ID zu jedem Anbieter hinzufügen
🌐 Wildcard-Router provider/* Muster dynamisch an jeden Anbieter routen
🧠 Reasoning-Budget Passthrough, auto, custom und adaptive Modi für Reasoning-Modelle
💬 System Prompt Injection Globaler System Prompt für alle Anfragen
📄 API Responses Volle Unterstützung der OpenAI Responses API (/v1/responses) für Codex

🎵 Multi-Modale APIs

Funktion Was es macht
🖼️ Bildgenerierung /v1/images/generations — 4 Anbieter, 9+ Modelle
📐 Embeddings /v1/embeddings — 6 Anbieter, 9+ Modelle
🎤 Audio-Transkription /v1/audio/transcriptions — Whisper-kompatibel
🔊 Text-zu-Sprache /v1/audio/speech — Multi-Anbieter Audiosynthese
🛡️ Moderationen /v1/moderations — Sicherheitsüberprüfungen
🔀 Reranking /v1/rerank — Dokumenten-Relevanz-Neuordnung

🛡️ Resilienz & Sicherheit

Funktion Was es macht
🔌 Circuit Breaker Auto-Öffnung/-Schließung pro Anbieter mit konfigurierbaren Schwellen
🛡️ Anti-Thundering Herd Mutex + Semaphor Rate-Limit für API-Key-Anbieter
🧠 Semantischer Cache Zwei-Ebenen-Cache (Signatur + Semantik) senkt Kosten und Latenz
Anfrage-Idempotenz 5s Dedup-Fenster für doppelte Anfragen
🔒 TLS-Fingerprint-Spoofing Bot-Erkennung umgehen via wreq-js
🌐 IP-Filterung Allowlist/Blocklist für API-Zugriffskontrolle
📊 Editierbare Rate-Limits Konfigurierbare RPM, minimaler Abstand, max. Konkurrenz

📊 Observability & Analytics

Funktion Was es macht
📝 Anfrage-Logs Debug-Modus mit vollständigen Request/Response-Logs
💾 SQLite-Logs Persistente Proxy-Logs überleben Neustarts
📊 Analytics-Dashboard Recharts: Statistik-Karten, Nutzungsdiagramm, Anbieter-Tabelle
📈 Fortschritts-Tracking Opt-in SSE-Fortschrittsereignisse für Streaming
🧪 LLM-Evaluierungen Testen mit Golden Set und 4 Match-Strategien
🔍 Anfrage-Telemetrie p50/p95/p99 Latenz-Aggregation + X-Request-Id Tracking
📋 Logs + Kontingente Dedizierte Seiten für Log-Browsing und Kontingent-Tracking
🏥 Health Dashboard Uptime, Circuit-Breaker-Status, Lockouts, Cache-Statistiken
💰 Kosten-Tracking Budget-Management + Preiseinstellung pro Modell

☁️ Deployment & Sync

Funktion Was es macht
💾 Cloud Sync Einstellungen zwischen Geräten via Cloudflare Workers synchronisieren
🌐 Überall deployen Localhost, VPS, Docker, Cloudflare Workers
🔑 API-Key-Verwaltung API-Keys pro Anbieter generieren, rotieren und einschränken
🧙 Setup-Assistent 4-Schritte geführtes Setup für neue Nutzer
🔧 CLI Tools Dashboard Ein-Klick-Konfiguration für Claude, Codex, Cline, OpenClaw, Kilo, Antigravity
🔄 DB-Backups Automatisches Backup und Wiederherstellung aller Einstellungen
📖 Funktionsdetails

🎯 Intelligenter 4-Tier-Fallback

Erstelle Combos mit automatischem Fallback:

Combo: "my-coding-stack"
  1. cc/claude-opus-4-6        (dein Abo)
  2. nvidia/llama-3.3-70b      (kostenlose NVIDIA API)
  3. glm/glm-4.7               (günstiges Backup, $0.6/1M)
  4. if/kimi-k2-thinking       (kostenloser Fallback)

→ Wechselt automatisch bei erschöpftem Kontingent oder Fehlern

📊 Echtzeit-Kontingent-Tracking

  • Token-Verbrauch pro Anbieter
  • Reset-Countdown (5 Stunden, täglich, wöchentlich)
  • Kostenabschätzung für bezahlte Stufen
  • Monatliche Ausgabenberichte

🔄 Format-Übersetzung

Nahtlose Übersetzung zwischen Formaten:

  • OpenAIClaudeGeminiOpenAI Responses
  • Dein CLI sendet OpenAI-Format → OmniRoute übersetzt → Anbieter empfängt natives Format
  • Funktioniert mit jedem Tool, das benutzerdefinierte OpenAI-Endpoints unterstützt

👥 Multi-Account-Unterstützung

  • Mehrere Konten pro Anbieter hinzufügen
  • Automatisches Round-Robin oder prioritätsbasiertes Routing
  • Fallback zum nächsten Konto bei Kontingent-Erschöpfung

🔄 Auto-Token-Erneuerung

  • OAuth-Token werden automatisch vor Ablauf erneuert
  • Keine manuelle Neuauthentifizierung nötig
  • Nahtlose Erfahrung über alle Anbieter

🎨 Benutzerdefinierte Combos

  • Unbegrenzte Modell-Kombinationen erstellen
  • 6 Strategien: fill-first, round-robin, power-of-two-choices, random, least-used, cost-optimized
  • Combos zwischen Geräten mit Cloud Sync teilen

🏥 Health Dashboard

  • Systemstatus (Uptime, Version, Speichernutzung)
  • Circuit-Breaker-Status pro Anbieter (Closed/Open/Half-Open)
  • Rate-Limit-Status und aktive Lockouts
  • Signatur-Cache-Statistiken
  • Latenz-Telemetrie (p50/p95/p99) + Prompt-Cache
  • Gesundheitsstatus mit einem Klick zurücksetzen

🔧 Übersetzer-Playground

  • Debug, Test und Visualisierung von API-Format-Übersetzungen
  • Anfragen senden und sehen, wie OmniRoute zwischen Anbieter-Formaten übersetzt
  • Unschätzbar für Integrationsprobleme

💾 Cloud Sync

  • Anbieter, Combos und Einstellungen zwischen Geräten synchronisieren
  • Automatische Hintergrundsynchronisierung
  • Sichere verschlüsselte Speicherung

📖 Einrichtungsanleitung

💳 Abo-Anbieter

Claude Code (Pro/Max)

Dashboard → Anbieter → Claude Code verbinden
→ OAuth Login → Automatische Token-Erneuerung
→ 5h + wöchentliches Kontingent-Tracking

Modelle:
  cc/claude-opus-4-6
  cc/claude-sonnet-4-5-20250929
  cc/claude-haiku-4-5-20251001

Profi-Tipp: Opus für komplexe Aufgaben, Sonnet für Geschwindigkeit. OmniRoute trackt Kontingent pro Modell!

OpenAI Codex (Plus/Pro)

Dashboard → Anbieter → Codex verbinden
→ OAuth Login (Port 1455)
→ 5h + wöchentlicher Reset

Modelle:
  cx/gpt-5.2-codex
  cx/gpt-5.1-codex-max

Gemini CLI (KOSTENLOS 180K/Monat!)

Dashboard → Anbieter → Gemini CLI verbinden
→ Google OAuth
→ 180K Completions/Monat + 1K/Tag

Modelle:
  gc/gemini-3-flash-preview
  gc/gemini-2.5-pro

Bester Wert: Riesiger Gratis-Tarif! Vor bezahlten Stufen nutzen.

GitHub Copilot

Dashboard → Anbieter → GitHub verbinden
→ OAuth via GitHub
→ Monatlicher Reset (1. des Monats)

Modelle:
  gh/gpt-5
  gh/claude-4.5-sonnet
  gh/gemini-3-pro
🔑 API-Key-Anbieter

NVIDIA NIM (KOSTENLOS 1000 Credits!)

  1. Registrieren: build.nvidia.com
  2. Kostenlosen API-Key holen (1000 Inferenz-Credits inklusive)
  3. Dashboard → Anbieter hinzufügen → NVIDIA NIM:
    • API Key: nvapi-your-key

Modelle: nvidia/llama-3.3-70b-instruct, nvidia/mistral-7b-instruct und 50+ weitere

Profi-Tipp: OpenAI-kompatible API — funktioniert perfekt mit OmniRoutes Format-Übersetzung!

DeepSeek

  1. Registrieren: platform.deepseek.com
  2. API-Key holen
  3. Dashboard → Anbieter hinzufügen → DeepSeek

Modelle: deepseek/deepseek-chat, deepseek/deepseek-coder

Groq (Gratis-Stufe verfügbar!)

  1. Registrieren: console.groq.com
  2. API-Key holen (Gratis-Stufe inklusive)
  3. Dashboard → Anbieter hinzufügen → Groq

Modelle: groq/llama-3.3-70b, groq/mixtral-8x7b

Profi-Tipp: Ultra-schnelle Inferenz — am besten für Echtzeit-Programmierung!

OpenRouter (100+ Modelle)

  1. Registrieren: openrouter.ai
  2. API-Key holen
  3. Dashboard → Anbieter hinzufügen → OpenRouter

Modelle: Zugang zu 100+ Modellen aller großen Anbieter über einen einzigen API-Key.

💰 Günstige Anbieter (Backup)

GLM-4.7 (Täglicher Reset, $0.6/1M)

  1. Registrieren: Zhipu AI
  2. API-Key aus dem Coding Plan holen
  3. Dashboard → API Key hinzufügen:
    • Anbieter: glm
    • API Key: your-key

Nutze: glm/glm-4.7

Profi-Tipp: Der Coding Plan bietet 3× Kontingent zu 1/7 der Kosten! Täglicher Reset um 10:00.

MiniMax M2.1 (5h Reset, $0.20/1M)

  1. Registrieren: MiniMax
  2. API-Key holen
  3. Dashboard → API Key hinzufügen

Nutze: minimax/MiniMax-M2.1

Profi-Tipp: Günstigste Option für langen Kontext (1M Token)!

Kimi K2 ($9/Monat fest)

  1. Abonnieren: Moonshot AI
  2. API-Key holen
  3. Dashboard → API Key hinzufügen

Nutze: kimi/kimi-latest

Profi-Tipp: Feste $9/Monat für 10M Token = $0.90/1M effektive Kosten!

🆓 KOSTENLOSE Anbieter (Notfall-Backup)

iFlow (8 KOSTENLOSE Modelle)

Dashboard → iFlow verbinden
→ iFlow OAuth Login
→ Unbegrenzte Nutzung

Modelle:
  if/kimi-k2-thinking
  if/qwen3-coder-plus
  if/glm-4.7
  if/minimax-m2
  if/deepseek-r1

Qwen (3 KOSTENLOSE Modelle)

Dashboard → Qwen verbinden
→ Geräte-Code-Autorisierung
→ Unbegrenzte Nutzung

Modelle:
  qw/qwen3-coder-plus
  qw/qwen3-coder-flash

Kiro (Kostenloses Claude)

Dashboard → Kiro verbinden
→ AWS Builder ID oder Google/GitHub
→ Unbegrenzte Nutzung

Modelle:
  kr/claude-sonnet-4.5
  kr/claude-haiku-4.5
🎨 Combos erstellen

Beispiel 1: Abo maximieren → Günstiges Backup

Dashboard → Combos → Neues erstellen

Name: premium-coding
Modelle:
  1. cc/claude-opus-4-6 (Primäres Abo)
  2. glm/glm-4.7 (Günstiges Backup, $0.6/1M)
  3. minimax/MiniMax-M2.1 (Günstigster Fallback, $0.20/1M)

Im CLI nutzen: premium-coding

Beispiel 2: Nur Kostenlos (Null Kosten)

Name: free-combo
Modelle:
  1. gc/gemini-3-flash-preview (180K gratis/Monat)
  2. if/kimi-k2-thinking (unbegrenzt)
  3. qw/qwen3-coder-plus (unbegrenzt)

Kosten: Für immer $0!
🔧 CLI-Integration

Cursor IDE

Einstellungen → Modelle → Erweitert:
  OpenAI API Base URL: http://localhost:20128/v1
  OpenAI API Key: [aus OmniRoute Dashboard]
  Model: cc/claude-opus-4-6

Claude Code

Nutze die CLI Tools Seite im Dashboard für Ein-Klick-Konfiguration, oder bearbeite ~/.claude/settings.json manuell.

Codex CLI

export OPENAI_BASE_URL="http://localhost:20128"
export OPENAI_API_KEY="your-omniroute-api-key"

codex "your prompt"

OpenClaw

Option 1 — Dashboard (empfohlen):

Dashboard → CLI Tools → OpenClaw → Modell wählen → Anwenden

Option 2 — Manuell: ~/.openclaw/openclaw.json bearbeiten:

{
  "models": {
    "providers": {
      "omniroute": {
        "baseUrl": "http://127.0.0.1:20128/v1",
        "apiKey": "sk_omniroute",
        "api": "openai-completions"
      }
    }
  }
}

Hinweis: OpenClaw funktioniert nur mit lokalem OmniRoute. Verwende 127.0.0.1 statt localhost um IPv6-Auflösungsprobleme zu vermeiden.

Cline / Continue / RooCode

Einstellungen → API-Konfiguration:
  Anbieter: OpenAI Compatible
  Base URL: http://localhost:20128/v1
  API Key: [aus OmniRoute Dashboard]
  Model: if/kimi-k2-thinking

📊 Verfügbare Modelle

Alle verfügbaren Modelle anzeigen

Claude Code (cc/) - Pro/Max:

  • cc/claude-opus-4-6
  • cc/claude-sonnet-4-5-20250929
  • cc/claude-haiku-4-5-20251001

Codex (cx/) - Plus/Pro:

  • cx/gpt-5.2-codex
  • cx/gpt-5.1-codex-max

Gemini CLI (gc/) - KOSTENLOS:

  • gc/gemini-3-flash-preview
  • gc/gemini-2.5-pro

GitHub Copilot (gh/):

  • gh/gpt-5
  • gh/claude-4.5-sonnet

NVIDIA NIM (nvidia/) - KOSTENLOSE Credits:

  • nvidia/llama-3.3-70b-instruct
  • nvidia/mistral-7b-instruct
  • 50+ weitere Modelle auf build.nvidia.com

GLM (glm/) - $0.6/1M:

  • glm/glm-4.7

MiniMax (minimax/) - $0.2/1M:

  • minimax/MiniMax-M2.1

iFlow (if/) - KOSTENLOS:

  • if/kimi-k2-thinking
  • if/qwen3-coder-plus
  • if/deepseek-r1
  • if/glm-4.7
  • if/minimax-m2

Qwen (qw/) - KOSTENLOS:

  • qw/qwen3-coder-plus
  • qw/qwen3-coder-flash

Kiro (kr/) - KOSTENLOS:

  • kr/claude-sonnet-4.5
  • kr/claude-haiku-4.5

OpenRouter (or/) - 100+ Modelle:


🧪 Evaluierungen (Evals)

OmniRoute enthält ein integriertes Evaluierungs-Framework zum Testen der LLM-Antwortqualität gegen ein Golden Set. Zugang über Analytics → Evals im Dashboard.

Integriertes Golden Set

Das vorgeladene „OmniRoute Golden Set" enthält 10 Testfälle:

  • Begrüßungen, Mathematik, Geographie, Code-Generierung
  • JSON-Formatkonformität, Übersetzung, Markdown
  • Sicherheitsablehnung (schädlicher Inhalt), Zählung, Boolesche Logik

Evaluierungsstrategien

Strategie Beschreibung Beispiel
exact Ausgabe muss exakt übereinstimmen "4"
contains Ausgabe muss Teilzeichenfolge enthalten (case-insensitive) "Paris"
regex Ausgabe muss Regex-Muster entsprechen "1.*2.*3"
custom Benutzerdefinierte JS-Funktion gibt true/false zurück (output) => output.length > 10

🐛 Fehlerbehebung

Klicke zum Erweitern der Fehlerbehebungsanleitung

„Language model did not provide messages"

  • Anbieter-Kontingent erschöpft → Kontingent-Tracker im Dashboard prüfen
  • Lösung: Combo mit Fallback nutzen oder zu günstigerer Stufe wechseln

Rate Limiting

  • Abo-Kontingent erschöpft → Fallback zu GLM/MiniMax
  • Combo hinzufügen: cc/claude-opus-4-6 → glm/glm-4.7 → if/kimi-k2-thinking

OAuth-Token abgelaufen

  • Wird automatisch von OmniRoute erneuert
  • Falls Problem bestehen bleibt: Dashboard → Anbieter → Neu verbinden

Hohe Kosten

  • Nutzungsstatistiken unter Dashboard → Kosten prüfen
  • Primärmodell auf GLM/MiniMax umstellen
  • Gratis-Stufe (Gemini CLI, iFlow) für unkritische Aufgaben nutzen

Dashboard öffnet sich auf falschem Port

  • PORT=20128 und NEXT_PUBLIC_BASE_URL=http://localhost:20128 setzen

Cloud-Sync-Fehler

  • Prüfe dass BASE_URL auf deine laufende Instanz zeigt
  • Prüfe dass CLOUD_URL auf den erwarteten Cloud-Endpoint zeigt
  • NEXT_PUBLIC_* Werte mit Serverwerten synchron halten

Erster Login funktioniert nicht

  • INITIAL_PASSWORD in .env prüfen
  • Falls nicht gesetzt, Standard-Passwort ist 123456

Keine Anfrage-Logs

  • ENABLE_REQUEST_LOGS=true in .env setzen

Verbindungstest zeigt „Invalid" für OpenAI-kompatible Anbieter

  • Viele Anbieter stellen den /models Endpoint nicht bereit
  • OmniRoute v1.0.6+ enthält Fallback-Validierung via Chat Completions
  • Stelle sicher, dass die Base URL den /v1 Suffix enthält

🛠️ Technologie-Stack

  • Runtime: Node.js 20+
  • Sprache: TypeScript 5.9 — 100% TypeScript in src/ und open-sse/ (v1.0.6)
  • Framework: Next.js 16 + React 19 + Tailwind CSS 4
  • Datenbank: LowDB (JSON) + SQLite (Domain-Status + Proxy-Logs)
  • Streaming: Server-Sent Events (SSE)
  • Auth: OAuth 2.0 (PKCE) + JWT + API Keys
  • Testing: Node.js Test Runner (368+ Unit-Tests)
  • CI/CD: GitHub Actions (automatische npm + Docker Hub Veröffentlichung bei Release)
  • Website: omniroute.online
  • Paket: npmjs.com/package/omniroute
  • Docker: hub.docker.com/r/diegosouzapw/omniroute
  • Resilienz: Circuit Breaker, exponentieller Backoff, Anti-Thundering Herd, TLS-Spoofing

📖 Dokumentation

Dokument Beschreibung
Benutzerhandbuch Anbieter, Combos, CLI-Integration, Deploy
API-Referenz Alle Endpoints mit Beispielen
Fehlerbehebung Häufige Probleme und Lösungen
Architektur Systemarchitektur und Interna
Mitwirken Entwicklungs-Setup und Richtlinien
OpenAPI-Spezifikation OpenAPI 3.0 Spezifikation
Sicherheitsrichtlinie Schwachstellen melden und Sicherheitspraktiken

📧 Support

💬 Treten Sie unserer Community bei! WhatsApp-Gruppe — Hilfe bekommen, Tipps teilen und auf dem Laufenden bleiben.


👥 Mitwirkende

Contributors

Wie du mitwirken kannst

  1. Repository forken
  2. Feature-Branch erstellen (git checkout -b feature/amazing-feature)
  3. Änderungen committen (git commit -m 'Add amazing feature')
  4. Branch pushen (git push origin feature/amazing-feature)
  5. Pull Request öffnen

Siehe CONTRIBUTING.md für detaillierte Richtlinien.

Neue Version veröffentlichen

# Release erstellen — npm-Veröffentlichung erfolgt automatisch
gh release create v1.0.6 --title "v1.0.6" --generate-notes

📊 Star-Verlauf

Star History Chart

🙏 Danksagungen

Besonderer Dank an 9router von decolua — das Originalprojekt, das diesen Fork inspiriert hat. OmniRoute baut auf diesem unglaublichen Fundament auf mit zusätzlichen Funktionen, Multi-Modalen APIs und einem vollständigen TypeScript-Rewrite.

Besonderer Dank an CLIProxyAPI — die ursprüngliche Go-Implementierung, die diese JavaScript-Portierung inspiriert hat.


📄 Lizenz

MIT-Lizenz — siehe LICENSE für Details.


Mit ❤️ gemacht für Entwickler, die 24/7 programmieren
omniroute.online