OmniRoute Dashboard # 🚀 OmniRoute — Das kostenlose AI-Gateway ### Höre nie auf zu programmieren. Intelligentes Routing zu **KOSTENLOSEN und günstigen KI-Modellen** mit automatischem Fallback. _Dein universeller API-Proxy — ein Endpoint, 36+ Anbieter, null Ausfallzeit._ **Chat Completions • Embeddings • Bildgenerierung • Audio • Reranking • 100% TypeScript** --- ### 🤖 Kostenloser KI-Anbieter für deine Lieblings-Coding-Agenten _Verbinde jedes KI-gesteuerte IDE- oder CLI-Tool über OmniRoute — kostenloses API-Gateway für unbegrenztes Programmieren._
OpenClaw
OpenClaw

⭐ 205K
NanoBot
NanoBot

⭐ 20.9K
PicoClaw
PicoClaw

⭐ 14.6K
ZeroClaw
ZeroClaw

⭐ 9.9K
IronClaw
IronClaw

⭐ 2.1K
OpenCode
OpenCode

⭐ 106K
Codex CLI
Codex CLI

⭐ 60.8K
Claude Code
Claude Code

⭐ 67.3K
Gemini CLI
Gemini CLI

⭐ 94.7K
Kilo Code
Kilo Code

⭐ 15.5K
📡 Alle Agenten verbinden sich über http://localhost:20128/v1 oder http://cloud.omniroute.online/v1 — eine Konfiguration, unbegrenzte Modelle und Kontingent --- [![npm version](https://img.shields.io/npm/v/omniroute?color=cb3837&logo=npm)](https://www.npmjs.com/package/omniroute) [![Docker Hub](https://img.shields.io/docker/v/diegosouzapw/omniroute?label=Docker%20Hub&logo=docker&color=2496ED)](https://hub.docker.com/r/diegosouzapw/omniroute) [![License](https://img.shields.io/github/license/diegosouzapw/OmniRoute)](https://github.com/diegosouzapw/OmniRoute/blob/main/LICENSE) [![Website](https://img.shields.io/badge/Website-omniroute.online-blue?logo=google-chrome&logoColor=white)](https://omniroute.online) [![WhatsApp](https://img.shields.io/badge/WhatsApp-Community-25D366?logo=whatsapp&logoColor=white)](https://chat.whatsapp.com/JI7cDQ1GyaiDHhVBpLxf8b?mode=gi_t) [🌐 Website](https://omniroute.online) • [🚀 Schnellstart](#-schnellstart) • [💡 Funktionen](#-hauptfunktionen) • [📖 Doku](#-dokumentation) • [💰 Preise](#-preisübersicht) 🌐 **Verfügbar in:** 🇺🇸 [English](README.md) | 🇧🇷 [Português (Brasil)](README.pt-BR.md) | 🇪🇸 [Español](README.es.md) | 🇫🇷 [Français](README.fr.md) | 🇮🇹 [Italiano](README.it.md) | 🇷🇺 [Русский](README.ru.md) | 🇨🇳 [中文 (简体)](README.zh-CN.md) | 🇩🇪 [Deutsch](README.de.md) | 🇮🇳 [हिन्दी](README.in.md) | 🇹🇭 [ไทย](README.th.md) | 🇺🇦 [Українська](README.uk-UA.md) | 🇸🇦 [العربية](README.ar.md) | 🇯🇵 [日本語](README.ja.md) | 🇻🇳 [Tiếng Việt](README.vi.md) | 🇧🇬 [Български](README.bg.md) | 🇩🇰 [Dansk](README.da.md) | 🇫🇮 [Suomi](README.fi.md) | 🇮🇱 [עברית](README.he.md) | 🇭🇺 [Magyar](README.hu.md) | 🇮🇩 [Bahasa Indonesia](README.id.md) | 🇰🇷 [한국어](README.ko.md) | 🇲🇾 [Bahasa Melayu](README.ms.md) | 🇳🇱 [Nederlands](README.nl.md) | 🇳🇴 [Norsk](README.no.md) | 🇵🇹 [Português (Portugal)](README.pt.md) | 🇷🇴 [Română](README.ro.md) | 🇵🇱 [Polski](README.pl.md) | 🇸🇰 [Slovenčina](README.sk.md) | 🇸🇪 [Svenska](README.sv.md) | 🇵🇭 [Filipino](README.phi.md)
--- ## 🤔 Warum OmniRoute? **Hör auf, Geld zu verschwenden und an Limits zu stoßen:** - Abo-Kontingent verfällt jeden Monat ungenutzt - Rate-Limits stoppen dich mitten beim Programmieren - Teure APIs ($20-50/Monat pro Anbieter) - Manuelles Wechseln zwischen Anbietern **OmniRoute löst das:** - ✅ **Abos maximieren** — Kontingente tracken, alles vor dem Reset nutzen - ✅ **Automatischer Fallback** — Abo → API Key → Günstig → Kostenlos, null Ausfallzeit - ✅ **Multi-Account** — Round-Robin zwischen Konten pro Anbieter - ✅ **Universal** — Funktioniert mit Claude Code, Codex, Gemini CLI, Cursor, Cline, OpenClaw, jedem CLI-Tool --- ## 🔄 So funktioniert's ``` ┌─────────────┐ │ Dein CLI │ (Claude Code, Codex, Gemini CLI, OpenClaw, Cursor, Cline...) │ Tool │ └──────┬──────┘ │ http://localhost:20128/v1 ↓ ┌─────────────────────────────────────────┐ │ OmniRoute (Smart Router) │ │ • Format-Übersetzung (OpenAI ↔ Claude) │ │ • Kontingent-Tracking + Embeddings + Bilder │ │ • Automatische Token-Erneuerung │ └──────┬──────────────────────────────────┘ │ ├─→ [Tier 1: ABO] Claude Code, Codex, Gemini CLI │ ↓ Kontingent erschöpft ├─→ [Tier 2: API KEY] DeepSeek, Groq, xAI, Mistral, NVIDIA NIM usw. │ ↓ Budget-Limit ├─→ [Tier 3: GÜNSTIG] GLM ($0.6/1M), MiniMax ($0.2/1M) │ ↓ Budget-Limit └─→ [Tier 4: KOSTENLOS] iFlow, Qwen, Kiro (unbegrenzt) Ergebnis: Nie aufhören zu programmieren, minimale Kosten ``` --- ## ⚡ Schnellstart **1. Global installieren:** ```bash npm install -g omniroute omniroute ``` 🎉 Das Dashboard öffnet sich unter `http://localhost:20128` | Befehl | Beschreibung | | ----------------------- | ----------------------------------- | | `omniroute` | Server starten (Standardport 20128) | | `omniroute --port 3000` | Benutzerdefinierten Port verwenden | | `omniroute --no-open` | Browser nicht automatisch öffnen | | `omniroute --help` | Hilfe anzeigen | **2. KOSTENLOSEN Anbieter verbinden:** Dashboard → Anbieter → **Claude Code** oder **Antigravity** verbinden → OAuth Login → Fertig! **3. In deinem CLI-Tool verwenden:** ``` Claude Code/Codex/Gemini CLI/OpenClaw/Cursor/Cline Einstellungen: Endpoint: http://localhost:20128/v1 API Key: [vom Dashboard kopieren] Model: if/kimi-k2-thinking ``` **Das war's!** Beginne mit KOSTENLOSEN KI-Modellen zu programmieren. **Alternative — aus Quellcode ausführen:** ```bash cp .env.example .env npm install PORT=20128 NEXT_PUBLIC_BASE_URL=http://localhost:20128 npm run dev ``` --- ## 🐳 Docker OmniRoute ist als öffentliches Docker-Image auf [Docker Hub](https://hub.docker.com/r/diegosouzapw/omniroute) verfügbar. **Schnellstart:** ```bash docker run -d \ --name omniroute \ --restart unless-stopped \ -p 20128:20128 \ -v omniroute-data:/app/data \ diegosouzapw/omniroute:latest ``` **Mit Umgebungsdatei:** ```bash # .env kopieren und bearbeiten cp .env.example .env docker run -d \ --name omniroute \ --restart unless-stopped \ --env-file .env \ -p 20128:20128 \ -v omniroute-data:/app/data \ diegosouzapw/omniroute:latest ``` **Mit Docker Compose:** ```bash # Basisprofil (ohne CLI-Tools) docker compose --profile base up -d # CLI-Profil (Claude Code, Codex, OpenClaw integriert) docker compose --profile cli up -d ``` | Image | Tag | Größe | Beschreibung | | ------------------------ | -------- | ------ | ------------------------ | | `diegosouzapw/omniroute` | `latest` | ~250MB | Letztes stabiles Release | | `diegosouzapw/omniroute` | `1.0.6` | ~250MB | Aktuelle Version | --- ## 💰 Preisübersicht | Tier | Anbieter | Kosten | Kontingent-Reset | Am besten für | | ---------------- | ----------------- | ---------------------------- | ------------------- | ----------------------- | | **💳 ABO** | Claude Code (Pro) | $20/Monat | 5h + wöchentlich | Bereits abonniert | | | Codex (Plus/Pro) | $20-200/Monat | 5h + wöchentlich | OpenAI-Nutzer | | | Gemini CLI | **KOSTENLOS** | 180K/Monat + 1K/Tag | Alle! | | | GitHub Copilot | $10-19/Monat | Monatlich | GitHub-Nutzer | | **🔑 API KEY** | NVIDIA NIM | **KOSTENLOS** (1000 Credits) | Einmalig | Kostenloses Testen | | | DeepSeek | Nach Verbrauch | Keiner | Bestes Preis-Leistung | | | Groq | Gratis-Stufe + bezahlt | Begrenzt | Ultra-schnelle Inferenz | | | xAI (Grok) | Nach Verbrauch | Keiner | Grok-Modelle | | | Mistral | Gratis-Stufe + bezahlt | Begrenzt | Europäische KI | | | OpenRouter | Nach Verbrauch | Keiner | 100+ Modelle | | **💰 GÜNSTIG** | GLM-4.7 | $0.6/1M | Täglich 10h | Budget-Backup | | | MiniMax M2.1 | $0.2/1M | 5h rotierend | Günstigste Option | | | Kimi K2 | $9/Monat fest | 10M Token/Monat | Vorhersagbare Kosten | | **🆓 KOSTENLOS** | iFlow | $0 | Unbegrenzt | 8 kostenlose Modelle | | | Qwen | $0 | Unbegrenzt | 3 kostenlose Modelle | | | Kiro | $0 | Unbegrenzt | Kostenloses Claude | **💡 Profi-Tipp:** Starte mit Gemini CLI (180K gratis/Monat) + iFlow (unbegrenzt gratis) = $0 Kosten! --- ## 🎯 Anwendungsfälle ### Fall 1: „Ich habe ein Claude Pro Abo" **Problem:** Kontingent verfällt ungenutzt, Rate-Limits während intensivem Programmieren ``` Combo: "maximize-claude" 1. cc/claude-opus-4-6 (Abo voll ausnutzen) 2. glm/glm-4.7 (günstiges Backup bei erschöpftem Kontingent) 3. if/kimi-k2-thinking (kostenloser Notfall-Fallback) Monatliche Kosten: $20 (Abo) + ~$5 (Backup) = $25 gesamt vs. $20 + an Limits stoßen = Frustration ``` ### Fall 2: „Ich will null Kosten" **Problem:** Kann sich Abos nicht leisten, braucht zuverlässige KI zum Programmieren ``` Combo: "free-forever" 1. gc/gemini-3-flash (180K gratis/Monat) 2. if/kimi-k2-thinking (unbegrenzt gratis) 3. qw/qwen3-coder-plus (unbegrenzt gratis) Monatliche Kosten: $0 Qualität: Produktionsreife Modelle ``` ### Fall 3: „Ich muss 24/7 programmieren, ohne Unterbrechungen" **Problem:** Enge Deadlines, kann sich keine Ausfallzeit leisten ``` Combo: "always-on" 1. cc/claude-opus-4-6 (beste Qualität) 2. cx/gpt-5.2-codex (zweites Abo) 3. glm/glm-4.7 (günstig, täglicher Reset) 4. minimax/MiniMax-M2.1 (günstigste, 5h Reset) 5. if/kimi-k2-thinking (unbegrenzt kostenlos) Ergebnis: 5 Fallback-Ebenen = null Ausfallzeit ``` ### Fall 4: „Ich will KOSTENLOSE KI in OpenClaw" **Problem:** Braucht KI-Assistenz in Messaging-Apps, komplett kostenlos ``` Combo: "openclaw-free" 1. if/glm-4.7 (unbegrenzt kostenlos) 2. if/minimax-m2.1 (unbegrenzt kostenlos) 3. if/kimi-k2-thinking (unbegrenzt kostenlos) Monatliche Kosten: $0 Zugang über: WhatsApp, Telegram, Slack, Discord, iMessage, Signal... ``` --- ## 💡 Hauptfunktionen ### 🧠 Routing & Intelligenz | Funktion | Was es macht | | ------------------------------------ | ------------------------------------------------------------------------------ | | 🎯 **Intelligenter 4-Tier-Fallback** | Auto-Routing: Abo → API Key → Günstig → Kostenlos | | 📊 **Echtzeit-Kontingent-Tracking** | Live Token-Zählung + Reset-Countdown pro Anbieter | | 🔄 **Format-Übersetzung** | OpenAI ↔ Claude ↔ Gemini ↔ Cursor ↔ Kiro nahtlos | | 👥 **Multi-Account-Unterstützung** | Mehrere Konten pro Anbieter mit intelligenter Auswahl | | 🔄 **Auto-Token-Erneuerung** | OAuth-Token werden automatisch mit Wiederholungen erneuert | | 🎨 **Benutzerdefinierte Combos** | 6 Strategien: fill-first, round-robin, p2c, random, least-used, cost-optimized | | 🧩 **Benutzerdefinierte Modelle** | Jede Modell-ID zu jedem Anbieter hinzufügen | | 🌐 **Wildcard-Router** | `provider/*` Muster dynamisch an jeden Anbieter routen | | 🧠 **Reasoning-Budget** | Passthrough, auto, custom und adaptive Modi für Reasoning-Modelle | | 💬 **System Prompt Injection** | Globaler System Prompt für alle Anfragen | | 📄 **API Responses** | Volle Unterstützung der OpenAI Responses API (`/v1/responses`) für Codex | ### 🎵 Multi-Modale APIs | Funktion | Was es macht | | -------------------------- | ------------------------------------------------- | | 🖼️ **Bildgenerierung** | `/v1/images/generations` — 4 Anbieter, 9+ Modelle | | 📐 **Embeddings** | `/v1/embeddings` — 6 Anbieter, 9+ Modelle | | 🎤 **Audio-Transkription** | `/v1/audio/transcriptions` — Whisper-kompatibel | | 🔊 **Text-zu-Sprache** | `/v1/audio/speech` — Multi-Anbieter Audiosynthese | | 🛡️ **Moderationen** | `/v1/moderations` — Sicherheitsüberprüfungen | | 🔀 **Reranking** | `/v1/rerank` — Dokumenten-Relevanz-Neuordnung | ### 🛡️ Resilienz & Sicherheit | Funktion | Was es macht | | ------------------------------- | -------------------------------------------------------------------- | | 🔌 **Circuit Breaker** | Auto-Öffnung/-Schließung pro Anbieter mit konfigurierbaren Schwellen | | 🛡️ **Anti-Thundering Herd** | Mutex + Semaphor Rate-Limit für API-Key-Anbieter | | 🧠 **Semantischer Cache** | Zwei-Ebenen-Cache (Signatur + Semantik) senkt Kosten und Latenz | | ⚡ **Anfrage-Idempotenz** | 5s Dedup-Fenster für doppelte Anfragen | | 🔒 **TLS-Fingerprint-Spoofing** | Bot-Erkennung umgehen via wreq-js | | 🌐 **IP-Filterung** | Allowlist/Blocklist für API-Zugriffskontrolle | | 📊 **Editierbare Rate-Limits** | Konfigurierbare RPM, minimaler Abstand, max. Konkurrenz | ### 📊 Observability & Analytics | Funktion | Was es macht | | ---------------------------- | -------------------------------------------------------------- | | 📝 **Anfrage-Logs** | Debug-Modus mit vollständigen Request/Response-Logs | | 💾 **SQLite-Logs** | Persistente Proxy-Logs überleben Neustarts | | 📊 **Analytics-Dashboard** | Recharts: Statistik-Karten, Nutzungsdiagramm, Anbieter-Tabelle | | 📈 **Fortschritts-Tracking** | Opt-in SSE-Fortschrittsereignisse für Streaming | | 🧪 **LLM-Evaluierungen** | Testen mit Golden Set und 4 Match-Strategien | | 🔍 **Anfrage-Telemetrie** | p50/p95/p99 Latenz-Aggregation + X-Request-Id Tracking | | 📋 **Logs + Kontingente** | Dedizierte Seiten für Log-Browsing und Kontingent-Tracking | | 🏥 **Health Dashboard** | Uptime, Circuit-Breaker-Status, Lockouts, Cache-Statistiken | | 💰 **Kosten-Tracking** | Budget-Management + Preiseinstellung pro Modell | ### ☁️ Deployment & Sync | Funktion | Was es macht | | -------------------------- | ----------------------------------------------------------------------------- | | 💾 **Cloud Sync** | Einstellungen zwischen Geräten via Cloudflare Workers synchronisieren | | 🌐 **Überall deployen** | Localhost, VPS, Docker, Cloudflare Workers | | 🔑 **API-Key-Verwaltung** | API-Keys pro Anbieter generieren, rotieren und einschränken | | 🧙 **Setup-Assistent** | 4-Schritte geführtes Setup für neue Nutzer | | 🔧 **CLI Tools Dashboard** | Ein-Klick-Konfiguration für Claude, Codex, Cline, OpenClaw, Kilo, Antigravity | | 🔄 **DB-Backups** | Automatisches Backup und Wiederherstellung aller Einstellungen |
📖 Funktionsdetails ### 🎯 Intelligenter 4-Tier-Fallback Erstelle Combos mit automatischem Fallback: ``` Combo: "my-coding-stack" 1. cc/claude-opus-4-6 (dein Abo) 2. nvidia/llama-3.3-70b (kostenlose NVIDIA API) 3. glm/glm-4.7 (günstiges Backup, $0.6/1M) 4. if/kimi-k2-thinking (kostenloser Fallback) → Wechselt automatisch bei erschöpftem Kontingent oder Fehlern ``` ### 📊 Echtzeit-Kontingent-Tracking - Token-Verbrauch pro Anbieter - Reset-Countdown (5 Stunden, täglich, wöchentlich) - Kostenabschätzung für bezahlte Stufen - Monatliche Ausgabenberichte ### 🔄 Format-Übersetzung Nahtlose Übersetzung zwischen Formaten: - **OpenAI** ↔ **Claude** ↔ **Gemini** ↔ **OpenAI Responses** - Dein CLI sendet OpenAI-Format → OmniRoute übersetzt → Anbieter empfängt natives Format - Funktioniert mit jedem Tool, das benutzerdefinierte OpenAI-Endpoints unterstützt ### 👥 Multi-Account-Unterstützung - Mehrere Konten pro Anbieter hinzufügen - Automatisches Round-Robin oder prioritätsbasiertes Routing - Fallback zum nächsten Konto bei Kontingent-Erschöpfung ### 🔄 Auto-Token-Erneuerung - OAuth-Token werden automatisch vor Ablauf erneuert - Keine manuelle Neuauthentifizierung nötig - Nahtlose Erfahrung über alle Anbieter ### 🎨 Benutzerdefinierte Combos - Unbegrenzte Modell-Kombinationen erstellen - 6 Strategien: fill-first, round-robin, power-of-two-choices, random, least-used, cost-optimized - Combos zwischen Geräten mit Cloud Sync teilen ### 🏥 Health Dashboard - Systemstatus (Uptime, Version, Speichernutzung) - Circuit-Breaker-Status pro Anbieter (Closed/Open/Half-Open) - Rate-Limit-Status und aktive Lockouts - Signatur-Cache-Statistiken - Latenz-Telemetrie (p50/p95/p99) + Prompt-Cache - Gesundheitsstatus mit einem Klick zurücksetzen ### 🔧 Übersetzer-Playground - Debug, Test und Visualisierung von API-Format-Übersetzungen - Anfragen senden und sehen, wie OmniRoute zwischen Anbieter-Formaten übersetzt - Unschätzbar für Integrationsprobleme ### 💾 Cloud Sync - Anbieter, Combos und Einstellungen zwischen Geräten synchronisieren - Automatische Hintergrundsynchronisierung - Sichere verschlüsselte Speicherung
--- ## 📖 Einrichtungsanleitung
💳 Abo-Anbieter ### Claude Code (Pro/Max) ```bash Dashboard → Anbieter → Claude Code verbinden → OAuth Login → Automatische Token-Erneuerung → 5h + wöchentliches Kontingent-Tracking Modelle: cc/claude-opus-4-6 cc/claude-sonnet-4-5-20250929 cc/claude-haiku-4-5-20251001 ``` **Profi-Tipp:** Opus für komplexe Aufgaben, Sonnet für Geschwindigkeit. OmniRoute trackt Kontingent pro Modell! ### OpenAI Codex (Plus/Pro) ```bash Dashboard → Anbieter → Codex verbinden → OAuth Login (Port 1455) → 5h + wöchentlicher Reset Modelle: cx/gpt-5.2-codex cx/gpt-5.1-codex-max ``` ### Gemini CLI (KOSTENLOS 180K/Monat!) ```bash Dashboard → Anbieter → Gemini CLI verbinden → Google OAuth → 180K Completions/Monat + 1K/Tag Modelle: gc/gemini-3-flash-preview gc/gemini-2.5-pro ``` **Bester Wert:** Riesiger Gratis-Tarif! Vor bezahlten Stufen nutzen. ### GitHub Copilot ```bash Dashboard → Anbieter → GitHub verbinden → OAuth via GitHub → Monatlicher Reset (1. des Monats) Modelle: gh/gpt-5 gh/claude-4.5-sonnet gh/gemini-3-pro ```
🔑 API-Key-Anbieter ### NVIDIA NIM (KOSTENLOS 1000 Credits!) 1. Registrieren: [build.nvidia.com](https://build.nvidia.com) 2. Kostenlosen API-Key holen (1000 Inferenz-Credits inklusive) 3. Dashboard → Anbieter hinzufügen → NVIDIA NIM: - API Key: `nvapi-your-key` **Modelle:** `nvidia/llama-3.3-70b-instruct`, `nvidia/mistral-7b-instruct` und 50+ weitere **Profi-Tipp:** OpenAI-kompatible API — funktioniert perfekt mit OmniRoutes Format-Übersetzung! ### DeepSeek 1. Registrieren: [platform.deepseek.com](https://platform.deepseek.com) 2. API-Key holen 3. Dashboard → Anbieter hinzufügen → DeepSeek **Modelle:** `deepseek/deepseek-chat`, `deepseek/deepseek-coder` ### Groq (Gratis-Stufe verfügbar!) 1. Registrieren: [console.groq.com](https://console.groq.com) 2. API-Key holen (Gratis-Stufe inklusive) 3. Dashboard → Anbieter hinzufügen → Groq **Modelle:** `groq/llama-3.3-70b`, `groq/mixtral-8x7b` **Profi-Tipp:** Ultra-schnelle Inferenz — am besten für Echtzeit-Programmierung! ### OpenRouter (100+ Modelle) 1. Registrieren: [openrouter.ai](https://openrouter.ai) 2. API-Key holen 3. Dashboard → Anbieter hinzufügen → OpenRouter **Modelle:** Zugang zu 100+ Modellen aller großen Anbieter über einen einzigen API-Key.
💰 Günstige Anbieter (Backup) ### GLM-4.7 (Täglicher Reset, $0.6/1M) 1. Registrieren: [Zhipu AI](https://open.bigmodel.cn/) 2. API-Key aus dem Coding Plan holen 3. Dashboard → API Key hinzufügen: - Anbieter: `glm` - API Key: `your-key` **Nutze:** `glm/glm-4.7` **Profi-Tipp:** Der Coding Plan bietet 3× Kontingent zu 1/7 der Kosten! Täglicher Reset um 10:00. ### MiniMax M2.1 (5h Reset, $0.20/1M) 1. Registrieren: [MiniMax](https://www.minimax.io/) 2. API-Key holen 3. Dashboard → API Key hinzufügen **Nutze:** `minimax/MiniMax-M2.1` **Profi-Tipp:** Günstigste Option für langen Kontext (1M Token)! ### Kimi K2 ($9/Monat fest) 1. Abonnieren: [Moonshot AI](https://platform.moonshot.ai/) 2. API-Key holen 3. Dashboard → API Key hinzufügen **Nutze:** `kimi/kimi-latest` **Profi-Tipp:** Feste $9/Monat für 10M Token = $0.90/1M effektive Kosten!
🆓 KOSTENLOSE Anbieter (Notfall-Backup) ### iFlow (8 KOSTENLOSE Modelle) ```bash Dashboard → iFlow verbinden → iFlow OAuth Login → Unbegrenzte Nutzung Modelle: if/kimi-k2-thinking if/qwen3-coder-plus if/glm-4.7 if/minimax-m2 if/deepseek-r1 ``` ### Qwen (3 KOSTENLOSE Modelle) ```bash Dashboard → Qwen verbinden → Geräte-Code-Autorisierung → Unbegrenzte Nutzung Modelle: qw/qwen3-coder-plus qw/qwen3-coder-flash ``` ### Kiro (Kostenloses Claude) ```bash Dashboard → Kiro verbinden → AWS Builder ID oder Google/GitHub → Unbegrenzte Nutzung Modelle: kr/claude-sonnet-4.5 kr/claude-haiku-4.5 ```
🎨 Combos erstellen ### Beispiel 1: Abo maximieren → Günstiges Backup ``` Dashboard → Combos → Neues erstellen Name: premium-coding Modelle: 1. cc/claude-opus-4-6 (Primäres Abo) 2. glm/glm-4.7 (Günstiges Backup, $0.6/1M) 3. minimax/MiniMax-M2.1 (Günstigster Fallback, $0.20/1M) Im CLI nutzen: premium-coding ``` ### Beispiel 2: Nur Kostenlos (Null Kosten) ``` Name: free-combo Modelle: 1. gc/gemini-3-flash-preview (180K gratis/Monat) 2. if/kimi-k2-thinking (unbegrenzt) 3. qw/qwen3-coder-plus (unbegrenzt) Kosten: Für immer $0! ```
🔧 CLI-Integration ### Cursor IDE ``` Einstellungen → Modelle → Erweitert: OpenAI API Base URL: http://localhost:20128/v1 OpenAI API Key: [aus OmniRoute Dashboard] Model: cc/claude-opus-4-6 ``` ### Claude Code Nutze die **CLI Tools** Seite im Dashboard für Ein-Klick-Konfiguration, oder bearbeite `~/.claude/settings.json` manuell. ### Codex CLI ```bash export OPENAI_BASE_URL="http://localhost:20128" export OPENAI_API_KEY="your-omniroute-api-key" codex "your prompt" ``` ### OpenClaw **Option 1 — Dashboard (empfohlen):** ``` Dashboard → CLI Tools → OpenClaw → Modell wählen → Anwenden ``` **Option 2 — Manuell:** `~/.openclaw/openclaw.json` bearbeiten: ```json { "models": { "providers": { "omniroute": { "baseUrl": "http://127.0.0.1:20128/v1", "apiKey": "sk_omniroute", "api": "openai-completions" } } } } ``` > **Hinweis:** OpenClaw funktioniert nur mit lokalem OmniRoute. Verwende `127.0.0.1` statt `localhost` um IPv6-Auflösungsprobleme zu vermeiden. ### Cline / Continue / RooCode ``` Einstellungen → API-Konfiguration: Anbieter: OpenAI Compatible Base URL: http://localhost:20128/v1 API Key: [aus OmniRoute Dashboard] Model: if/kimi-k2-thinking ```
--- ## 📊 Verfügbare Modelle
Alle verfügbaren Modelle anzeigen **Claude Code (`cc/`)** - Pro/Max: - `cc/claude-opus-4-6` - `cc/claude-sonnet-4-5-20250929` - `cc/claude-haiku-4-5-20251001` **Codex (`cx/`)** - Plus/Pro: - `cx/gpt-5.2-codex` - `cx/gpt-5.1-codex-max` **Gemini CLI (`gc/`)** - KOSTENLOS: - `gc/gemini-3-flash-preview` - `gc/gemini-2.5-pro` **GitHub Copilot (`gh/`)**: - `gh/gpt-5` - `gh/claude-4.5-sonnet` **NVIDIA NIM (`nvidia/`)** - KOSTENLOSE Credits: - `nvidia/llama-3.3-70b-instruct` - `nvidia/mistral-7b-instruct` - 50+ weitere Modelle auf [build.nvidia.com](https://build.nvidia.com) **GLM (`glm/`)** - $0.6/1M: - `glm/glm-4.7` **MiniMax (`minimax/`)** - $0.2/1M: - `minimax/MiniMax-M2.1` **iFlow (`if/`)** - KOSTENLOS: - `if/kimi-k2-thinking` - `if/qwen3-coder-plus` - `if/deepseek-r1` - `if/glm-4.7` - `if/minimax-m2` **Qwen (`qw/`)** - KOSTENLOS: - `qw/qwen3-coder-plus` - `qw/qwen3-coder-flash` **Kiro (`kr/`)** - KOSTENLOS: - `kr/claude-sonnet-4.5` - `kr/claude-haiku-4.5` **OpenRouter (`or/`)** - 100+ Modelle: - `or/anthropic/claude-4-sonnet` - `or/google/gemini-2.5-pro` - Jedes Modell von [openrouter.ai/models](https://openrouter.ai/models)
--- ## 🧪 Evaluierungen (Evals) OmniRoute enthält ein integriertes Evaluierungs-Framework zum Testen der LLM-Antwortqualität gegen ein Golden Set. Zugang über **Analytics → Evals** im Dashboard. ### Integriertes Golden Set Das vorgeladene „OmniRoute Golden Set" enthält 10 Testfälle: - Begrüßungen, Mathematik, Geographie, Code-Generierung - JSON-Formatkonformität, Übersetzung, Markdown - Sicherheitsablehnung (schädlicher Inhalt), Zählung, Boolesche Logik ### Evaluierungsstrategien | Strategie | Beschreibung | Beispiel | | ---------- | ---------------------------------------------------------- | -------------------------------- | | `exact` | Ausgabe muss exakt übereinstimmen | `"4"` | | `contains` | Ausgabe muss Teilzeichenfolge enthalten (case-insensitive) | `"Paris"` | | `regex` | Ausgabe muss Regex-Muster entsprechen | `"1.*2.*3"` | | `custom` | Benutzerdefinierte JS-Funktion gibt true/false zurück | `(output) => output.length > 10` | --- ## 🐛 Fehlerbehebung
Klicke zum Erweitern der Fehlerbehebungsanleitung **„Language model did not provide messages"** - Anbieter-Kontingent erschöpft → Kontingent-Tracker im Dashboard prüfen - Lösung: Combo mit Fallback nutzen oder zu günstigerer Stufe wechseln **Rate Limiting** - Abo-Kontingent erschöpft → Fallback zu GLM/MiniMax - Combo hinzufügen: `cc/claude-opus-4-6 → glm/glm-4.7 → if/kimi-k2-thinking` **OAuth-Token abgelaufen** - Wird automatisch von OmniRoute erneuert - Falls Problem bestehen bleibt: Dashboard → Anbieter → Neu verbinden **Hohe Kosten** - Nutzungsstatistiken unter Dashboard → Kosten prüfen - Primärmodell auf GLM/MiniMax umstellen - Gratis-Stufe (Gemini CLI, iFlow) für unkritische Aufgaben nutzen **Dashboard öffnet sich auf falschem Port** - `PORT=20128` und `NEXT_PUBLIC_BASE_URL=http://localhost:20128` setzen **Cloud-Sync-Fehler** - Prüfe dass `BASE_URL` auf deine laufende Instanz zeigt - Prüfe dass `CLOUD_URL` auf den erwarteten Cloud-Endpoint zeigt - `NEXT_PUBLIC_*` Werte mit Serverwerten synchron halten **Erster Login funktioniert nicht** - `INITIAL_PASSWORD` in `.env` prüfen - Falls nicht gesetzt, Standard-Passwort ist `123456` **Keine Anfrage-Logs** - `ENABLE_REQUEST_LOGS=true` in `.env` setzen **Verbindungstest zeigt „Invalid" für OpenAI-kompatible Anbieter** - Viele Anbieter stellen den `/models` Endpoint nicht bereit - OmniRoute v1.0.6+ enthält Fallback-Validierung via Chat Completions - Stelle sicher, dass die Base URL den `/v1` Suffix enthält
--- ## 🛠️ Technologie-Stack - **Runtime**: Node.js 20+ - **Sprache**: TypeScript 5.9 — **100% TypeScript** in `src/` und `open-sse/` (v1.0.6) - **Framework**: Next.js 16 + React 19 + Tailwind CSS 4 - **Datenbank**: LowDB (JSON) + SQLite (Domain-Status + Proxy-Logs) - **Streaming**: Server-Sent Events (SSE) - **Auth**: OAuth 2.0 (PKCE) + JWT + API Keys - **Testing**: Node.js Test Runner (368+ Unit-Tests) - **CI/CD**: GitHub Actions (automatische npm + Docker Hub Veröffentlichung bei Release) - **Website**: [omniroute.online](https://omniroute.online) - **Paket**: [npmjs.com/package/omniroute](https://www.npmjs.com/package/omniroute) - **Docker**: [hub.docker.com/r/diegosouzapw/omniroute](https://hub.docker.com/r/diegosouzapw/omniroute) - **Resilienz**: Circuit Breaker, exponentieller Backoff, Anti-Thundering Herd, TLS-Spoofing --- ## 📖 Dokumentation | Dokument | Beschreibung | | ------------------------------------------ | ---------------------------------------------- | | [Benutzerhandbuch](docs/USER_GUIDE.md) | Anbieter, Combos, CLI-Integration, Deploy | | [API-Referenz](docs/API_REFERENCE.md) | Alle Endpoints mit Beispielen | | [Fehlerbehebung](docs/TROUBLESHOOTING.md) | Häufige Probleme und Lösungen | | [Architektur](docs/ARCHITECTURE.md) | Systemarchitektur und Interna | | [Mitwirken](CONTRIBUTING.md) | Entwicklungs-Setup und Richtlinien | | [OpenAPI-Spezifikation](docs/openapi.yaml) | OpenAPI 3.0 Spezifikation | | [Sicherheitsrichtlinie](SECURITY.md) | Schwachstellen melden und Sicherheitspraktiken | --- ## 📧 Support > 💬 **Treten Sie unserer Community bei!** [WhatsApp-Gruppe](https://chat.whatsapp.com/JI7cDQ1GyaiDHhVBpLxf8b?mode=gi_t) — Hilfe bekommen, Tipps teilen und auf dem Laufenden bleiben. - **Website**: [omniroute.online](https://omniroute.online) - **GitHub**: [github.com/diegosouzapw/OmniRoute](https://github.com/diegosouzapw/OmniRoute) - **Issues**: [github.com/diegosouzapw/OmniRoute/issues](https://github.com/diegosouzapw/OmniRoute/issues) - **WhatsApp**: [Community-Gruppe](https://chat.whatsapp.com/JI7cDQ1GyaiDHhVBpLxf8b?mode=gi_t) - **WhatsApp**: [Community-Gruppe](https://chat.whatsapp.com/JI7cDQ1GyaiDHhVBpLxf8b?mode=gi_t) - **Originalprojekt**: [9router von decolua](https://github.com/decolua/9router) --- ## 👥 Mitwirkende [![Contributors](https://contrib.rocks/image?repo=diegosouzapw/OmniRoute&max=100&columns=20&anon=1)](https://github.com/diegosouzapw/OmniRoute/graphs/contributors) ### Wie du mitwirken kannst 1. Repository forken 2. Feature-Branch erstellen (`git checkout -b feature/amazing-feature`) 3. Änderungen committen (`git commit -m 'Add amazing feature'`) 4. Branch pushen (`git push origin feature/amazing-feature`) 5. Pull Request öffnen Siehe [CONTRIBUTING.md](CONTRIBUTING.md) für detaillierte Richtlinien. ### Neue Version veröffentlichen ```bash # Release erstellen — npm-Veröffentlichung erfolgt automatisch gh release create v1.0.6 --title "v1.0.6" --generate-notes ``` --- ## 📊 Star-Verlauf Star History Chart --- ## 🙏 Danksagungen Besonderer Dank an **[9router](https://github.com/decolua/9router)** von **[decolua](https://github.com/decolua)** — das Originalprojekt, das diesen Fork inspiriert hat. OmniRoute baut auf diesem unglaublichen Fundament auf mit zusätzlichen Funktionen, Multi-Modalen APIs und einem vollständigen TypeScript-Rewrite. Besonderer Dank an **[CLIProxyAPI](https://github.com/router-for-me/CLIProxyAPI)** — die ursprüngliche Go-Implementierung, die diese JavaScript-Portierung inspiriert hat. --- ## 📄 Lizenz MIT-Lizenz — siehe [LICENSE](LICENSE) für Details. ---
Mit ❤️ gemacht für Entwickler, die 24/7 programmieren
omniroute.online