Никога не спирайте да кодирате. Интелигентно маршрутизиране към БЕЗПЛАТНИ и евтини AI модели с автоматичен резервен вариант.
Вашият универсален API прокси — една крайна точка, 36+ доставчици, нулев престой.
Завършвания на чат • Вграждания • Генериране на изображения • Аудио • Прекласиране • 100% TypeScript
Свържете всеки базиран на AI IDE или CLI инструмент чрез OmniRoute — безплатен API шлюз за неограничено кодиране.
|
OpenClaw ⭐ 205K |
NanoBot ⭐ 20.9K |
PicoClaw ⭐ 14.6K |
ZeroClaw ⭐ 9.9K |
IronClaw ⭐ 2.1K |
|
OpenCode ⭐ 106K |
Codex CLI ⭐ 60.8K |
Claude Code ⭐ 67.3K |
Gemini CLI ⭐ 94.7K |
Kilo Code ⭐ 15.5K |
📡 Всички агенти се свързват чрез http://localhost:20128/v1 или http://cloud.omniroute.online/v1 — една конфигурация, неограничени модели и квота
🌐 Website • 🚀 Quick Start • 💡 Features • 📖 Docs • 💰 Pricing • 💬 WhatsApp
🌐 Available in: 🇺🇸 English | 🇧🇷 Português (Brasil) | 🇪🇸 Español | 🇫🇷 Français | 🇮🇹 Italiano | 🇷🇺 Русский | 🇨🇳 中文 (简体) | 🇩🇪 Deutsch | 🇮🇳 हिन्दी | 🇹🇭 ไทย | 🇺🇦 Українська | 🇸🇦 العربية | 🇯🇵 日本語 | 🇻🇳 Tiếng Việt | 🇧🇬 Български | 🇩🇰 Dansk | 🇫🇮 Suomi | 🇮🇱 עברית | 🇭🇺 Magyar | 🇮🇩 Bahasa Indonesia | 🇰🇷 한국어 | 🇲🇾 Bahasa Melayu | 🇳🇱 Nederlands | 🇳🇴 Norsk | 🇵🇹 Português (Portugal) | 🇷🇴 Română | 🇵🇱 Polski | 🇸🇰 Slovenčina | 🇸🇪 Svenska | 🇵🇭 Filipino
Спрете да пилеете пари и да достигате лимити:
Абонаментната квота изтича неизползвана всеки месец
Ограниченията на скоростта ви спират да кодирате по средата
Скъпи API ($20-50/месец на доставчик)
Ръчно превключване между доставчици
OmniRoute решава това:
- ✅ Увеличете максимално абонаментите - Проследете квотата, използвайте всеки бит преди нулиране
- ✅ Автоматичен резервен режим - Абонамент → API ключ → Евтини → Безплатно, нулев престой
- ✅ Множество акаунти - Кръгови сметки между акаунти на доставчик
- ✅ Универсален - Работи с Claude Code, Codex, Gemini CLI, Cursor, Cline, OpenClaw, всеки CLI инструмент
┌─────────────┐
│ Your CLI │ (Claude Code, Codex, Gemini CLI, OpenClaw, Cursor, Cline...)
│ Tool │
└──────┬──────┘
│ http://localhost:20128/v1
↓
┌─────────────────────────────────────────┐
│ OmniRoute (Smart Router) │
│ • Format translation (OpenAI ↔ Claude) │
│ • Quota tracking + Embeddings + Images │
│ • Auto token refresh │
└──────┬──────────────────────────────────┘
│
├─→ [Tier 1: SUBSCRIPTION] Claude Code, Codex, Gemini CLI
│ ↓ quota exhausted
├─→ [Tier 2: API KEY] DeepSeek, Groq, xAI, Mistral, NVIDIA NIM, etc.
│ ↓ budget limit
├─→ [Tier 3: CHEAP] GLM ($0.6/1M), MiniMax ($0.2/1M)
│ ↓ budget limit
└─→ [Tier 4: FREE] iFlow, Qwen, Kiro (unlimited)
Result: Never stop coding, minimal cost
Every developer using AI tools faces these problems daily. OmniRoute was built to solve them all — from cost overruns to regional blocks, from broken OAuth flows to zero observability.
💸 1. "I pay for an expensive subscription but still get interrupted by limits"
Developers pay $20–200/month for Claude Pro, Codex Pro, or GitHub Copilot. Even paying, quota has a ceiling — 5h of usage, weekly limits, or per-minute rate limits. Mid-coding session, the provider stops responding and the developer loses flow and productivity.
How OmniRoute solves it:
- Smart 4-Tier Fallback — If subscription quota runs out, automatically redirects to API Key → Cheap → Free with zero manual intervention
- Real-Time Quota Tracking — Shows token consumption in real-time with reset countdown (5h, daily, weekly)
- Multi-Account Support — Multiple accounts per provider with auto round-robin — when one runs out, switches to the next
- Custom Combos — Customizable fallback chains with 6 balancing strategies (fill-first, round-robin, P2C, random, least-used, cost-optimized)
- Codex Business Quotas — Business/Team workspace quota monitoring directly in the dashboard
🔌 2. "I need to use multiple providers but each has a different API"
OpenAI uses one format, Claude (Anthropic) uses another, Gemini yet another. If a dev wants to test models from different providers or fallback between them, they need to reconfigure SDKs, change endpoints, deal with incompatible formats. Custom providers (FriendLI, NIM) have non-standard model endpoints.
How OmniRoute solves it:
- Unified Endpoint — A single
http://localhost:20128/v1serves as proxy for all 36+ providers - Format Translation — Automatic and transparent: OpenAI ↔ Claude ↔ Gemini ↔ Responses API
- Response Sanitization — Strips non-standard fields (
x_groq,usage_breakdown,service_tier) that break OpenAI SDK v1.83+ - Role Normalization — Converts
developer→systemfor non-OpenAI providers;system→userfor GLM/ERNIE - Think Tag Extraction — Extracts
<think>blocks from models like DeepSeek R1 into standardizedreasoning_content - Structured Output for Gemini —
json_schema→responseMimeType/responseSchemaautomatic conversion streamdefaults tofalse— Aligns with OpenAI spec, avoiding unexpected SSE in Python/Rust/Go SDKs
🌐 3. "My AI provider blocks my region/country"
Providers like OpenAI/Codex block access from certain geographic regions. Users get errors like unsupported_country_region_territory during OAuth and API connections. This is especially frustrating for developers from developing countries.
How OmniRoute solves it:
- 3-Level Proxy Config — Configurable proxy at 3 levels: global (all traffic), per-provider (one provider only), and per-connection/key
- Color-Coded Proxy Badges — Visual indicators: 🟢 global proxy, 🟡 provider proxy, 🔵 connection proxy, always showing the IP
- OAuth Token Exchange Through Proxy — OAuth flow also goes through the proxy, solving
unsupported_country_region_territory - Connection Tests via Proxy — Connection tests use the configured proxy (no more direct bypass)
- SOCKS5 Support — Full SOCKS5 proxy support for outbound routing
- TLS Fingerprint Spoofing — Browser-like TLS fingerprint via
wreq-jsto bypass bot detection
🆓 4. "I want to use AI for coding but I have no money"
Not everyone can pay $20–200/month for AI subscriptions. Students, devs from emerging countries, hobbyists, and freelancers need access to quality models at zero cost.
How OmniRoute solves it:
- Free Tier Providers Built-in — Native support for 100% free providers: iFlow (8 unlimited models), Qwen (3 unlimited models), Kiro (Claude for free), Gemini CLI (180K/month free)
- Free-Only Combos — Chain
gc/gemini-3-flash → if/kimi-k2-thinking → qw/qwen3-coder-plus= $0/month with zero downtime - NVIDIA NIM Free Credits — 1000 free credits integrated
- Cost Optimized Strategy — Routing strategy that automatically chooses the cheapest available provider
🔒 5. "I need to protect my AI gateway from unauthorized access"
When exposing an AI gateway to the network (LAN, VPS, Docker), anyone with the address can consume the developer's tokens/quota. Without protection, APIs are vulnerable to misuse, prompt injection, and abuse.
How OmniRoute solves it:
- API Key Management — Generation, rotation, and scoping per provider with a dedicated
/dashboard/api-managerpage - Model-Level Permissions — Restrict API keys to specific models (
openai/*, wildcard patterns), with Allow All/Restrict toggle - API Endpoint Protection — Require a key for
/v1/modelsand block specific providers from the listing - Auth Guard + CSRF Protection — All dashboard routes protected with
withAuthmiddleware + CSRF tokens - Rate Limiter — Per-IP rate limiting with configurable windows
- IP Filtering — Allowlist/blocklist for access control
- Prompt Injection Guard — Sanitization against malicious prompt patterns
- AES-256-GCM Encryption — Credentials encrypted at rest
🛑 6. "My provider went down and I lost my coding flow"
AI providers can become unstable, return 5xx errors, or hit temporary rate limits. If a dev depends on a single provider, they're interrupted. Without circuit breakers, repeated retries can crash the application.
How OmniRoute solves it:
- Circuit Breaker per-provider — Auto-open/close with configurable thresholds and cooldown (Closed/Open/Half-Open)
- Exponential Backoff — Progressive retry delays
- Anti-Thundering Herd — Mutex + semaphore protection against concurrent retry storms
- Combo Fallback Chains — If the primary provider fails, automatically falls through the chain with no intervention
- Combo Circuit Breaker — Auto-disables failing providers within a combo chain
- Health Dashboard — Uptime monitoring, circuit breaker states, lockouts, cache stats, p50/p95/p99 latency
🔧 7. "Configuring each AI tool is tedious and repetitive"
Developers use Cursor, Claude Code, Codex CLI, OpenClaw, Gemini CLI, Kilo Code... Each tool needs a different config (API endpoint, key, model). Reconfiguring when switching providers or models is a waste of time.
How OmniRoute solves it:
- CLI Tools Dashboard — Dedicated page with one-click setup for Claude Code, Codex CLI, OpenClaw, Kilo Code, Antigravity, Cline
- GitHub Copilot Config Generator — Generates
chatLanguageModels.jsonfor VS Code with bulk model selection - Onboarding Wizard — Guided 4-step setup for first-time users
- One endpoint, all models — Configure
http://localhost:20128/v1once, access 36+ providers
🔑 8. "Managing OAuth tokens from multiple providers is hell"
Claude Code, Codex, Gemini CLI, Copilot — all use OAuth 2.0 with expiring tokens. Developers need to re-authenticate constantly, deal with client_secret is missing, redirect_uri_mismatch, and failures on remote servers. OAuth on LAN/VPS is particularly problematic.
How OmniRoute solves it:
- Auto Token Refresh — OAuth tokens refresh in background before expiration
- OAuth 2.0 (PKCE) Built-in — Automatic flow for Claude Code, Codex, Gemini CLI, Copilot, Kiro, Qwen, iFlow
- Multi-Account OAuth — Multiple accounts per provider via JWT/ID token extraction
- OAuth LAN/Remote Fix — Private IP detection for
redirect_uri+ manual URL mode for remote servers - OAuth Behind Nginx — Uses
window.location.originfor reverse proxy compatibility - Remote OAuth Guide — Step-by-step guide for Google Cloud credentials on VPS/Docker
📊 9. "I don't know how much I'm spending or where"
Developers use multiple paid providers but have no unified view of spending. Each provider has its own billing dashboard, but there's no consolidated view. Unexpected costs can pile up.
How OmniRoute solves it:
- Cost Analytics Dashboard — Per-token cost tracking and budget management per provider
- Budget Limits per Tier — Spending ceiling per tier that triggers automatic fallback
- Per-Model Pricing Configuration — Configurable prices per model
- Usage Statistics Per API Key — Request count and last-used timestamp per key
- Analytics Dashboard — Stat cards, model usage chart, provider table with success rates and latency
🐛 10. "I can't diagnose errors and problems in AI calls"
When a call fails, the dev doesn't know if it was a rate limit, expired token, wrong format, or provider error. Fragmented logs across different terminals. Without observability, debugging is trial-and-error.
How OmniRoute solves it:
- Unified Logs Dashboard — 4 tabs: Request Logs, Proxy Logs, Audit Logs, Console
- Console Log Viewer — Real-time terminal-style viewer with color-coded levels, auto-scroll, search, filter
- SQLite Proxy Logs — Persistent logs that survive server restarts
- Translator Playground — 4 debugging modes: Playground (format translation), Chat Tester (round-trip), Test Bench (batch), Live Monitor (real-time)
- Request Telemetry — p50/p95/p99 latency + X-Request-Id tracing
- File-Based Logging with Rotation — Console interceptor captures everything to JSON log with size-based rotation
🏗️ 11. "Deploying and maintaining the gateway is complex"
Installing, configuring, and maintaining an AI proxy across different environments (local, VPS, Docker, cloud) is labor-intensive. Problems like hardcoded paths, EACCES on directories, port conflicts, and cross-platform builds add friction.
How OmniRoute solves it:
- npm global install —
npm install -g omniroute && omniroute— done - Docker Multi-Platform — AMD64 + ARM64 native (Apple Silicon, AWS Graviton, Raspberry Pi)
- Docker Compose Profiles —
base(no CLI tools) andcli(with Claude Code, Codex, OpenClaw) - Electron Desktop App — Native app for Windows/macOS/Linux with system tray, auto-start, offline mode
- Split-Port Mode — API and Dashboard on separate ports for advanced scenarios (reverse proxy, container networking)
- Cloud Sync — Config synchronization across devices via Cloudflare Workers
- DB Backups — Automatic backup, restore, export and import of all settings
🌍 12. "The interface is English-only and my team doesn't speak English"
Teams in non-English-speaking countries, especially in Latin America, Asia, and Europe, struggle with English-only interfaces. Language barriers reduce adoption and increase configuration errors.
How OmniRoute solves it:
- Dashboard i18n — 30 Languages — All 500+ keys translated including Arabic, Bulgarian, Danish, German, Spanish, Finnish, French, Hebrew, Hindi, Hungarian, Indonesian, Italian, Japanese, Korean, Malay, Dutch, Norwegian, Polish, Portuguese (PT/BR), Romanian, Russian, Slovak, Swedish, Thai, Ukrainian, Vietnamese, Chinese, Filipino, English
- RTL Support — Right-to-left support for Arabic and Hebrew
- Multi-Language READMEs — 30 complete documentation translations
- Language Selector — Globe icon in header for real-time switching
🔄 13. "I need more than chat — I need embeddings, images, audio"
AI isn't just chat completion. Devs need to generate images, transcribe audio, create embeddings for RAG, rerank documents, and moderate content. Each API has a different endpoint and format.
How OmniRoute solves it:
- Embeddings —
/v1/embeddingswith 6 providers and 9+ models - Image Generation —
/v1/images/generationswith 4 providers and 9+ models - Audio Transcription —
/v1/audio/transcriptions— Whisper-compatible - Text-to-Speech —
/v1/audio/speech— Multi-provider audio synthesis - Moderations —
/v1/moderations— Content safety checks - Reranking —
/v1/rerank— Document relevance reranking - Responses API — Full
/v1/responsessupport for Codex
🧪 14. "I have no way to test and compare quality across models"
Developers want to know which model is best for their use case — code, translation, reasoning — but comparing manually is slow. No integrated eval tools exist.
How OmniRoute solves it:
- LLM Evaluations — Golden set testing with 10 pre-loaded cases covering greetings, math, geography, code generation, JSON compliance, translation, markdown, safety refusal
- 4 Match Strategies —
exact,contains,regex,custom(JS function) - Translator Playground Test Bench — Batch testing with multiple inputs and expected outputs, cross-provider comparison
- Chat Tester — Full round-trip with visual response rendering
- Live Monitor — Real-time stream of all requests flowing through the proxy
📈 15. "I need to scale without losing performance"
As request volume grows, without caching the same questions generate duplicate costs. Without idempotency, duplicate requests waste processing. Per-provider rate limits must be respected.
How OmniRoute solves it:
- Semantic Cache — Two-tier cache (signature + semantic) reduces cost and latency
- Request Idempotency — 5s deduplication window for identical requests
- Rate Limit Detection — Per-provider RPM, min gap, and max concurrent tracking
- Editable Rate Limits — Configurable defaults in Settings → Resilience with persistence
- API Key Validation Cache — 3-tier cache for production performance
- Health Dashboard with Telemetry — p50/p95/p99 latency, cache stats, uptime
🤖 16. "I want to control model behavior globally"
Developers who want all responses in a specific language, with a specific tone, or want to limit reasoning tokens. Configuring this in every tool/request is impractical.
How OmniRoute solves it:
- System Prompt Injection — Global prompt applied to all requests
- Thinking Budget Validation — Reasoning token allocation control per request (passthrough, auto, custom, adaptive)
- 6 Routing Strategies — Global strategies that determine how requests are distributed
- Wildcard Router —
provider/*patterns route dynamically to any provider - Combo Enable/Disable Toggle — Toggle combos directly from the dashboard
- Provider Toggle — Enable/disable all connections for a provider with one click
- Blocked Providers — Exclude specific providers from
/v1/modelslisting
1. Инсталирайте глобално:
npm install -g omniroute
omniroute🎉 Таблото за управление се отваря на http://localhost:20128
| Команда | Описание |
|---|---|
omniroute |
Стартирайте сървър (порт по подразбиране 20128) |
omniroute --port 3000 |
Използвайте персонализиран порт |
omniroute --no-open |
Без автоматично отваряне на браузъра |
omniroute --help |
Показване на помощ |
2. Свържете БЕЗПЛАТЕН доставчик:
Табло → Доставчици → Свържете Claude Code или Antigravity → OAuth влизане → Готово!
3. Използвайте във вашия CLI инструмент:
Claude Code/Codex/Gemini CLI/OpenClaw/Cursor/Cline Settings:
Endpoint: http://localhost:20128/v1
API Key: [copy from dashboard]
Model: if/kimi-k2-thinking
Това е! Започнете да кодирате с БЕЗПЛАТНИ AI модели.
Алтернатива — стартиране от източника:
cp .env.example .env
npm install
PORT=20128 NEXT_PUBLIC_BASE_URL=http://localhost:20128 npm run devOmniRoute е наличен като публично изображение на Docker на Docker Hub.
Бързо бягане:
docker run -d \
--name omniroute \
--restart unless-stopped \
-p 20128:20128 \
-v omniroute-data:/app/data \
diegosouzapw/omniroute:latestС файл на средата:
# Copy and edit .env first
cp .env.example .env
docker run -d \
--name omniroute \
--restart unless-stopped \
--env-file .env \
-p 20128:20128 \
-v omniroute-data:/app/data \
diegosouzapw/omniroute:latestИзползване на Docker Compose:
# Base profile (no CLI tools)
docker compose --profile base up -d
# CLI profile (Claude Code, Codex, OpenClaw built-in)
docker compose --profile cli up -d| Изображение | Етикет | Размер | Описание |
|---|---|---|---|
diegosouzapw/omniroute |
latest |
~250MB | Най-новата стабилна версия |
diegosouzapw/omniroute |
1.0.3 |
~250MB | Текуща версия |
🆕 NEW! OmniRoute is now available as a native desktop application for Windows, macOS, and Linux.
- 🖥️ Native Window — Dedicated app window with system tray integration
- 🔄 Auto-Start — Launch OmniRoute on system login
- 🔔 Native Notifications — Get alerts for quota exhaustion or provider issues
- ⚡ One-Click Install — NSIS (Windows), DMG (macOS), AppImage (Linux)
- 🌐 Offline Mode — Works fully offline with bundled server
npm run electron:dev # Development mode
npm run electron:build # Current platform
npm run electron:build:win # Windows (.exe)
npm run electron:build:mac # macOS (.dmg)
npm run electron:build:linux # Linux (.AppImage)📖 Full documentation: electron/README.md
| Ниво | Доставчик | Цена | Нулиране на квота | Най-добро за |
|---|---|---|---|---|
| 💳 АБОНАМЕНТ | Claude Code (Pro) | $20/месец | 5 часа + седмично | Вече сте абонирани |
| Codex (Plus/Pro) | $20-200/месец | 5 часа + седмично | Потребители на OpenAI | |
| Gemini CLI | БЕЗПЛАТНО | 180K/месец + 1K/ден | всички! | |
| Копилот на GitHub | $10-19/месец | Месечно | Потребители на GitHub | |
| 🔑 КЛЮЧ ЗА API | NVIDIA NIM | БЕЗПЛАТНО (1000 кредита) | Еднократно | Безплатно ниво тестване |
| DeepSeek | Плащане при използване | Няма | Най-добра цена/качество | |
| Groq | Безплатно ниво + платено | Ограничена скорост | Свръхбърз извод | |
| xAI (Grok) | Плащане при използване | Няма | Grok модели | |
| Мистрал | Безплатно ниво + платено | Ограничена скорост | Европейски AI | |
| OpenRouter | Плащане при използване | Няма | 100+ модела | |
| 💰 ЕВТИНО | GLM-4.7 | $0,6/1 милион | Ежедневно 10 сутринта | Резервно копие на бюджета |
| MiniMax M2.1 | $0,2/1 милион | 5-часово търкаляне | Най-евтиният вариант | |
| Кими К2 | $9/месец апартамент | 10 милиона токена/месец | Предвидими разходи | |
| 🆓 БЕЗПЛАТНО | iFlow | $0 | Неограничен | 8 модела безплатно |
| Куен | $0 | Неограничен | 3 модела безплатно | |
| Киро | $0 | Неограничен | Клод безплатно |
💡 Професионален съвет: Започнете с Gemini CLI (180K безплатно/месец) + iFlow (неограничено безплатно) комбинация = $0 цена!
| Характеристика | Какво прави |
|---|---|
| 🎯 Интелигентен 4-степенен резервен вариант | Автоматичен маршрут: Абонамент → API ключ → Евтини → Безплатно |
| 📊 Проследяване на квоти в реално време | Брой токени на живо + нулиране на обратното броене на доставчик |
| 🔄 Форматиране на превода | OpenAI ↔ Клод ↔ Близнаци ↔ Курсор ↔ Киро безпроблемно + дезинфекция на отговора |
| 👥 Поддръжка за множество акаунти | Няколко акаунта на доставчик с интелигентен избор |
| 🔄 Автоматично опресняване на токени | OAuth токените се опресняват автоматично с повторен опит |
| 🎨 Персонализирани комбинации | 6 стратегии: първо попълване, кръгова система, p2c, произволна, най-малко използвана, оптимизирана по отношение на разходите |
| 🧩 Персонализирани модели | Добавете всеки модел ID към който и да е доставчик |
| 🌐 Wildcard Router | Насочвайте provider/* шаблони към всеки доставчик динамично |
| 🧠 Мислен бюджет | Преминаване, автоматичен, персонализиран и адаптивен режим за модели на разсъждение |
| 🔀 Model Aliases | Auto-forward deprecated model IDs to current replacements (built-in + custom) |
| ⚡ Background Degradation | Auto-route background tasks (titles, summaries) to cheaper models |
| 💬 Системно бързо инжектиране | Глобална системна подкана, приложена към всички заявки |
| 📄 API за отговори | Пълна поддръжка на OpenAI Responses API (/v1/responses) за Codex |
| Характеристика | Какво прави |
|---|---|
| 🖼️ Генериране на изображения | /v1/images/generations — 4 доставчика, 9+ модела |
| 📐 Вграждания | /v1/embeddings — 6 доставчика, 9+ модела |
| 🎤 Аудио транскрипция | /v1/audio/transcriptions — Съвместим с Whisper |
| 🔊 Текст към говор | /v1/audio/speech — Синтез на аудио с множество доставчици |
| 🛡️ Модерации | /v1/moderations — Проверки за безопасност на съдържанието |
| 🔀 Прекласиране | /v1/rerank — Прекласиране на уместността на документа |
| Характеристика | Какво прави |
|---|---|
| 🔌 Прекъсвач | Автоматично отваряне/затваряне за всеки доставчик с конфигурируеми прагове |
| 🛡️ Anti-Thundering Herd | Mutex + ограничение на скоростта на семафор за доставчици на API ключ |
| 🧠 Семантичен кеш | Двуслоен кеш (подпис + семантичен) намалява разходите и забавянето |
| ⚡ Искане на идемпотентност | 5s прозорец за дедупиране за дублирани заявки |
| 🔒 TLS Fingerprint Spoofing | Заобикаляне на TLS-базирано откриване на бот чрез wreq-js |
| 🌐 IP филтриране | Списък с разрешени/блокирани за контрол на достъпа до API |
| 📊 Редактируеми ограничения на скоростта | Конфигурируеми обороти в минута, минимална разлика и максимална едновременност на системно ниво |
| 💾 Rate Limit Persistence | Learned limits survive restarts via SQLite with 60s debounce + 24h staleness |
| 🔄 Token Refresh Resilience | Per-provider circuit breaker (5 fails→30min) + 30s timeout per attempt |
| 🛡 API Endpoint Protection | Удостоверяване + блокиране на доставчик за крайната точка /models |
| 🔒 Прокси видимост | Цветно кодирани значки: 🟢 глобален, 🟡 доставчик, 🔵 за връзка с IP дисплей |
| 🌐 3-ниво на прокси конфигурация | Конфигуриране на прокси сървъри на глобално ниво, на ниво доставчик или на ниво връзка |
| Характеристика | Какво прави |
|---|---|
| 📝 Заявка за регистриране | Режим на отстраняване на грешки с пълни журнали за заявки/отговори |
| 💾 SQLite прокси регистрационни файлове | Постоянните регистрационни файлове на прокси сървъра преживяват рестартиране на сървър |
| 📊 Табло за управление на анализи | Задвижва се от Recharts: статистически карти, диаграма за използване на модели, таблица на доставчик |
| 📈 Проследяване на напредъка | Включване на събития за прогрес на SSE за стрийминг |
| 🧪 Оценки на LLM | Тестване на златен сет с 4 стратегии за мач |
| 🔍 Заявка за телеметрия | p50/p95/p99 агрегиране на латентност + проследяване на X-Request-Id |
| 📋 Табло за управление на регистрационни файлове | Унифицирана страница с 4 раздела: регистрационни файлове на заявки, регистрационни файлове на прокси, регистрационни файлове за одит, конзола |
| 🖥️ Console Log Viewer | Визуализатор в стил терминал в реално време с филтър за ниво, търсене, автоматично превъртане |
| 📑 Регистриране на базата на файлове | Прихващачът на конзолата улавя целия изход в JSON лог файл с ротация |
| 🏥 Здравно табло | Работно време на системата, състояния на прекъсвачи, блокировки, статистика на кеша |
| 💰 Проследяване на разходите | Управление на бюджета + конфигурация на ценообразуване за модел |
| Характеристика | Какво прави |
|---|---|
| 💾 Синхронизиране в облак | Синхронизирайте конфигурацията между устройства чрез Cloudflare Workers |
| 🌐 Разполагане навсякъде | Localhost, VPS, Docker, Cloudflare Workers |
| 🔑 API Key Management | Генериране, завъртане и обхват на API ключове за всеки доставчик |
| 🧙 Съветник за присъединяване | Насочвана настройка в 4 стъпки за потребители за първи път |
| 🔧 CLI Tools Dashboard | Конфигурирайте с едно кликване Claude, Codex, Cline, OpenClaw, Kilo, Antigravity |
| 🔄 Архивиране на DB | Автоматично архивиране, възстановяване, експортиране и импортиране за всички настройки |
| 🌐 Интернационализация | Пълен i18n с next-intl — поддръжка на английски + португалски (Бразилия) |
| 🌍 Избор на език | Икона на глобус в заглавката за превключване на език в реално време (🇺🇸/🇧🇷) |
| 📂 Директория с персонализирани данни | DATA_DIR env променлива за замяна на пътя за съхранение по подразбиране ~/.omniroute |
📖 Подробности за функцията
Създавайте комбинации с автоматичен резервен вариант:
Combo: "my-coding-stack"
1. cc/claude-opus-4-6 (your subscription)
2. nvidia/llama-3.3-70b (free NVIDIA API)
3. glm/glm-4.7 (cheap backup, $0.6/1M)
4. if/kimi-k2-thinking (free fallback)
→ Auto switches when quota runs out or errors occur
- Консумация на токени на доставчик
- Нулиране на обратното броене (5 часа, ежедневно, седмично)
- Оценка на разходите за платени нива
- Месечни отчети за разходите
Безпроблемен превод между формати:
- OpenAI ↔ Клод ↔ Близнаци ↔ Отговори на OpenAI
- Вашият CLI инструмент изпраща OpenAI формат → OmniRoute превежда → Доставчикът получава собствен формат
- Работи с всеки инструмент, който поддържа персонализирани крайни точки на OpenAI
- Дезифициране на отговора — Премахва нестандартните полета за стриктна съвместимост с OpenAI SDK
- Нормализиране на ролята —
developer→systemза не-OpenAI;system→userза GLM/ERNIE модели - Извличане на мислене на тагове —
<think>блокове →reasoning_contentза мислещи модели - Структуриран изход —
json_schema→responseMimeType/responseSchemaна Gemini
- Добавете няколко акаунта на доставчик
- Автоматично кръгово или базирано на приоритет маршрутизиране
- Връщане към следващия акаунт, когато някой достигне квотата
- OAuth токените се опресняват автоматично преди изтичане
- Не е необходимо ръчно повторно удостоверяване
- Безпроблемно изживяване при всички доставчици
- Създавайте неограничени комбинации от модели
- 6 стратегии: първо попълване, кръгъл-робин, сила на два избора, произволна, най-малко използвана, оптимизирана по отношение на разходите
- Споделяйте комбинации между устройства с Cloud Sync
- Състояние на системата (време на работа, версия, използване на паметта)
- Състояния на прекъсвача за всеки доставчик (затворен/отворен/полуотворен)
- Състояние на ограничение на скоростта и активни блокировки
- Статистика за кеша на подписите
- Телеметрия за забавяне (p50/p95/p99) + кеш за подкани
- Нулирайте здравословното състояние с едно щракване
OmniRoute включва мощна вградена игра за преводачи с 4 режима за отстраняване на грешки, тестване и наблюдение на API преводи:
| Режим | Описание |
|---|---|
| 💻 Детска площадка | Директен превод на формат — поставете всяко тяло на заявка за API и незабавно вижте как OmniRoute го превежда между формати на доставчик (OpenAI ↔ Claude ↔ Gemini ↔ Responses API). Включва примерни шаблони и автоматично откриване на формати. |
| 💬 Тестер за чат | Изпращайте реални заявки за чат чрез OmniRoute и вижте пълното пътуване: вашият вход, преведената заявка, отговорът на доставчика и преведеният отговор обратно. Безценен за валидиране на комбинирано маршрутизиране. |
| 🧪 Тестова стенда | Режим на пакетно тестване — дефинирайте множество тестови случаи с различни входове и очаквани изходи, стартирайте ги всички наведнъж и сравнете резултатите между доставчици и модели. |
| 📱 Монитор на живо | Мониторинг на заявки в реално време — наблюдавайте входящите заявки, докато преминават през OmniRoute, вижте преводите на формати, които се случват на живо, и незабавно идентифицирайте проблемите. |
Достъп: Табло за управление → Преводач (странична лента)
- Синхронизиране на доставчици, комбинации и настройки на всички устройства
- Автоматична фонова синхронизация
- Сигурно криптирано съхранение
Проблем: Квотата изтича неизползвана, ограничения на скоростта по време на тежко кодиране
Combo: "maximize-claude"
1. cc/claude-opus-4-6 (use subscription fully)
2. glm/glm-4.7 (cheap backup when quota out)
3. if/kimi-k2-thinking (free emergency fallback)
Monthly cost: $20 (subscription) + ~$5 (backup) = $25 total
vs. $20 + hitting limits = frustration
Проблем: Не мога да си позволя абонаменти, имам нужда от надеждно AI кодиране
Combo: "free-forever"
1. gc/gemini-3-flash (180K free/month)
2. if/kimi-k2-thinking (unlimited free)
3. qw/qwen3-coder-plus (unlimited free)
Monthly cost: $0
Quality: Production-ready models
Проблем: Крайни срокове, не мога да си позволя престой
Combo: "always-on"
1. cc/claude-opus-4-6 (best quality)
2. cx/gpt-5.2-codex (second subscription)
3. glm/glm-4.7 (cheap, resets daily)
4. minimax/MiniMax-M2.1 (cheapest, 5h reset)
5. if/kimi-k2-thinking (free unlimited)
Result: 5 layers of fallback = zero downtime
Проблем: Имате нужда от AI асистент в приложенията за съобщения, напълно безплатно
Combo: "openclaw-free"
1. if/glm-4.7 (unlimited free)
2. if/minimax-m2.1 (unlimited free)
3. if/kimi-k2-thinking (unlimited free)
Monthly cost: $0
Access via: WhatsApp, Telegram, Slack, Discord, iMessage, Signal...
💳 Доставчици на абонамент
Dashboard → Providers → Connect Claude Code
→ OAuth login → Auto token refresh
→ 5-hour + weekly quota tracking
Models:
cc/claude-opus-4-6
cc/claude-sonnet-4-5-20250929
cc/claude-haiku-4-5-20251001Професионален съвет: Използвайте Opus за сложни задачи, Sonnet за скорост. OmniRoute проследява квота за модел!
Dashboard → Providers → Connect Codex
→ OAuth login (port 1455)
→ 5-hour + weekly reset
Models:
cx/gpt-5.2-codex
cx/gpt-5.1-codex-maxDashboard → Providers → Connect Gemini CLI
→ Google OAuth
→ 180K completions/month + 1K/day
Models:
gc/gemini-3-flash-preview
gc/gemini-2.5-proНай-добра стойност: Огромно безплатно ниво! Използвайте това преди платените нива.
Dashboard → Providers → Connect GitHub
→ OAuth via GitHub
→ Monthly reset (1st of month)
Models:
gh/gpt-5
gh/claude-4.5-sonnet
gh/gemini-3-pro🔑 API Key Providers
- Регистрирайте се: build.nvidia.com
- Вземете безплатен API ключ (включени 1000 кредита за изводи)
- Табло → Добавяне на доставчик → NVIDIA NIM:
- API ключ:
nvapi-your-key
- API ключ:
Модели: nvidia/llama-3.3-70b-instruct, nvidia/mistral-7b-instruct и още 50+
Професионален съвет: OpenAI-съвместим API — работи безпроблемно с превода на формати на OmniRoute!
- Регистрирайте се: platform.deepseek.com
- Вземете API ключ
- Табло → Добавяне на доставчик → DeepSeek
Модели: deepseek/deepseek-chat, deepseek/deepseek-coder
- Регистрирайте се: console.groq.com
- Вземете API ключ (включено безплатно ниво)
- Табло → Добавяне на доставчик → Groq
Модели: groq/llama-3.3-70b, groq/mixtral-8x7b
Професионален съвет: Изключително бърз извод — най-добър за кодиране в реално време!
- Регистрирайте се: openrouter.ai
- Вземете API ключ
- Табло → Добавяне на доставчик → OpenRouter
Модели: Достъп до 100+ модела от всички основни доставчици чрез един API ключ.
💰 Евтини доставчици (резервни)
- Регистрирайте се: Zhipu AI
- Вземете API ключ от Coding Plan
- Табло → Добавяне на API ключ:
- Доставчик:
glm - API ключ:
your-key
- Доставчик:
Използване: glm/glm-4.7
Професионален съвет: Планът за кодиране предлага 3× квота на цена 1/7! Нулирайте всеки ден в 10:00 ч.
- Регистрирайте се: MiniMax
- Вземете API ключ
- Табло → Добавяне на API ключ
Използване: minimax/MiniMax-M2.1
Професионален съвет: Най-евтината опция за дълъг контекст (1M токени)!
- Абонирайте се: Moonshot AI
- Вземете API ключ
- Табло → Добавяне на API ключ
Използване: kimi/kimi-latest
Професионален съвет: Фиксирани $9/месец за 10 милиона токена = $0,90/1 милион ефективна цена!
🆓 БЕЗПЛАТНИ доставчици (Спешно архивиране)
Dashboard → Connect iFlow
→ iFlow OAuth login
→ Unlimited usage
Models:
if/kimi-k2-thinking
if/qwen3-coder-plus
if/glm-4.7
if/minimax-m2
if/deepseek-r1Dashboard → Connect Qwen
→ Device code authorization
→ Unlimited usage
Models:
qw/qwen3-coder-plus
qw/qwen3-coder-flashDashboard → Connect Kiro
→ AWS Builder ID or Google/GitHub
→ Unlimited usage
Models:
kr/claude-sonnet-4.5
kr/claude-haiku-4.5🎨 Създаване на комбинации
Dashboard → Combos → Create New
Name: premium-coding
Models:
1. cc/claude-opus-4-6 (Subscription primary)
2. glm/glm-4.7 (Cheap backup, $0.6/1M)
3. minimax/MiniMax-M2.1 (Cheapest fallback, $0.20/1M)
Use in CLI: premium-coding
Name: free-combo
Models:
1. gc/gemini-3-flash-preview (180K free/month)
2. if/kimi-k2-thinking (unlimited)
3. qw/qwen3-coder-plus (unlimited)
Cost: $0 forever!
🔧 CLI интеграция
Settings → Models → Advanced:
OpenAI API Base URL: http://localhost:20128/v1
OpenAI API Key: [from OmniRoute dashboard]
Model: cc/claude-opus-4-6
Използвайте страницата CLI Tools в таблото за управление за конфигурация с едно кликване или редактирайте ~/.claude/settings.json ръчно.
export OPENAI_BASE_URL="http://localhost:20128"
export OPENAI_API_KEY="your-omniroute-api-key"
codex "your prompt"Вариант 1 — Табло (препоръчително):
Dashboard → CLI Tools → OpenClaw → Select Model → Apply
Опция 2 — Ръчно: Редактиране ~/.openclaw/openclaw.json:
{
"models": {
"providers": {
"omniroute": {
"baseUrl": "http://127.0.0.1:20128/v1",
"apiKey": "sk_omniroute",
"api": "openai-completions"
}
}
}
}Забележка: OpenClaw работи само с локален OmniRoute. Използвайте
127.0.0.1вместоlocalhost, за да избегнете проблеми с разрешаването на IPv6.
Settings → API Configuration:
Provider: OpenAI Compatible
Base URL: http://localhost:20128/v1
API Key: [from OmniRoute dashboard]
Model: if/kimi-k2-thinking
OmniRoute включва вградена рамка за оценка за тестване на качеството на отговора на LLM спрямо златен набор. Достъп до него чрез Analytics → Evals в таблото за управление.
Предварително зареденият "OmniRoute Golden Set" съдържа 10 тестови случая, покриващи:
- Поздрави, математика, география, генериране на код
- Съответствие с JSON формат, превод, маркдаун
- Отказ за безопасност (вредно съдържание), броене, булева логика
| Стратегия | Описание | Пример |
|---|---|---|
exact |
Изходът трябва да съвпада точно | "4" |
contains |
Изходът трябва да съдържа подниз (без значение за малки и големи букви) | "Paris" |
regex |
Изходът трябва да съответства на модела на регулярен израз | "1.*2.*3" |
custom |
Персонализираната JS функция връща true/false | (output) => output.length > 10 |
Щракнете, за да разширите ръководството за отстраняване на неизправности
„Езиковият модел не предостави съобщения“
- Квотата на доставчика е изчерпана → Проверете инструмента за проследяване на квотата на таблото за управление
- Решение: Използвайте комбо резервен вариант или преминете към по-евтино ниво
Ограничаване на скоростта
- Изчерпване на квотата за абонамент → Резервно връщане към GLM/MiniMax
- Добавяне на комбинация:
cc/claude-opus-4-6 → glm/glm-4.7 → if/kimi-k2-thinking
OAuth токенът е изтекъл
- Автоматично опресняване от OmniRoute
- Ако проблемите продължават: Табло → Доставчик → Повторно свързване
Високи разходи
- Проверете статистическите данни за използването в Табло → Разходи
- Превключете основния модел към GLM/MiniMax
- Използвайте безплатно ниво (Gemini CLI, iFlow) за некритични задачи
Таблото се отваря на грешен порт
- Задайте
PORT=20128иNEXT_PUBLIC_BASE_URL=http://localhost:20128
Грешки при синхронизиране в облак
- Потвърдете, че
BASE_URLсочи към вашия работещ екземпляр - Проверете
CLOUD_URLточки към вашата очаквана крайна точка в облака - Поддържайте стойностите на
NEXT_PUBLIC_*в съответствие със стойностите от страната на сървъра
Първото влизане не работи
- Проверете
INITIAL_PASSWORDв.env - Ако не е зададена, резервната парола е
123456
Няма регистрационни файлове за заявки
- Задайте
ENABLE_REQUEST_LOGS=trueв.env
Тестът за връзка показва „Невалидно“ за OpenAI-съвместими доставчици
- Много доставчици не излагат
/modelsкрайна точка - OmniRoute v1.0.6+ включва резервно валидиране чрез завършвания на чат
- Уверете се, че основният URL адрес включва суфикс
/v1
⚠️ ВАЖНО за ползване на OmniRoute em VPS/Docker/servidor remoto
Доставчиците на Antigravity и Gemini CLI използват Google OAuth 2.0 за удостоверяване. Google изисква, че redirect_uri не използва fluxo OAuth като exatamente, когато URI адресите преди кадастрада не са в приложение на Google Cloud Console.
Като удостоверение за OAuth не е OmniRoute estão cadastradas apenas para localhost. Ако имате достъп до OmniRoute в дистанционния сървър (напр.: https://omniroute.meuservidor.com), или Google rejeita a autenticação com:
Error 400: redirect_uri_mismatch
Изпишете точно OAuth 2.0 Client ID без Google Cloud Console чрез URI на вашия сървър.
1. Достъп до Google Cloud Console
Abra: https://console.cloud.google.com/apis/credentials
2. Crie um novo OAuth 2.0 Client ID
- Кликнете върху "+ Създаване на идентификационни данни" → "OAuth клиентски идентификатор"
- Tipo de aplicativo: "Уеб приложение"
- Име: escolha qualquer име (напр.:
OmniRoute Remote)
3. Adicione като оторизирани URI адреси за пренасочване
Без поле „Оторизирани URI адреси за пренасочване“, добавете:
https://seu-servidor.com/callback
Замяна на
seu-servidor.comдомейн или IP на вашия сървър (включително необходим порт, напр.:http://45.33.32.156:20128/callback).
4. Salve e copie as credenciais
Например, Google показва Клиентски идентификатор и Клиентска тайна.
5. Конфигуриране като variáveis de ambiente
Няма .env (или нашите варианти на средата на Docker):
# Para Antigravity:
ANTIGRAVITY_OAUTH_CLIENT_ID=seu-client-id.apps.googleusercontent.com
ANTIGRAVITY_OAUTH_CLIENT_SECRET=GOCSPX-seu-secret
# Para Gemini CLI:
GEMINI_OAUTH_CLIENT_ID=seu-client-id.apps.googleusercontent.com
GEMINI_OAUTH_CLIENT_SECRET=GOCSPX-seu-secret
GEMINI_CLI_OAUTH_CLIENT_SECRET=GOCSPX-seu-secret6. Reinicie o OmniRoute
# Se usando npm:
npm run dev
# Se usando Docker:
docker restart omniroute7. Tente conectar novamente
Табло → Доставчици → Антигравитация (или Gemini CLI) → OAuth
Agora или Google пренасочва корекции за https://seu-servidor.com/callback и функционира автентичност.
Se não quiser criar credenciais próprias agora, ainda é possível usar o fluxo manual de URL:
- O OmniRoute премахва URL адрес за авторизация от Google
- Ако не разрешите, пренасочването на Google е пренасочено към
localhost(което не е отдалечено от сървъра) - Копирайте пълния URL адрес от страницата, която искате да прехвърлите в своя браузър (mesmo que a página não carregue)
- Cole essa URL no campo que aparece no modal de conexão do OmniRoute
- Щракнете върху "Свързване"
Това заобиколно решение функционира, ако кодът на авторизацията на URL е валиден независимо от пренасочването към пренасочване или не.
- Време на изпълнение: Node.js 18–22 LTS (
⚠️ Node.js 24+ не се поддържа — родните двоични файловеbetter-sqlite3са несъвместими) - Език: TypeScript 5.9 — 100% TypeScript в
src/иopen-sse/(v1.0.6) - Framework: Next.js 16 + React 19 + Tailwind CSS 4
- База данни: LowDB (JSON) + SQLite (състояние на домейна + регистрационни файлове на прокси)
- Поточно предаване: Изпратени от сървъра събития (SSE)
- Auth: OAuth 2.0 (PKCE) + JWT + API ключове
- Тестване: Node.js тестов инструмент (368+ единични теста)
- CI/CD: Действия на GitHub (автоматично публикуване на npm + Docker Hub при пускане)
- Уебсайт: omniroute.online
- Пакет: npmjs.com/package/omniroute
- Docker: hub.docker.com/r/diegosouzapw/omniroute
- Устойчивост: прекъсвач на веригата, експоненциално отдръпване, анти-гръмотевично стадо, TLS спуфинг
| Документ | Описание |
|---|---|
| User Guide | Доставчици, комбинации, CLI интеграция, внедряване |
| API Reference | Всички крайни точки с примери |
| Troubleshooting | Често срещани проблеми и решения |
| Architecture | Системна архитектура и вътрешност |
| Contributing | Настройка и насоки за разработка |
| OpenAPI Spec | Спецификация на OpenAPI 3.0 |
| Security Policy | Отчитане на уязвимости и практики за сигурност |
| VM Deployment | Пълно ръководство: Настройка на VM + nginx + Cloudflare |
| Features Gallery | Визуална обиколка на таблото с екранни снимки |
Щракнете, за да видите екранни снимки на таблото за управление
| Страница | Екранна снимка |
|---|---|
| Доставчици | ![]() |
| Комбота | ![]() |
| Анализ | ![]() |
| Здраве | ![]() |
| Преводач | ![]() |
| Настройки | ![]() |
| CLI инструменти | ![]() |
| Дневници за използване | ![]() |
| Крайна точка | ![]() |
OmniRoute има планирани 210+ функции в множество фази на разработка. Ето основните области:
| Категория | Планирани функции | Акценти |
|---|---|---|
| 🧠 Маршрутизиране и разузнаване | 25+ | Маршрутизиране с най-ниска латентност, маршрутизиране на базата на маркери, предварителен полет на квота, избор на P2C акаунт |
| 🔒 Сигурност и съответствие | 20+ | SSRF укрепване, прикриване на идентификационни данни, ограничение на скоростта за крайна точка, обхват на ключ за управление |
| 📊 Наблюдаемост | 15+ | OpenTelemetry интеграция, мониторинг на квоти в реално време, проследяване на разходите за модел |
| 🔄 Интеграции на доставчици | 20+ | Регистър на динамичен модел, изчакване на доставчика, Codex за множество акаунти, анализ на квота на Copilot |
| ⚡ Изпълнение | 15+ | Слой с двоен кеш, кеш за подкани, кеш за отговор, поддържане на активността при поточно предаване, партиден API |
| 🌐 Екосистема | 10+ | WebSocket API, горещо презареждане на конфигурация, разпределено хранилище за конфигурация, търговски режим |
- 🔗 OpenCode Integration — Поддръжка на родния доставчик за IDE за кодиране OpenCode AI
- 🔗 TRAE Integration — Пълна поддръжка за рамката за разработка на TRAE AI
- 📦 Batch API — Асинхронна групова обработка за групови заявки
- 🎯 Маршрутизиране на базата на етикети — Маршрутизирайте заявки въз основа на персонализирани тагове и метаданни
- 💰 Стратегия с най-ниска цена — Автоматично изберете най-евтиния наличен доставчик
📝 Пълните спецификации на функциите са налични в link (217 подробни спецификации)
💬 Присъединете се към нашата общност! WhatsApp Group — Получете помощ, споделете съвети и бъдете в течение.
- Уебсайт: omniroute.online
- GitHub: github.com/diegosouzapw/OmniRoute
- Проблеми: github.com/diegosouzapw/OmniRoute/issues
- WhatsApp: Community Group
- Оригинален проект: 9router by decolua
- Разклонете хранилището
- Създайте свой клон на функции (
git checkout -b feature/amazing-feature) - Задайте вашите промени (
git commit -m 'Add amazing feature') - Натиснете до клона (
git push origin feature/amazing-feature) - Отворете заявка за изтегляне
Вижте CONTRIBUTING.md за подробни насоки.
# Create a release — npm publish happens automatically
gh release create v1.0.6 --title "v1.0.6" --generate-notesСпециални благодарности на 9router от decolua — оригиналният проект, който вдъхнови това разклонение. OmniRoute се основава на тази невероятна основа с допълнителни функции, мултимодални API и пълно пренаписване на TypeScript.
Специални благодарности на CLIProxyAPI — оригиналната реализация на Go, която вдъхнови този JavaScript порт.
Лиценз на MIT – вижте LICENSE за подробности.
omniroute.online








