🚀 OmniRoute — Ang Libreng AI Gateway

Huwag kailanman ihinto ang coding. Smart routing sa LIBRE at murang mga modelo ng AI na may awtomatikong fallback.

Iyong unibersal na API proxy — isang endpoint, 36+ provider, zero downtime.

Mga Pagkumpleto ng Chat • Mga Pag-embed • Pagbuo ng Imahe • Audio • Pag-rerank • 100% TypeScript

🤖 Libreng AI Provider para sa iyong mga paboritong coding agent

Ikonekta ang anumang AI-powered IDE o CLI tool sa pamamagitan ng OmniRoute — libreng API gateway para sa walang limitasyong coding.

OpenClaw _{⭐ 205K}	NanoBot _{⭐ 20.9K}	PicoClaw _{⭐ 14.6K}	ZeroClaw _{⭐ 9.9K}	IronClaw _{⭐ 2.1K}
OpenCode _{⭐ 106K}	Codex CLI _{⭐ 60.8K}	Claude Code _{⭐ 67.3K}	Gemini CLI _{⭐ 94.7K}	Kilo Code _{⭐ 15.5K}

_{📡 Kumonekta ang lahat ng ahente sa pamamagitan ng http://localhost:20128/v1 o http://cloud.omniroute.online/v1 >http://cloud.omniroute.online/v1 —iisang modelo at hindi config. quota}








🌐 Website • 🚀 Quick Start • 💡 Features • 📖 Docs • 💰 Pricing • 💬 WhatsApp
🌐 Available in: 🇺🇸 English | 🇧🇷 Português (Brasil) | 🇪🇸 Español | 🇫🇷 Français | 🇮🇹 Italiano | 🇷🇺 Русский | 🇨🇳 中文 (简体) | 🇩🇪 Deutsch | 🇮🇳 हिन्दी | 🇹🇭 ไทย | 🇺🇦 Українська | 🇸🇦 العربية | 🇯🇵 日本語 | 🇻🇳 Tiếng Việt | 🇧🇬 Български | 🇩🇰 Dansk | 🇫🇮 Suomi | 🇮🇱 עברית | 🇭🇺 Magyar | 🇮🇩 Bahasa Indonesia | 🇰🇷 한국어 | 🇲🇾 Bahasa Melayu | 🇳🇱 Nederlands | 🇳🇴 Norsk | 🇵🇹 Português (Portugal) | 🇷🇴 Română | 🇵🇱 Polski | 🇸🇰 Slovenčina | 🇸🇪 Svenska | 🇵🇭 Filipino



🤔 Bakit OmniRoute?

Ihinto ang pag-aaksaya ng pera at pag-abot sa mga limitasyon:

 Mag-e-expire ang quota ng subscription na hindi nagamit bawat buwan
 Pinipigilan ka ng mga limitasyon sa rate sa mid-coding
 Mga Mamahaling API ($20-50/buwan bawat provider)
 Manu-manong paglipat sa pagitan ng mga provider

Sumalutas ito ng OmniRoute:

✅ I-maximize ang mga subscription - Subaybayan ang quota, gamitin ang bawat bit bago i-reset
✅ Auto fallback - Subscription → API Key → Mura → Libre, zero downtime
✅ Multi-account - Round-robin sa pagitan ng mga account sa bawat provider
✅ Universal - Gumagana sa Claude Code, Codex, Gemini CLI, Cursor, Cline, OpenClaw, anumang CLI tool


🔄 Paano Ito Gumagana

┌─────────────┐
│  Your CLI   │  (Claude Code, Codex, Gemini CLI, OpenClaw, Cursor, Cline...)
│   Tool      │
└──────┬──────┘
       │ http://localhost:20128/v1
       ↓
┌─────────────────────────────────────────┐
│           OmniRoute (Smart Router)        │
│  • Format translation (OpenAI ↔ Claude) │
│  • Quota tracking + Embeddings + Images │
│  • Auto token refresh                   │
└──────┬──────────────────────────────────┘
       │
       ├─→ [Tier 1: SUBSCRIPTION] Claude Code, Codex, Gemini CLI
       │   ↓ quota exhausted
       ├─→ [Tier 2: API KEY] DeepSeek, Groq, xAI, Mistral, NVIDIA NIM, etc.
       │   ↓ budget limit
       ├─→ [Tier 3: CHEAP] GLM ($0.6/1M), MiniMax ($0.2/1M)
       │   ↓ budget limit
       └─→ [Tier 4: FREE] iFlow, Qwen, Kiro (unlimited)

Result: Never stop coding, minimal cost


🎯 What OmniRoute Solves — 16 Real Pain Points


Every developer using AI tools faces these problems daily. OmniRoute was built to solve them all — from cost overruns to regional blocks, from broken OAuth flows to zero observability.


💸 1. "I pay for an expensive subscription but still get interrupted by limits"
Developers pay $20–200/month for Claude Pro, Codex Pro, or GitHub Copilot. Even paying, quota has a ceiling — 5h of usage, weekly limits, or per-minute rate limits. Mid-coding session, the provider stops responding and the developer loses flow and productivity.
How OmniRoute solves it:

Smart 4-Tier Fallback — If subscription quota runs out, automatically redirects to API Key → Cheap → Free with zero manual intervention
Real-Time Quota Tracking — Shows token consumption in real-time with reset countdown (5h, daily, weekly)
Multi-Account Support — Multiple accounts per provider with auto round-robin — when one runs out, switches to the next
Custom Combos — Customizable fallback chains with 6 balancing strategies (fill-first, round-robin, P2C, random, least-used, cost-optimized)
Codex Business Quotas — Business/Team workspace quota monitoring directly in the dashboard



🔌 2. "I need to use multiple providers but each has a different API"
OpenAI uses one format, Claude (Anthropic) uses another, Gemini yet another. If a dev wants to test models from different providers or fallback between them, they need to reconfigure SDKs, change endpoints, deal with incompatible formats. Custom providers (FriendLI, NIM) have non-standard model endpoints.
How OmniRoute solves it:

Unified Endpoint — A single http://localhost:20128/v1 serves as proxy for all 36+ providers
Format Translation — Automatic and transparent: OpenAI ↔ Claude ↔ Gemini ↔ Responses API
Response Sanitization — Strips non-standard fields (x_groq, usage_breakdown, service_tier) that break OpenAI SDK v1.83+
Role Normalization — Converts developer → system for non-OpenAI providers; system → user for GLM/ERNIE
Think Tag Extraction — Extracts <think> blocks from models like DeepSeek R1 into standardized reasoning_content
Structured Output for Gemini — json_schema → responseMimeType/responseSchema automatic conversion
stream defaults to false — Aligns with OpenAI spec, avoiding unexpected SSE in Python/Rust/Go SDKs



🌐 3. "My AI provider blocks my region/country"
Providers like OpenAI/Codex block access from certain geographic regions. Users get errors like unsupported_country_region_territory during OAuth and API connections. This is especially frustrating for developers from developing countries.
How OmniRoute solves it:

3-Level Proxy Config — Configurable proxy at 3 levels: global (all traffic), per-provider (one provider only), and per-connection/key
Color-Coded Proxy Badges — Visual indicators: 🟢 global proxy, 🟡 provider proxy, 🔵 connection proxy, always showing the IP
OAuth Token Exchange Through Proxy — OAuth flow also goes through the proxy, solving unsupported_country_region_territory
Connection Tests via Proxy — Connection tests use the configured proxy (no more direct bypass)
SOCKS5 Support — Full SOCKS5 proxy support for outbound routing
TLS Fingerprint Spoofing — Browser-like TLS fingerprint via wreq-js to bypass bot detection



🆓 4. "I want to use AI for coding but I have no money"
Not everyone can pay $20–200/month for AI subscriptions. Students, devs from emerging countries, hobbyists, and freelancers need access to quality models at zero cost.
How OmniRoute solves it:

Free Tier Providers Built-in — Native support for 100% free providers: iFlow (8 unlimited models), Qwen (3 unlimited models), Kiro (Claude for free), Gemini CLI (180K/month free)
Free-Only Combos — Chain gc/gemini-3-flash → if/kimi-k2-thinking → qw/qwen3-coder-plus = $0/month with zero downtime
NVIDIA NIM Free Credits — 1000 free credits integrated
Cost Optimized Strategy — Routing strategy that automatically chooses the cheapest available provider



🔒 5. "I need to protect my AI gateway from unauthorized access"
When exposing an AI gateway to the network (LAN, VPS, Docker), anyone with the address can consume the developer's tokens/quota. Without protection, APIs are vulnerable to misuse, prompt injection, and abuse.
How OmniRoute solves it:

API Key Management — Generation, rotation, and scoping per provider with a dedicated /dashboard/api-manager page
Model-Level Permissions — Restrict API keys to specific models (openai/*, wildcard patterns), with Allow All/Restrict toggle
API Endpoint Protection — Require a key for /v1/models and block specific providers from the listing
Auth Guard + CSRF Protection — All dashboard routes protected with withAuth middleware + CSRF tokens
Rate Limiter — Per-IP rate limiting with configurable windows
IP Filtering — Allowlist/blocklist for access control
Prompt Injection Guard — Sanitization against malicious prompt patterns
AES-256-GCM Encryption — Credentials encrypted at rest



🛑 6. "My provider went down and I lost my coding flow"
AI providers can become unstable, return 5xx errors, or hit temporary rate limits. If a dev depends on a single provider, they're interrupted. Without circuit breakers, repeated retries can crash the application.
How OmniRoute solves it:

Circuit Breaker per-provider — Auto-open/close with configurable thresholds and cooldown (Closed/Open/Half-Open)
Exponential Backoff — Progressive retry delays
Anti-Thundering Herd — Mutex + semaphore protection against concurrent retry storms
Combo Fallback Chains — If the primary provider fails, automatically falls through the chain with no intervention
Combo Circuit Breaker — Auto-disables failing providers within a combo chain
Health Dashboard — Uptime monitoring, circuit breaker states, lockouts, cache stats, p50/p95/p99 latency



🔧 7. "Configuring each AI tool is tedious and repetitive"
Developers use Cursor, Claude Code, Codex CLI, OpenClaw, Gemini CLI, Kilo Code... Each tool needs a different config (API endpoint, key, model). Reconfiguring when switching providers or models is a waste of time.
How OmniRoute solves it:

CLI Tools Dashboard — Dedicated page with one-click setup for Claude Code, Codex CLI, OpenClaw, Kilo Code, Antigravity, Cline
GitHub Copilot Config Generator — Generates chatLanguageModels.json for VS Code with bulk model selection
Onboarding Wizard — Guided 4-step setup for first-time users
One endpoint, all models — Configure http://localhost:20128/v1 once, access 36+ providers



🔑 8. "Managing OAuth tokens from multiple providers is hell"
Claude Code, Codex, Gemini CLI, Copilot — all use OAuth 2.0 with expiring tokens. Developers need to re-authenticate constantly, deal with client_secret is missing, redirect_uri_mismatch, and failures on remote servers. OAuth on LAN/VPS is particularly problematic.
How OmniRoute solves it:

Auto Token Refresh — OAuth tokens refresh in background before expiration
OAuth 2.0 (PKCE) Built-in — Automatic flow for Claude Code, Codex, Gemini CLI, Copilot, Kiro, Qwen, iFlow
Multi-Account OAuth — Multiple accounts per provider via JWT/ID token extraction
OAuth LAN/Remote Fix — Private IP detection for redirect_uri + manual URL mode for remote servers
OAuth Behind Nginx — Uses window.location.origin for reverse proxy compatibility
Remote OAuth Guide — Step-by-step guide for Google Cloud credentials on VPS/Docker



📊 9. "I don't know how much I'm spending or where"
Developers use multiple paid providers but have no unified view of spending. Each provider has its own billing dashboard, but there's no consolidated view. Unexpected costs can pile up.
How OmniRoute solves it:

Cost Analytics Dashboard — Per-token cost tracking and budget management per provider
Budget Limits per Tier — Spending ceiling per tier that triggers automatic fallback
Per-Model Pricing Configuration — Configurable prices per model
Usage Statistics Per API Key — Request count and last-used timestamp per key
Analytics Dashboard — Stat cards, model usage chart, provider table with success rates and latency



🐛 10. "I can't diagnose errors and problems in AI calls"
When a call fails, the dev doesn't know if it was a rate limit, expired token, wrong format, or provider error. Fragmented logs across different terminals. Without observability, debugging is trial-and-error.
How OmniRoute solves it:

Unified Logs Dashboard — 4 tabs: Request Logs, Proxy Logs, Audit Logs, Console
Console Log Viewer — Real-time terminal-style viewer with color-coded levels, auto-scroll, search, filter
SQLite Proxy Logs — Persistent logs that survive server restarts
Translator Playground — 4 debugging modes: Playground (format translation), Chat Tester (round-trip), Test Bench (batch), Live Monitor (real-time)
Request Telemetry — p50/p95/p99 latency + X-Request-Id tracing
File-Based Logging with Rotation — Console interceptor captures everything to JSON log with size-based rotation



🏗️ 11. "Deploying and maintaining the gateway is complex"
Installing, configuring, and maintaining an AI proxy across different environments (local, VPS, Docker, cloud) is labor-intensive. Problems like hardcoded paths, EACCES on directories, port conflicts, and cross-platform builds add friction.
How OmniRoute solves it:

npm global install — npm install -g omniroute && omniroute — done
Docker Multi-Platform — AMD64 + ARM64 native (Apple Silicon, AWS Graviton, Raspberry Pi)
Docker Compose Profiles — base (no CLI tools) and cli (with Claude Code, Codex, OpenClaw)
Electron Desktop App — Native app for Windows/macOS/Linux with system tray, auto-start, offline mode
Split-Port Mode — API and Dashboard on separate ports for advanced scenarios (reverse proxy, container networking)
Cloud Sync — Config synchronization across devices via Cloudflare Workers
DB Backups — Automatic backup, restore, export and import of all settings



🌍 12. "The interface is English-only and my team doesn't speak English"
Teams in non-English-speaking countries, especially in Latin America, Asia, and Europe, struggle with English-only interfaces. Language barriers reduce adoption and increase configuration errors.
How OmniRoute solves it:

Dashboard i18n — 30 Languages — All 500+ keys translated including Arabic, Bulgarian, Danish, German, Spanish, Finnish, French, Hebrew, Hindi, Hungarian, Indonesian, Italian, Japanese, Korean, Malay, Dutch, Norwegian, Polish, Portuguese (PT/BR), Romanian, Russian, Slovak, Swedish, Thai, Ukrainian, Vietnamese, Chinese, Filipino, English
RTL Support — Right-to-left support for Arabic and Hebrew
Multi-Language READMEs — 30 complete documentation translations
Language Selector — Globe icon in header for real-time switching



🔄 13. "I need more than chat — I need embeddings, images, audio"
AI isn't just chat completion. Devs need to generate images, transcribe audio, create embeddings for RAG, rerank documents, and moderate content. Each API has a different endpoint and format.
How OmniRoute solves it:

Embeddings — /v1/embeddings with 6 providers and 9+ models
Image Generation — /v1/images/generations with 4 providers and 9+ models
Audio Transcription — /v1/audio/transcriptions — Whisper-compatible
Text-to-Speech — /v1/audio/speech — Multi-provider audio synthesis
Moderations — /v1/moderations — Content safety checks
Reranking — /v1/rerank — Document relevance reranking
Responses API — Full /v1/responses support for Codex



🧪 14. "I have no way to test and compare quality across models"
Developers want to know which model is best for their use case — code, translation, reasoning — but comparing manually is slow. No integrated eval tools exist.
How OmniRoute solves it:

LLM Evaluations — Golden set testing with 10 pre-loaded cases covering greetings, math, geography, code generation, JSON compliance, translation, markdown, safety refusal
4 Match Strategies — exact, contains, regex, custom (JS function)
Translator Playground Test Bench — Batch testing with multiple inputs and expected outputs, cross-provider comparison
Chat Tester — Full round-trip with visual response rendering
Live Monitor — Real-time stream of all requests flowing through the proxy



📈 15. "I need to scale without losing performance"
As request volume grows, without caching the same questions generate duplicate costs. Without idempotency, duplicate requests waste processing. Per-provider rate limits must be respected.
How OmniRoute solves it:

Semantic Cache — Two-tier cache (signature + semantic) reduces cost and latency
Request Idempotency — 5s deduplication window for identical requests
Rate Limit Detection — Per-provider RPM, min gap, and max concurrent tracking
Editable Rate Limits — Configurable defaults in Settings → Resilience with persistence
API Key Validation Cache — 3-tier cache for production performance
Health Dashboard with Telemetry — p50/p95/p99 latency, cache stats, uptime



🤖 16. "I want to control model behavior globally"
Developers who want all responses in a specific language, with a specific tone, or want to limit reasoning tokens. Configuring this in every tool/request is impractical.
How OmniRoute solves it:

System Prompt Injection — Global prompt applied to all requests
Thinking Budget Validation — Reasoning token allocation control per request (passthrough, auto, custom, adaptive)
6 Routing Strategies — Global strategies that determine how requests are distributed
Wildcard Router — provider/* patterns route dynamically to any provider
Combo Enable/Disable Toggle — Toggle combos directly from the dashboard
Provider Toggle — Enable/disable all connections for a provider with one click
Blocked Providers — Exclude specific providers from /v1/models listing


⚡ Mabilis na Pagsisimula

1. I-install sa buong mundo:
npm install -g omniroute
omniroute
🎉 Magbubukas ang dashboard sa http://localhost:20128



Utos
Paglalarawan




omniroute
Simulan ang server (default port 20128)


omniroute --port 3000
Gumamit ng custom na port


omniroute --no-open
Huwag awtomatikong buksan ang browser


omniroute --help
Ipakita ang tulong



2. Ikonekta ang isang LIBRENG provider:
Dashboard → Mga Provider → Ikonekta ang Claude Code o Antigravity → OAuth login → Tapos na!
3. Gamitin sa iyong CLI tool:
Claude Code/Codex/Gemini CLI/OpenClaw/Cursor/Cline Settings:
  Endpoint: http://localhost:20128/v1
  API Key: [copy from dashboard]
  Model: if/kimi-k2-thinking

Iyon na! Magsimulang mag-coding gamit ang LIBRENG mga modelo ng AI.
Alternatibong — tumakbo mula sa pinagmulan:
cp .env.example .env
npm install
PORT=20128 NEXT_PUBLIC_BASE_URL=http://localhost:20128 npm run dev

🐳 Docker

Available ang OmniRoute bilang isang pampublikong larawan ng Docker sa Docker Hub.
Mabilis na pagtakbo:
docker run -d \
  --name omniroute \
  --restart unless-stopped \
  -p 20128:20128 \
  -v omniroute-data:/app/data \
  diegosouzapw/omniroute:latest
Na may environment file:
# Copy and edit .env first
cp .env.example .env

docker run -d \
  --name omniroute \
  --restart unless-stopped \
  --env-file .env \
  -p 20128:20128 \
  -v omniroute-data:/app/data \
  diegosouzapw/omniroute:latest
Gumagamit ng Docker Compose:
# Base profile (no CLI tools)
docker compose --profile base up -d

# CLI profile (Claude Code, Codex, OpenClaw built-in)
docker compose --profile cli up -d



Larawan
Tag
Sukat
Paglalarawan




diegosouzapw/omniroute
latest
~250MB
Pinakabagong stable na release


diegosouzapw/omniroute
1.0.3
~250MB
Kasalukuyang bersyon





🖥️ Desktop App — Offline & Always-On


🆕 NEW! OmniRoute is now available as a native desktop application for Windows, macOS, and Linux.


🖥️ Native Window — Dedicated app window with system tray integration
🔄 Auto-Start — Launch OmniRoute on system login
🔔 Native Notifications — Get alerts for quota exhaustion or provider issues
⚡ One-Click Install — NSIS (Windows), DMG (macOS), AppImage (Linux)
🌐 Offline Mode — Works fully offline with bundled server

npm run electron:dev           # Development mode
npm run electron:build         # Current platform
npm run electron:build:win     # Windows (.exe)
npm run electron:build:mac     # macOS (.dmg)
npm run electron:build:linux   # Linux (.AppImage)
📖 Full documentation: electron/README.md

💰 Pagpepresyo sa isang Sulyap




Tier
Provider
Gastos
I-reset ang Quota
Pinakamahusay Para sa




💳 SUBSCRIPTION
Claude Code (Pro)
$20/buwan
5h + lingguhan
Naka-subscribe na



Codex (Plus/Pro)
$20-200/buwan
5h + lingguhan
Mga user ng OpenAI



Gemini CLI
LIBRE
180K/buwan + 1K/araw
Lahat!



GitHub Copilot
$10-19/buwan
Buwanang
Mga user ng GitHub


🔑 API KEY
NVIDIA NIM
LIBRE (1000 credits)
Isang beses
Libreng tier na pagsubok



DeepSeek
Pay-per-use
Wala
Pinakamahusay na presyo/kalidad



Groq
Libreng tier + bayad
Limitado ang rate
Napakabilis na hinuha



xAI (Grok)
Pay-per-use
Wala
Mga modelong Grok



Mistral
Libreng tier + bayad
Limitado ang rate
European AI



OpenRouter
Pay-per-use
Wala
100+ modelo


💰 MURA
GLM-4.7
$0.6/1M
Araw-araw 10AM
Backup ng badyet



MiniMax M2.1
$0.2/1M
5 oras na rolling
Pinaka murang opsyon



Kimi K2
$9/buwan flat
10M token/buwan
Nahuhulaang gastos


🆓 LIBRE
iFlow
$0
Walang limitasyong
8 mga modelong libre



Qwen
$0
Walang limitasyong
3 mga modelong libre



Kiro
$0
Walang limitasyong
Claude libre



💡 Pro Tip: Magsimula sa Gemini CLI (180K libre/buwan) + iFlow (walang limitasyong libre) combo = $0 na halaga!

💡 Mga Pangunahing Tampok

🧠 Core Routing at Intelligence




Tampok
Ano ang Ginagawa Nito




🎯 Smart 4-Tier Fallback
Auto-ruta: Subscription → API Key → Mura → Libre


📊 Real-Time Quota Tracking
Live na bilang ng token + reset countdown bawat provider


🔄 Format Translation
OpenAI ↔ Claude ↔ Gemini ↔ Cursor ↔ Kiro seamless + response sanitization


👥 Suporta sa Multi-Account
Maramihang account sa bawat provider na may matalinong pagpili


🔄 Auto Token Refresh
Awtomatikong nagre-refresh ang mga token ng OAuth sa muling pagsubok


🎨 Mga Custom na Combos
6 na diskarte: fill-first, round-robin, p2c, random, hindi gaanong ginagamit, cost-optimized


🧩 Mga Custom na Modelo
Magdagdag ng anumang ID ng modelo sa anumang provider


🌐 Wildcard Router
Iruta ang provider/* na mga pattern sa anumang provider nang dynamic na


🧠 Badyet sa Pag-iisip
Passthrough, auto, custom, at adaptive mode para sa mga modelo ng pangangatwiran


🔀 Model Aliases
Auto-forward deprecated model IDs to current replacements (built-in + custom)


⚡ Background Degradation
Auto-route background tasks (titles, summaries) to cheaper models


💬 System Prompt Injection
Inilapat ang global system prompt sa lahat ng kahilingan


📄 Responses API
Buong OpenAI Responses API (/v1/responses) na suporta para sa Codex



🎵 Mga Multi-Modal na API




Tampok
Ano ang Ginagawa Nito




🖼️ Pagbuo ng Larawan
/v1/images/generations — 4 na provider, 9+ na modelo


📐 Mga Pag-embed
/v1/embeddings — 6 na provider, 9+ na modelo


🎤 Audio Transcription
/v1/audio/transcriptions — Whisper-compatible


🔊 Text-to-Speech
/v1/audio/speech — Multi-provider audio synthesis


🛡️ Mga Pag-moderate
/v1/moderations — Mga pagsusuri sa kaligtasan ng nilalaman


🔀 Reranking
/v1/rerank — Muling pagraranggo ng kaugnayan ng dokumento



🛡️ Katatagan at Seguridad




Tampok
Ano ang Ginagawa Nito




🔌 Circuit Breaker
Awtomatikong buksan/isara ang bawat provider na may mga na-configure na threshold


🛡️ Anti-Thundering Herd
Mutex + semaphore rate-limit para sa mga API key provider


🧠 Semantic Cache
Binabawasan ng two-tier na cache (pirma + semantiko) ang gastos at latency


⚡ Humiling ng Idempotency
5s dedup window para sa mga duplicate na kahilingan


🔒 TLS Fingerprint Spoofing
I-bypass ang TLS-based na bot detection sa pamamagitan ng wreq-js


🌐 Pag-filter ng IP
Allowlist/blocklist para sa API access control


📊 Mga Nae-edit na Limitasyon sa Rate
Configurable RPM, min gap, at max na kasabay sa antas ng system


💾 Rate Limit Persistence
Learned limits survive restarts via SQLite with 60s debounce + 24h staleness


🔄 Token Refresh Resilience
Per-provider circuit breaker (5 fails→30min) + 30s timeout per attempt


🛡 Proteksyon sa Endpoint ng API
Auth gating + pagharang ng provider para sa /models endpoint


🔒 Proxy Visibility
Mga color-coded na badge: 🟢 global, 🟡 provider, 🔵 per-connection na may IP display


🌐 3-Level Proxy Config
I-configure ang mga proxy sa global, per-provider, o per-connection level



📊 Pagmamasid at Analytics




Tampok
Ano ang Ginagawa Nito




📝 Kahilingan sa Pag-log
Debug mode na may buong kahilingan/tugon logs


💾 SQLite Proxy Logs
Ang mga paulit-ulit na proxy log ay nakaligtas sa pag-restart ng server


📊 Analytics Dashboard
Recharts-powered: mga stat card, chart ng paggamit ng modelo, talahanayan ng provider


📈 Pagsubaybay sa Pag-unlad
Mag-opt-in sa mga kaganapan sa pag-usad ng SSE para sa streaming


🧪 Mga Pagsusuri sa LLM
Golden set testing na may 4 na diskarte sa pagtutugma


🔍 Humiling ng Telemetry
p50/p95/p99 latency aggregation + X-Request-Id tracing


📋 Dashboard ng Mga Log
Pinag-isang 4-tab na pahina: Mga Log ng Kahilingan, Mga Proxy Log, Mga Log ng Audit, Console


🖥️ Console Log Viewer
Real-time na terminal-style viewer na may level filter, search, auto-scroll


📑 File-Based Logging
Kinukuha ng Console interceptor ang lahat ng output sa JSON log file na may pag-ikot


🏥 Dashboard ng Kalusugan
System uptime, circuit breaker states, lockouts, cache stats


💰 Pagsubaybay sa Gastos
Pamamahala ng badyet + configuration ng pagpepresyo sa bawat modelo



☁️ Deployment at Pag-sync




Tampok
Ano ang Ginagawa Nito




💾 Cloud Sync
I-sync ang config sa mga device sa pamamagitan ng Cloudflare Workers


🌐 I-deploy Kahit Saan
Localhost, VPS, Docker, Cloudflare Workers


🔑 API Key Management
Bumuo, paikutin, at saklawin ang mga API key sa bawat provider


🧙 Onboarding Wizard
4-step guided setup para sa mga unang beses na user


🔧 CLI Tools Dashboard
One-click configure Claude, Codex, Cline, OpenClaw, Kilo, Antigravity


🔄 Mga Backup ng DB
Awtomatikong pag-backup, pagpapanumbalik, pag-export at pag-import para sa lahat ng mga setting


🌐 Internasyonalisasyon
Buong i18n na may next-intl — suporta sa English + Portuguese (Brazil)


🌍 Pili ng Wika
Globe icon sa header para sa real-time na paglipat ng wika (🇺🇸/🇧🇷)


📂 Custom na Direktoryo ng Data
DATA_DIR env var to override default ~/.omniroute storage path




📖 Mga Detalye ng Tampok
🎯 Smart 4-Tier Fallback

Gumawa ng mga combo na may awtomatikong fallback:
Combo: "my-coding-stack"
  1. cc/claude-opus-4-6        (your subscription)
  2. nvidia/llama-3.3-70b      (free NVIDIA API)
  3. glm/glm-4.7               (cheap backup, $0.6/1M)
  4. if/kimi-k2-thinking       (free fallback)

→ Auto switches when quota runs out or errors occur

📊 Real-Time na Pagsubaybay sa Quota


Pagkonsumo ng token bawat provider
I-reset ang countdown (5 oras, araw-araw, lingguhan)
Pagtatantya ng gastos para sa mga bayad na tier
Mga ulat sa buwanang paggasta

🔄 Pagsasalin ng Format

Walang putol na pagsasalin sa pagitan ng mga format:

OpenAI ↔ Claude ↔ Gemini ↔ OpenAI Responses
Ang iyong CLI tool ay nagpapadala ng OpenAI na format → OmniRoute nagsasalin → Provider ay tumatanggap ng katutubong format
Gumagana sa anumang tool na sumusuporta sa mga custom na endpoint ng OpenAI
Response sanitization — Tinatanggal ang mga hindi karaniwang field para sa mahigpit na OpenAI SDK compatibility
Pag-normalize ng tungkulin — developer → system para sa hindi OpenAI; system → user para sa mga modelo ng GLM/ERNIE
Think tag extraction — <think> block → reasoning_content para sa mga modelo ng pag-iisip
Structured output — json_schema → Gemini's responseMimeType/responseSchema

👥 Multi-Account Support


Magdagdag ng maramihang mga account sa bawat provider
Auto round-robin o priority-based na pagruruta
Fallback sa susunod na account kapag naabot ng isa ang quota

🔄 Auto Token Refresh


Awtomatikong nagre-refresh ang mga token ng OAuth bago mag-expire
Walang kinakailangang manu-manong muling pagpapatotoo
Walang putol na karanasan sa lahat ng provider

🎨 Mga Custom na Combos


Lumikha ng walang limitasyong mga kumbinasyon ng modelo
6 na diskarte: fill-first, round-robin, power-of-two-choices, random, hindi gaanong ginagamit, cost-optimized
Magbahagi ng mga combo sa mga device na may Cloud Sync

🏥 Dashboard ng Kalusugan


Katayuan ng system (uptime, bersyon, paggamit ng memorya)
Mga estado ng circuit breaker bawat provider (Sarado/Bukas/Kalahating Bukas)
Katayuan ng limitasyon sa rate at mga aktibong lockout
Mga istatistika ng cache ng lagda
Latency telemetry (p50/p95/p99) + prompt cache
I-reset ang katayuan ng kalusugan sa isang pag-click

🔧 Palaruan ng Tagasalin

Kasama sa OmniRoute ang isang malakas na built-in na Playground ng Translator na may 4 na mode para sa pag-debug, pagsubok, at pagsubaybay sa mga pagsasalin ng API:



Mode
Paglalarawan




💻 Palaruan
Direktang pagsasalin ng format — i-paste ang anumang katawan ng kahilingan sa API at agad na makita kung paano ito isinasalin ng OmniRoute sa pagitan ng mga format ng provider (OpenAI ↔ Claude ↔ Gemini ↔ Responses API). May kasamang mga halimbawang template at format ng auto-detection.


💬 Chat Tester
Magpadala ng mga totoong kahilingan sa chat sa pamamagitan ng OmniRoute at tingnan ang buong round-trip: ang iyong input, ang isinaling kahilingan, ang tugon ng provider, at ang isinaling tugon pabalik. Napakahalaga para sa pagpapatunay ng combo routing.


🧪 Test Bench
Batch testing mode — tumukoy ng maraming test case na may iba't ibang input at inaasahang output, patakbuhin ang mga ito nang sabay-sabay, at paghambingin ang mga resulta sa mga provider at modelo.


📱 Live Monitor
Real-time na pagsubaybay sa kahilingan — panoorin ang mga papasok na kahilingan habang dumadaloy ang mga ito sa OmniRoute, tingnan ang mga pagsasalin ng format na nangyayari nang live, at tukuyin kaagad ang mga isyu.



Access: Dashboard → Translator (sidebar)
💾 Cloud Sync


I-sync ang mga provider, combo, at mga setting sa mga device
Awtomatikong pag-sync sa background
Secure na naka-encrypt na imbakan



🎯 Use Cases

Case 1: "May subscription ako sa Claude Pro"

Problema: Nag-e-expire ang quota nang hindi nagamit, mga limitasyon sa rate sa panahon ng mabigat na coding
Combo: "maximize-claude"
  1. cc/claude-opus-4-6        (use subscription fully)
  2. glm/glm-4.7               (cheap backup when quota out)
  3. if/kimi-k2-thinking       (free emergency fallback)

Monthly cost: $20 (subscription) + ~$5 (backup) = $25 total
vs. $20 + hitting limits = frustration

Case 2: "Gusto ko ng zero cost"

Problema: Hindi kayang bayaran ang mga subscription, kailangan ng maaasahang AI coding
Combo: "free-forever"
  1. gc/gemini-3-flash         (180K free/month)
  2. if/kimi-k2-thinking       (unlimited free)
  3. qw/qwen3-coder-plus       (unlimited free)

Monthly cost: $0
Quality: Production-ready models

Case 3: "Kailangan ko ng 24/7 coding, walang mga pagkaantala"

Problema: Mga deadline, hindi kayang bayaran ang downtime
Combo: "always-on"
  1. cc/claude-opus-4-6        (best quality)
  2. cx/gpt-5.2-codex          (second subscription)
  3. glm/glm-4.7               (cheap, resets daily)
  4. minimax/MiniMax-M2.1      (cheapest, 5h reset)
  5. if/kimi-k2-thinking       (free unlimited)

Result: 5 layers of fallback = zero downtime

Kaso 4: "Gusto ko ng LIBRENG AI sa OpenClaw"

Problema: Kailangan ng AI assistant sa mga app sa pagmemensahe, ganap na libre
Combo: "openclaw-free"
  1. if/glm-4.7                (unlimited free)
  2. if/minimax-m2.1           (unlimited free)
  3. if/kimi-k2-thinking       (unlimited free)

Monthly cost: $0
Access via: WhatsApp, Telegram, Slack, Discord, iMessage, Signal...


📖 Gabay sa Pag-setup


💳 Mga Tagabigay ng Subscription
Claude Code (Pro/Max)

Dashboard → Providers → Connect Claude Code
→ OAuth login → Auto token refresh
→ 5-hour + weekly quota tracking

Models:
  cc/claude-opus-4-6
  cc/claude-sonnet-4-5-20250929
  cc/claude-haiku-4-5-20251001
Pro Tip: Gamitin ang Opus para sa mga kumplikadong gawain, Soneto para sa bilis. Sinusubaybayan ng OmniRoute ang quota bawat modelo!
OpenAI Codex (Plus/Pro)

Dashboard → Providers → Connect Codex
→ OAuth login (port 1455)
→ 5-hour + weekly reset

Models:
  cx/gpt-5.2-codex
  cx/gpt-5.1-codex-max
Gemini CLI (LIBRE 180K/buwan!)

Dashboard → Providers → Connect Gemini CLI
→ Google OAuth
→ 180K completions/month + 1K/day

Models:
  gc/gemini-3-flash-preview
  gc/gemini-2.5-pro
Pinakamahusay na Halaga: Malaking libreng tier! Gamitin ito bago ang mga bayad na tier.
GitHub Copilot

Dashboard → Providers → Connect GitHub
→ OAuth via GitHub
→ Monthly reset (1st of month)

Models:
  gh/gpt-5
  gh/claude-4.5-sonnet
  gh/gemini-3-pro


🔑 API Key Provider
NVIDIA NIM (LIBRE 1000 credits!)


Mag-sign up: build.nvidia.com
Kumuha ng libreng API key (1000 inference credits kasama)
Dashboard → Magdagdag ng Provider → NVIDIA NIM:

API Key: nvapi-your-key



Mga Modelo: nvidia/llama-3.3-70b-instruct, nvidia/mistral-7b-instruct, at 50+ pa
Pro Tip: OpenAI-compatible na API — gumagana nang walang putol sa pagsasalin ng format ng OmniRoute!
DeepSeek


Mag-sign up: platform.deepseek.com
Kunin ang API key
Dashboard → Magdagdag ng Provider → DeepSeek

Mga Modelo: deepseek/deepseek-chat, deepseek/deepseek-coder
Groq (Magagamit ang Libreng Tier!)


Mag-sign up: console.groq.com
Kunin ang API key (kasama ang libreng tier)
Dashboard → Magdagdag ng Provider → Groq

Mga Modelo: groq/llama-3.3-70b, groq/mixtral-8x7b
Pro Tip: Napakabilis na inference — pinakamahusay para sa real-time na coding!
OpenRouter (100+ Modelo)


Mag-sign up: openrouter.ai
Kunin ang API key
Dashboard → Magdagdag ng Provider → OpenRouter

Mga Modelo: I-access ang 100+ na modelo mula sa lahat ng pangunahing provider sa pamamagitan ng iisang API key.


💰 Mga Murang Provider (Backup)
GLM-4.7 (Araw-araw na pag-reset, $0.6/1M)


Mag-sign up: Zhipu AI
Kumuha ng API key mula sa Coding Plan
Dashboard → Magdagdag ng API Key:

Provider: glm
API Key: your-key



Gamitin: glm/glm-4.7
Pro Tip: Nag-aalok ang Coding Plan ng 3× na quota sa 1/7 na halaga! I-reset araw-araw 10:00 AM.
MiniMax M2.1 (5h reset, $0.20/1M)


Mag-sign up: MiniMax
Kunin ang API key
Dashboard → Magdagdag ng API Key

Gamitin: minimax/MiniMax-M2.1
Pro Tip: Ang pinakamurang opsyon para sa mahabang konteksto (1M token)!
Kimi K2 ($9/month flat)


Mag-subscribe: Moonshot AI
Kunin ang API key
Dashboard → Magdagdag ng API Key

Gamitin: kimi/kimi-latest
Pro Tip: Nakapirming $9/buwan para sa 10M token = $0.90/1M epektibong gastos!


🆓 LIBRENG Provider (Emergency Backup)
iFlow (8 LIBRENG modelo)

Dashboard → Connect iFlow
→ iFlow OAuth login
→ Unlimited usage

Models:
  if/kimi-k2-thinking
  if/qwen3-coder-plus
  if/glm-4.7
  if/minimax-m2
  if/deepseek-r1
Qwen (3 LIBRENG modelo)

Dashboard → Connect Qwen
→ Device code authorization
→ Unlimited usage

Models:
  qw/qwen3-coder-plus
  qw/qwen3-coder-flash
Kiro (Claude LIBRE)

Dashboard → Connect Kiro
→ AWS Builder ID or Google/GitHub
→ Unlimited usage

Models:
  kr/claude-sonnet-4.5
  kr/claude-haiku-4.5


🎨 Lumikha ng mga Combo
Halimbawa 1: I-maximize ang Subscription → Murang Backup

Dashboard → Combos → Create New

Name: premium-coding
Models:
  1. cc/claude-opus-4-6 (Subscription primary)
  2. glm/glm-4.7 (Cheap backup, $0.6/1M)
  3. minimax/MiniMax-M2.1 (Cheapest fallback, $0.20/1M)

Use in CLI: premium-coding

Halimbawa 2: Libre-Lamang (Zero na Gastos)

Name: free-combo
Models:
  1. gc/gemini-3-flash-preview (180K free/month)
  2. if/kimi-k2-thinking (unlimited)
  3. qw/qwen3-coder-plus (unlimited)

Cost: $0 forever!



🔧 CLI Integration
Cursor IDE

Settings → Models → Advanced:
  OpenAI API Base URL: http://localhost:20128/v1
  OpenAI API Key: [from OmniRoute dashboard]
  Model: cc/claude-opus-4-6

Claude Code

Gamitin ang pahina ng CLI Tools sa dashboard para sa isang pag-click na configuration, o manu-manong i-edit ang ~/.claude/settings.json.
Codex CLI

export OPENAI_BASE_URL="http://localhost:20128"
export OPENAI_API_KEY="your-omniroute-api-key"

codex "your prompt"
OpenClaw

Pagpipilian 1 — Dashboard (inirerekomenda):
Dashboard → CLI Tools → OpenClaw → Select Model → Apply

Pagpipilian 2 — Manwal: I-edit ang ~/.openclaw/openclaw.json:
{
  "models": {
    "providers": {
      "omniroute": {
        "baseUrl": "http://127.0.0.1:20128/v1",
        "apiKey": "sk_omniroute",
        "api": "openai-completions"
      }
    }
  }
}

Tandaan: Ang OpenClaw ay gumagana lamang sa lokal na OmniRoute. Gamitin ang 127.0.0.1 sa halip na localhost upang maiwasan ang mga isyu sa paglutas ng IPv6.

Cline / Magpatuloy / RooCode

Settings → API Configuration:
  Provider: OpenAI Compatible
  Base URL: http://localhost:20128/v1
  API Key: [from OmniRoute dashboard]
  Model: if/kimi-k2-thinking



🧪 Mga Pagsusuri (Evals)

Ang OmniRoute ay may kasamang built-in na balangkas ng pagsusuri upang subukan ang kalidad ng pagtugon ng LLM laban sa isang ginintuang hanay. I-access ito sa pamamagitan ng Analytics → Evals sa dashboard.
Built-in na Golden Set

Ang pre-loaded na "OmniRoute Golden Set" ay naglalaman ng 10 test case na sumasaklaw sa:

Pagbati, matematika, heograpiya, pagbuo ng code
Pagsunod sa format ng JSON, pagsasalin, markdown
Pagtanggi sa kaligtasan (nakapipinsalang nilalaman), pagbibilang, lohika ng boolean

Estratehiya sa Pagsusuri




Diskarte
Paglalarawan
Halimbawa




exact
Dapat na eksaktong tumugma ang output
"4"


contains
Ang output ay dapat maglaman ng substring (case-insensitive)
"Paris"


regex
Ang output ay dapat tumugma sa regex pattern
"1.*2.*3"


custom
Ang custom na JS function ay nagbabalik ng true/false
(output) => output.length > 10




🐛 Pag-troubleshoot


Mag-click upang palawakin ang gabay sa pag-troubleshoot
"Ang modelo ng wika ay hindi nagbigay ng mga mensahe"

Naubos na ang quota ng provider → Suriin ang tracker ng quota ng dashboard
Solusyon: Gumamit ng combo fallback o lumipat sa mas murang tier

Paglilimita sa rate

Out na ang quota ng subscription → Fallback sa GLM/MiniMax
Magdagdag ng combo: cc/claude-opus-4-6 → glm/glm-4.7 → if/kimi-k2-thinking

Nag-expire ang token ng OAuth

Auto-refresh ng OmniRoute
Kung magpapatuloy ang mga isyu: Dashboard → Provider → Muling kumonekta

Mataas na gastos

Suriin ang mga istatistika ng paggamit sa Dashboard → Mga Gastos
Ilipat ang pangunahing modelo sa GLM/MiniMax
Gumamit ng libreng tier (Gemini CLI, iFlow) para sa mga hindi kritikal na gawain

Nagbubukas ang dashboard sa maling port

Itakda ang PORT=20128 at NEXT_PUBLIC_BASE_URL=http://localhost:20128

Mga error sa cloud sync

I-verify ang BASE_URL na mga puntos sa iyong running instance
I-verify ang CLOUD_URL na mga puntos sa iyong inaasahang cloud endpoint
Panatilihing nakahanay ang mga value ng NEXT_PUBLIC_* sa mga value sa gilid ng server

Hindi gumagana ang unang pag-login

Suriin ang INITIAL_PASSWORD sa .env
Kung hindi nakatakda, ang fallback na password ay 123456

Walang mga log ng kahilingan

Itakda ang ENABLE_REQUEST_LOGS=true sa .env

Ang pagsubok sa koneksyon ay nagpapakita ng "Di-wasto" para sa mga provider na katugma sa OpenAI

Maraming provider ang hindi naglalantad ng /models endpoint
Kasama sa OmniRoute v1.0.6+ ang fallback validation sa pamamagitan ng mga pagkumpleto ng chat
Tiyaking may kasamang /v1 suffix ang base URL

🔐 OAuth em Servidor Remoto (Remote OAuth Setup)



⚠️ MAHALAGA para sa usuários com OmniRoute sa VPS/Docker/servidor remoto

Para sa que o OAuth do Antigravity / Gemini CLI falha em servidores remotos?

Os provedores Antigravity at Gemini CLI gamit ang Google OAuth 2.0 para sa autenticação. O Google exige que a redirect_uri usada no fluxo OAuth seja exatamente uma das URIs pré-cadastradas no Google Cloud Console do aplicativo.
Bilang credenciais OAuth embutidas no OmniRoute estão cadastradas apenas para sa localhost. Quando você acessa o OmniRoute em um servidor remoto (hal: https://omniroute.meuservidor.com), o Google rejeita a autenticação com:
Error 400: redirect_uri_mismatch

Solusyon: I-configure ang suas próprias credenciais OAuth

Você precisa criar um OAuth 2.0 Client ID walang Google Cloud Console com a URI do seu servidor.
Passo a passo

1. Mag-access sa Google Cloud Console
Abra: https://console.cloud.google.com/apis/credentials
2. Crie um novo OAuth 2.0 Client ID

Clique em "+ Lumikha ng Mga Kredensyal" → "OAuth client ID"
Tipo de aplicativo: "Web application"
Pangalan: escolha qualquer nome (hal: OmniRoute Remote)

3. Idagdag bilang Mga Awtorisadong URI sa Pag-redirect
Walang campo "Mga Awtorisadong URI sa pag-redirect", idagdag:
https://seu-servidor.com/callback


Substitua seu-servidor.com pelo domínio ou IP do seu servidor (kasama ang porta se necessário, hal: http://45.33.32.156:20128/callback).

4. I-save at kopyahin bilang kredensyal
Após criar, o Google mostrará o Client ID at ** Client Secret**.
5. I-configure bilang variáveis de ambiente
No seu .env (ou nas variáveis de ambiente do Docker):
# Para Antigravity:
ANTIGRAVITY_OAUTH_CLIENT_ID=seu-client-id.apps.googleusercontent.com
ANTIGRAVITY_OAUTH_CLIENT_SECRET=GOCSPX-seu-secret

# Para Gemini CLI:
GEMINI_OAUTH_CLIENT_ID=seu-client-id.apps.googleusercontent.com
GEMINI_OAUTH_CLIENT_SECRET=GOCSPX-seu-secret
GEMINI_CLI_OAUTH_CLIENT_SECRET=GOCSPX-seu-secret
6. Reinicie o OmniRoute
# Se usando npm:
npm run dev

# Se usando Docker:
docker restart omniroute
7. Tente conectar novamente
Dashboard → Mga Provider → Antigravity (ou Gemini CLI) → OAuth
Agora o Google redirectionará corretamente para sa https://seu-servidor.com/callback at a autenticação funcionará.

Workaround temporário (sem configurar credenciais próprias)

Se não quiser criar credenciais próprias agora, may posibilidad na magamit o fluxo manual de URL:

OmniRoute abrirá a URL de authorização do Google
Após você authorizar, o Google tentará redirectionar para sa localhost (que falha no servidor remoto)
Kopyahin ang isang URL completa sa barra de endereço do seu browser (mesmo que a página não carregue)
Cole essa URL no campo que aparece no modal de conexão do OmniRoute
Clique em "Kumonekta"


Ang workaround na ito ay gumagana sa pamamagitan ng código de authorização na URL ay maaaring mag-redirect sa iyong carregado ou não.



🛠️ Tech Stack


Runtime: Node.js 18–22 LTS (⚠️ Node.js 24+ ay hindi suportado — better-sqlite3 native binary ay hindi tugma)
Wika: TypeScript 5.9 — 100% TypeScript sa src/ at open-sse/ (v1.0.6)
Framework: Next.js 16 + React 19 + Tailwind CSS 4
Database: LowDB (JSON) + SQLite (domain state + proxy logs)
Streaming: Mga Kaganapang Ipinadala ng Server (SSE)
Auth: OAuth 2.0 (PKCE) + JWT + API Keys
Pagsubok: Node.js test runner (368+ unit test)
CI/CD: GitHub Actions (auto npm publish + Docker Hub on release)
Website: omniroute.online
Package: npmjs.com/package/omniroute
Docker: hub.docker.com/r/diegosouzapw/omniroute
Resilience: Circuit breaker, exponential backoff, anti-thundering herd, TLS spoofing


📖 Dokumentasyon




Dokumento
Paglalarawan




User Guide
Mga provider, combo, CLI integration, deployment


API Reference
Lahat ng mga endpoint na may mga halimbawa


Troubleshooting
Mga karaniwang problema at solusyon


Architecture
Arkitektura ng system at mga panloob


Contributing
Pag-setup at mga alituntunin ng pag-unlad


OpenAPI Spec
OpenAPI 3.0 na detalye


Security Policy
Pag-uulat ng kahinaan at mga kasanayan sa seguridad


VM Deployment
Kumpletong gabay: VM + nginx + Cloudflare setup


Features Gallery
Visual dashboard tour na may mga screenshot



📸 Preview ng Dashboard


Mag-click para makita ang mga screenshot ng dashboard



Pahina
Screenshot




Mga Provider



Combos



Analytics



Kalusugan



Tagasalin



Mga Setting



Mga CLI Tools



Mga Log ng Paggamit



Endpoint






🗺️ Roadmap

Ang OmniRoute ay may 210+ feature na binalak sa maraming yugto ng pag-unlad. Narito ang mga pangunahing lugar:



Kategorya
Mga Nakaplanong Tampok
Mga Highlight




🧠 Routing at Intelligence
25+
Lowest-latency routing, tag-based na routing, quota preflight, P2C account selection


🔒 Seguridad at Pagsunod
20+
SSRF hardening, credential cloaking, rate-limit sa bawat endpoint, management key scoping


📊 Pagmamasid
15+
Pagsasama ng OpenTelemetry, real-time na pagsubaybay sa quota, pagsubaybay sa gastos bawat modelo


🔄 Mga Pagsasama ng Provider
20+
Dynamic na model registry, provider cooldowns, multi-account Codex, Copilot quota parsing


⚡ Pagganap
15+
Dual cache layer, prompt cache, response cache, streaming keepalive, batch API


🌐 Ecosystem
10+
WebSocket API, config hot-reload, distributed config store, commercial mode



🔜 Malapit na


🔗 OpenCode Integration — Suporta ng katutubong provider para sa OpenCode AI coding IDE
🔗 TRAE Integration — Buong suporta para sa balangkas ng pag-develop ng TRAE AI
📦 Batch API — Asynchronous na pagproseso ng batch para sa maramihang kahilingan
🎯 Tag-Based Routing — Mga kahilingan sa ruta batay sa mga custom na tag at metadata
💰 Diskarte sa Pinakamababang Gastos — Awtomatikong piliin ang pinakamurang available na provider


📝 Available ang buong detalye ng feature sa link (217 detalyadong spec)


📧 Suporta


💬 Sumali sa aming komunidad! WhatsApp Group — Humingi ng tulong, magbahagi ng mga tip, at manatiling updated.


Website: omniroute.online
GitHub: github.com/diegosouzapw/OmniRoute
Mga Isyu: github.com/diegosouzapw/OmniRoute/issues
WhatsApp: Community Group
Orihinal na Proyekto: 9router by decolua


👥 Mga nag-aambag


Paano Mag-ambag


I-fork ang repositoryo
Gawin ang iyong sangay ng tampok (git checkout -b feature/amazing-feature)
Ibigay ang iyong mga pagbabago (git commit -m 'Add amazing feature')
Itulak sa sangay (git push origin feature/amazing-feature)
Magbukas ng Pull Request

Tingnan ang CONTRIBUTING.md para sa mga detalyadong alituntunin.
Naglalabas ng Bagong Bersyon

# Create a release — npm publish happens automatically
gh release create v1.0.6 --title "v1.0.6" --generate-notes

📊 Kasaysayan ng Bituin


 
   
   
   
 


🙏 Pasasalamat

Espesyal na pasasalamat kay 9router ni decolua — ang orihinal na proyektong nagbigay inspirasyon sa tinidor na ito. Bumubuo ang OmniRoute sa hindi kapani-paniwalang pundasyong iyon na may mga karagdagang feature, multi-modal na API, at buong TypeScript na muling pagsulat.
Espesyal na salamat sa CLIProxyAPI — ang orihinal na pagpapatupad ng Go na nagbigay inspirasyon sa JavaScript port na ito.

📄 Lisensya

Lisensya ng MIT - tingnan ang LICENSE para sa mga detalye.


  _{Built with ❤️ para sa mga developer na nagko-code 24/7}
  

  _{omniroute.online}

Tampok	Ano ang Ginagawa Nito
🎯 Smart 4-Tier Fallback	Auto-ruta: Subscription → API Key → Mura → Libre
📊 Real-Time Quota Tracking	Live na bilang ng token + reset countdown bawat provider
🔄 Format Translation	OpenAI ↔ Claude ↔ Gemini ↔ Cursor ↔ Kiro seamless + response sanitization
👥 Suporta sa Multi-Account	Maramihang account sa bawat provider na may matalinong pagpili
🔄 Auto Token Refresh	Awtomatikong nagre-refresh ang mga token ng OAuth sa muling pagsubok
🎨 Mga Custom na Combos	6 na diskarte: fill-first, round-robin, p2c, random, hindi gaanong ginagamit, cost-optimized
🧩 Mga Custom na Modelo	Magdagdag ng anumang ID ng modelo sa anumang provider
🌐 Wildcard Router	Iruta ang `provider/*` na mga pattern sa anumang provider nang dynamic na
🧠 Badyet sa Pag-iisip	Passthrough, auto, custom, at adaptive mode para sa mga modelo ng pangangatwiran
🔀 Model Aliases	Auto-forward deprecated model IDs to current replacements (built-in + custom)
⚡ Background Degradation	Auto-route background tasks (titles, summaries) to cheaper models
💬 System Prompt Injection	Inilapat ang global system prompt sa lahat ng kahilingan
📄 Responses API	Buong OpenAI Responses API (`/v1/responses`) na suporta para sa Codex

Tampok	Ano ang Ginagawa Nito
🖼️ Pagbuo ng Larawan	`/v1/images/generations` — 4 na provider, 9+ na modelo
📐 Mga Pag-embed	`/v1/embeddings` — 6 na provider, 9+ na modelo
🎤 Audio Transcription	`/v1/audio/transcriptions` — Whisper-compatible
🔊 Text-to-Speech	`/v1/audio/speech` — Multi-provider audio synthesis
🛡️ Mga Pag-moderate	`/v1/moderations` — Mga pagsusuri sa kaligtasan ng nilalaman
🔀 Reranking	`/v1/rerank` — Muling pagraranggo ng kaugnayan ng dokumento

Diskarte	Paglalarawan	Halimbawa
`exact`	Dapat na eksaktong tumugma ang output	`"4"`
`contains`	Ang output ay dapat maglaman ng substring (case-insensitive)	`"Paris"`
`regex`	Ang output ay dapat tumugma sa regex pattern	`"1.2.3"`
`custom`	Ang custom na JS function ay nagbabalik ng true/false	`(output) => output.length > 10`

Pahina	Screenshot
Mga Provider
Combos
Analytics
Kalusugan
Tagasalin
Mga Setting
Mga CLI Tools
Mga Log ng Paggamit
Endpoint

Utos	Paglalarawan
`omniroute`	Simulan ang server (default port 20128)
`omniroute --port 3000`	Gumamit ng custom na port
`omniroute --no-open`	Huwag awtomatikong buksan ang browser
`omniroute --help`	Ipakita ang tulong

Larawan	Tag	Sukat	Paglalarawan
`diegosouzapw/omniroute`	`latest`	~250MB	Pinakabagong stable na release
`diegosouzapw/omniroute`	`1.0.3`	~250MB	Kasalukuyang bersyon

Tier	Provider	Gastos	I-reset ang Quota	Pinakamahusay Para sa
💳 SUBSCRIPTION	Claude Code (Pro)	$20/buwan	5h + lingguhan	Naka-subscribe na
	Codex (Plus/Pro)	$20-200/buwan	5h + lingguhan	Mga user ng OpenAI
	Gemini CLI	LIBRE	180K/buwan + 1K/araw	Lahat!
	GitHub Copilot	$10-19/buwan	Buwanang	Mga user ng GitHub
🔑 API KEY	NVIDIA NIM	LIBRE (1000 credits)	Isang beses	Libreng tier na pagsubok
	DeepSeek	Pay-per-use	Wala	Pinakamahusay na presyo/kalidad
	Groq	Libreng tier + bayad	Limitado ang rate	Napakabilis na hinuha
	xAI (Grok)	Pay-per-use	Wala	Mga modelong Grok
	Mistral	Libreng tier + bayad	Limitado ang rate	European AI
	OpenRouter	Pay-per-use	Wala	100+ modelo
💰 MURA	GLM-4.7	$0.6/1M	Araw-araw 10AM	Backup ng badyet
	MiniMax M2.1	$0.2/1M	5 oras na rolling	Pinaka murang opsyon
	Kimi K2	$9/buwan flat	10M token/buwan	Nahuhulaang gastos
🆓 LIBRE	iFlow	$0	Walang limitasyong	8 mga modelong libre
	Qwen	$0	Walang limitasyong	3 mga modelong libre
	Kiro	$0	Walang limitasyong	Claude libre

Tampok	Ano ang Ginagawa Nito
🔌 Circuit Breaker	Awtomatikong buksan/isara ang bawat provider na may mga na-configure na threshold
🛡️ Anti-Thundering Herd	Mutex + semaphore rate-limit para sa mga API key provider
🧠 Semantic Cache	Binabawasan ng two-tier na cache (pirma + semantiko) ang gastos at latency
⚡ Humiling ng Idempotency	5s dedup window para sa mga duplicate na kahilingan
🔒 TLS Fingerprint Spoofing	I-bypass ang TLS-based na bot detection sa pamamagitan ng wreq-js
🌐 Pag-filter ng IP	Allowlist/blocklist para sa API access control
📊 Mga Nae-edit na Limitasyon sa Rate	Configurable RPM, min gap, at max na kasabay sa antas ng system
💾 Rate Limit Persistence	Learned limits survive restarts via SQLite with 60s debounce + 24h staleness
🔄 Token Refresh Resilience	Per-provider circuit breaker (5 fails→30min) + 30s timeout per attempt
🛡 Proteksyon sa Endpoint ng API	Auth gating + pagharang ng provider para sa `/models` endpoint
🔒 Proxy Visibility	Mga color-coded na badge: 🟢 global, 🟡 provider, 🔵 per-connection na may IP display
🌐 3-Level Proxy Config	I-configure ang mga proxy sa global, per-provider, o per-connection level

Tampok	Ano ang Ginagawa Nito
📝 Kahilingan sa Pag-log	Debug mode na may buong kahilingan/tugon logs
💾 SQLite Proxy Logs	Ang mga paulit-ulit na proxy log ay nakaligtas sa pag-restart ng server
📊 Analytics Dashboard	Recharts-powered: mga stat card, chart ng paggamit ng modelo, talahanayan ng provider
📈 Pagsubaybay sa Pag-unlad	Mag-opt-in sa mga kaganapan sa pag-usad ng SSE para sa streaming
🧪 Mga Pagsusuri sa LLM	Golden set testing na may 4 na diskarte sa pagtutugma
🔍 Humiling ng Telemetry	p50/p95/p99 latency aggregation + X-Request-Id tracing
📋 Dashboard ng Mga Log	Pinag-isang 4-tab na pahina: Mga Log ng Kahilingan, Mga Proxy Log, Mga Log ng Audit, Console
🖥️ Console Log Viewer	Real-time na terminal-style viewer na may level filter, search, auto-scroll
📑 File-Based Logging	Kinukuha ng Console interceptor ang lahat ng output sa JSON log file na may pag-ikot
🏥 Dashboard ng Kalusugan	System uptime, circuit breaker states, lockouts, cache stats
💰 Pagsubaybay sa Gastos	Pamamahala ng badyet + configuration ng pagpepresyo sa bawat modelo

Tampok	Ano ang Ginagawa Nito
💾 Cloud Sync	I-sync ang config sa mga device sa pamamagitan ng Cloudflare Workers
🌐 I-deploy Kahit Saan	Localhost, VPS, Docker, Cloudflare Workers
🔑 API Key Management	Bumuo, paikutin, at saklawin ang mga API key sa bawat provider
🧙 Onboarding Wizard	4-step guided setup para sa mga unang beses na user
🔧 CLI Tools Dashboard	One-click configure Claude, Codex, Cline, OpenClaw, Kilo, Antigravity
🔄 Mga Backup ng DB	Awtomatikong pag-backup, pagpapanumbalik, pag-export at pag-import para sa lahat ng mga setting
🌐 Internasyonalisasyon	Buong i18n na may next-intl — suporta sa English + Portuguese (Brazil)
🌍 Pili ng Wika	Globe icon sa header para sa real-time na paglipat ng wika (🇺🇸/🇧🇷)
📂 Custom na Direktoryo ng Data	`DATA_DIR` env var to override default `~/.omniroute` storage path

Mode	Paglalarawan
💻 Palaruan	Direktang pagsasalin ng format — i-paste ang anumang katawan ng kahilingan sa API at agad na makita kung paano ito isinasalin ng OmniRoute sa pagitan ng mga format ng provider (OpenAI ↔ Claude ↔ Gemini ↔ Responses API). May kasamang mga halimbawang template at format ng auto-detection.
💬 Chat Tester	Magpadala ng mga totoong kahilingan sa chat sa pamamagitan ng OmniRoute at tingnan ang buong round-trip: ang iyong input, ang isinaling kahilingan, ang tugon ng provider, at ang isinaling tugon pabalik. Napakahalaga para sa pagpapatunay ng combo routing.
🧪 Test Bench	Batch testing mode — tumukoy ng maraming test case na may iba't ibang input at inaasahang output, patakbuhin ang mga ito nang sabay-sabay, at paghambingin ang mga resulta sa mga provider at modelo.
📱 Live Monitor	Real-time na pagsubaybay sa kahilingan — panoorin ang mga papasok na kahilingan habang dumadaloy ang mga ito sa OmniRoute, tingnan ang mga pagsasalin ng format na nangyayari nang live, at tukuyin kaagad ang mga isyu.

Dokumento	Paglalarawan
User Guide	Mga provider, combo, CLI integration, deployment
API Reference	Lahat ng mga endpoint na may mga halimbawa
Troubleshooting	Mga karaniwang problema at solusyon
Architecture	Arkitektura ng system at mga panloob
Contributing	Pag-setup at mga alituntunin ng pag-unlad
OpenAPI Spec	OpenAPI 3.0 na detalye
Security Policy	Pag-uulat ng kahinaan at mga kasanayan sa seguridad
VM Deployment	Kumpletong gabay: VM + nginx + Cloudflare setup
Features Gallery	Visual dashboard tour na may mga screenshot

Kategorya	Mga Nakaplanong Tampok	Mga Highlight
🧠 Routing at Intelligence	25+	Lowest-latency routing, tag-based na routing, quota preflight, P2C account selection
🔒 Seguridad at Pagsunod	20+	SSRF hardening, credential cloaking, rate-limit sa bawat endpoint, management key scoping
📊 Pagmamasid	15+	Pagsasama ng OpenTelemetry, real-time na pagsubaybay sa quota, pagsubaybay sa gastos bawat modelo
🔄 Mga Pagsasama ng Provider	20+	Dynamic na model registry, provider cooldowns, multi-account Codex, Copilot quota parsing
⚡ Pagganap	15+	Dual cache layer, prompt cache, response cache, streaming keepalive, batch API
🌐 Ecosystem	10+	WebSocket API, config hot-reload, distributed config store, commercial mode

FilesExpand file tree

README.phi.md

Latest commit

History

README.phi.md

File metadata and controls

🚀 OmniRoute — Ang Libreng AI Gateway

Huwag kailanman ihinto ang coding. Smart routing sa LIBRE at murang mga modelo ng AI na may awtomatikong fallback.

🤖 Libreng AI Provider para sa iyong mga paboritong coding agent

🤔 Bakit OmniRoute?

🔄 Paano Ito Gumagana

🎯 What OmniRoute Solves — 16 Real Pain Points

⚡ Mabilis na Pagsisimula

🐳 Docker

🖥️ Desktop App — Offline & Always-On

💰 Pagpepresyo sa isang Sulyap

💡 Mga Pangunahing Tampok

🧠 Core Routing at Intelligence

🎵 Mga Multi-Modal na API

🛡️ Katatagan at Seguridad

📊 Pagmamasid at Analytics

☁️ Deployment at Pag-sync

🎯 Smart 4-Tier Fallback

📊 Real-Time na Pagsubaybay sa Quota

🔄 Pagsasalin ng Format

👥 Multi-Account Support

🔄 Auto Token Refresh

🎨 Mga Custom na Combos

🏥 Dashboard ng Kalusugan

🔧 Palaruan ng Tagasalin

💾 Cloud Sync

🎯 Use Cases

Case 1: "May subscription ako sa Claude Pro"

Case 2: "Gusto ko ng zero cost"

Case 3: "Kailangan ko ng 24/7 coding, walang mga pagkaantala"

Kaso 4: "Gusto ko ng LIBRENG AI sa OpenClaw"

📖 Gabay sa Pag-setup

Claude Code (Pro/Max)

OpenAI Codex (Plus/Pro)

Gemini CLI (LIBRE 180K/buwan!)

GitHub Copilot

NVIDIA NIM (LIBRE 1000 credits!)

DeepSeek

Groq (Magagamit ang Libreng Tier!)

OpenRouter (100+ Modelo)

GLM-4.7 (Araw-araw na pag-reset, $0.6/1M)

MiniMax M2.1 (5h reset, $0.20/1M)

Kimi K2 ($9/month flat)

iFlow (8 LIBRENG modelo)

Qwen (3 LIBRENG modelo)

Kiro (Claude LIBRE)

Halimbawa 1: I-maximize ang Subscription → Murang Backup

Halimbawa 2: Libre-Lamang (Zero na Gastos)

Cursor IDE

Claude Code

Codex CLI

OpenClaw

Cline / Magpatuloy / RooCode

🧪 Mga Pagsusuri (Evals)

Built-in na Golden Set

Estratehiya sa Pagsusuri

🐛 Pag-troubleshoot

🔐 OAuth em Servidor Remoto (Remote OAuth Setup)

Para sa que o OAuth do Antigravity / Gemini CLI falha em servidores remotos?

Solusyon: I-configure ang suas próprias credenciais OAuth

Passo a passo

Workaround temporário (sem configurar credenciais próprias)

🛠️ Tech Stack

📖 Dokumentasyon

📸 Preview ng Dashboard

🗺️ Roadmap

🔜 Malapit na

📧 Suporta

👥 Mga nag-aambag

Paano Mag-ambag

Naglalabas ng Bagong Bersyon

📊 Kasaysayan ng Bituin

🙏 Pasasalamat

📄 Lisensya