Không bao giờ ngừng viết mã. Định tuyến thông minh tới Mô hình AI MIỄN PHÍ và chi phí thấp với tính năng dự phòng tự động.
Proxy API phổ quát của bạn — một điểm cuối, hơn 36 nhà cung cấp, không có thời gian ngừng hoạt động.
Hoàn thành cuộc trò chuyện • Nhúng • Tạo hình ảnh • Âm thanh • Sắp xếp lại • 100% TypeScript
Kết nối mọi công cụ IDE hoặc CLI được hỗ trợ bởi AI thông qua OmniRoute — cổng API miễn phí để mã hóa không giới hạn.
|
OpenClaw ⭐ 205K |
NanoBot ⭐ 20.9K |
PicoClaw ⭐ 14.6K |
ZeroClaw ⭐ 9.9K |
IronClaw ⭐ 2.1K |
|
OpenCode ⭐ 106K |
Codex CLI ⭐ 60.8K |
Claude Code ⭐ 67.3K |
Gemini CLI ⭐ 94.7K |
Kilo Code ⭐ 15.5K |
📡 Tất cả đại lý kết nối qua http://localhost:20128/v1 hoặc http://cloud.omniroute.online/v1 — một cấu hình, số mô hình và hạn ngạch không giới hạn
🌐 Website • 🚀 Quick Start • 💡 Features • 📖 Docs • 💰 Pricing • 💬 WhatsApp
🌐 Available in: 🇺🇸 English | 🇧🇷 Português (Brasil) | 🇪🇸 Español | 🇫🇷 Français | 🇮🇹 Italiano | 🇷🇺 Русский | 🇨🇳 中文 (简体) | 🇩🇪 Deutsch | 🇮🇳 हिन्दी | 🇹🇭 ไทย | 🇺🇦 Українська | 🇸🇦 العربية | 🇯🇵 日本語 | 🇻🇳 Tiếng Việt | 🇧🇬 Български | 🇩🇰 Dansk | 🇫🇮 Suomi | 🇮🇱 עברית | 🇭🇺 Magyar | 🇮🇩 Bahasa Indonesia | 🇰🇷 한국어 | 🇲🇾 Bahasa Melayu | 🇳🇱 Nederlands | 🇳🇴 Norsk | 🇵🇹 Português (Portugal) | 🇷🇴 Română | 🇵🇱 Polski | 🇸🇰 Slovenčina | 🇸🇪 Svenska | 🇵🇭 Filipino
Ngưng lãng phí tiền và đạt đến giới hạn:
Hạn mức đăng ký hết hạn không được sử dụng hàng tháng
Giới hạn tốc độ khiến bạn không thể viết mã giữa chừng
API đắt tiền ($20-50/tháng cho mỗi nhà cung cấp)
Chuyển đổi thủ công giữa các nhà cung cấp
OmniRoute giải quyết vấn đề này:
- ✅ Tối đa hóa số lượt đăng ký - Theo dõi hạn ngạch, sử dụng từng bit trước khi đặt lại
- ✅ Tự động dự phòng - Đăng ký → Khóa API → Giá rẻ → Miễn phí, không có thời gian ngừng hoạt động
- ✅ Nhiều tài khoản - Luân chuyển giữa các tài khoản cho mỗi nhà cung cấp
- ✅ Universal - Hoạt động với Claude Code, Codex, Gemini CLI, Cursor, Cline, OpenClaw, mọi công cụ CLI
┌─────────────┐
│ Your CLI │ (Claude Code, Codex, Gemini CLI, OpenClaw, Cursor, Cline...)
│ Tool │
└──────┬──────┘
│ http://localhost:20128/v1
↓
┌─────────────────────────────────────────┐
│ OmniRoute (Smart Router) │
│ • Format translation (OpenAI ↔ Claude) │
│ • Quota tracking + Embeddings + Images │
│ • Auto token refresh │
└──────┬──────────────────────────────────┘
│
├─→ [Tier 1: SUBSCRIPTION] Claude Code, Codex, Gemini CLI
│ ↓ quota exhausted
├─→ [Tier 2: API KEY] DeepSeek, Groq, xAI, Mistral, NVIDIA NIM, etc.
│ ↓ budget limit
├─→ [Tier 3: CHEAP] GLM ($0.6/1M), MiniMax ($0.2/1M)
│ ↓ budget limit
└─→ [Tier 4: FREE] iFlow, Qwen, Kiro (unlimited)
Result: Never stop coding, minimal cost
Every developer using AI tools faces these problems daily. OmniRoute was built to solve them all — from cost overruns to regional blocks, from broken OAuth flows to zero observability.
💸 1. "I pay for an expensive subscription but still get interrupted by limits"
Developers pay $20–200/month for Claude Pro, Codex Pro, or GitHub Copilot. Even paying, quota has a ceiling — 5h of usage, weekly limits, or per-minute rate limits. Mid-coding session, the provider stops responding and the developer loses flow and productivity.
How OmniRoute solves it:
- Smart 4-Tier Fallback — If subscription quota runs out, automatically redirects to API Key → Cheap → Free with zero manual intervention
- Real-Time Quota Tracking — Shows token consumption in real-time with reset countdown (5h, daily, weekly)
- Multi-Account Support — Multiple accounts per provider with auto round-robin — when one runs out, switches to the next
- Custom Combos — Customizable fallback chains with 6 balancing strategies (fill-first, round-robin, P2C, random, least-used, cost-optimized)
- Codex Business Quotas — Business/Team workspace quota monitoring directly in the dashboard
🔌 2. "I need to use multiple providers but each has a different API"
OpenAI uses one format, Claude (Anthropic) uses another, Gemini yet another. If a dev wants to test models from different providers or fallback between them, they need to reconfigure SDKs, change endpoints, deal with incompatible formats. Custom providers (FriendLI, NIM) have non-standard model endpoints.
How OmniRoute solves it:
- Unified Endpoint — A single
http://localhost:20128/v1serves as proxy for all 36+ providers - Format Translation — Automatic and transparent: OpenAI ↔ Claude ↔ Gemini ↔ Responses API
- Response Sanitization — Strips non-standard fields (
x_groq,usage_breakdown,service_tier) that break OpenAI SDK v1.83+ - Role Normalization — Converts
developer→systemfor non-OpenAI providers;system→userfor GLM/ERNIE - Think Tag Extraction — Extracts
<think>blocks from models like DeepSeek R1 into standardizedreasoning_content - Structured Output for Gemini —
json_schema→responseMimeType/responseSchemaautomatic conversion streamdefaults tofalse— Aligns with OpenAI spec, avoiding unexpected SSE in Python/Rust/Go SDKs
🌐 3. "My AI provider blocks my region/country"
Providers like OpenAI/Codex block access from certain geographic regions. Users get errors like unsupported_country_region_territory during OAuth and API connections. This is especially frustrating for developers from developing countries.
How OmniRoute solves it:
- 3-Level Proxy Config — Configurable proxy at 3 levels: global (all traffic), per-provider (one provider only), and per-connection/key
- Color-Coded Proxy Badges — Visual indicators: 🟢 global proxy, 🟡 provider proxy, 🔵 connection proxy, always showing the IP
- OAuth Token Exchange Through Proxy — OAuth flow also goes through the proxy, solving
unsupported_country_region_territory - Connection Tests via Proxy — Connection tests use the configured proxy (no more direct bypass)
- SOCKS5 Support — Full SOCKS5 proxy support for outbound routing
- TLS Fingerprint Spoofing — Browser-like TLS fingerprint via
wreq-jsto bypass bot detection
🆓 4. "I want to use AI for coding but I have no money"
Not everyone can pay $20–200/month for AI subscriptions. Students, devs from emerging countries, hobbyists, and freelancers need access to quality models at zero cost.
How OmniRoute solves it:
- Free Tier Providers Built-in — Native support for 100% free providers: iFlow (8 unlimited models), Qwen (3 unlimited models), Kiro (Claude for free), Gemini CLI (180K/month free)
- Free-Only Combos — Chain
gc/gemini-3-flash → if/kimi-k2-thinking → qw/qwen3-coder-plus= $0/month with zero downtime - NVIDIA NIM Free Credits — 1000 free credits integrated
- Cost Optimized Strategy — Routing strategy that automatically chooses the cheapest available provider
🔒 5. "I need to protect my AI gateway from unauthorized access"
When exposing an AI gateway to the network (LAN, VPS, Docker), anyone with the address can consume the developer's tokens/quota. Without protection, APIs are vulnerable to misuse, prompt injection, and abuse.
How OmniRoute solves it:
- API Key Management — Generation, rotation, and scoping per provider with a dedicated
/dashboard/api-managerpage - Model-Level Permissions — Restrict API keys to specific models (
openai/*, wildcard patterns), with Allow All/Restrict toggle - API Endpoint Protection — Require a key for
/v1/modelsand block specific providers from the listing - Auth Guard + CSRF Protection — All dashboard routes protected with
withAuthmiddleware + CSRF tokens - Rate Limiter — Per-IP rate limiting with configurable windows
- IP Filtering — Allowlist/blocklist for access control
- Prompt Injection Guard — Sanitization against malicious prompt patterns
- AES-256-GCM Encryption — Credentials encrypted at rest
🛑 6. "My provider went down and I lost my coding flow"
AI providers can become unstable, return 5xx errors, or hit temporary rate limits. If a dev depends on a single provider, they're interrupted. Without circuit breakers, repeated retries can crash the application.
How OmniRoute solves it:
- Circuit Breaker per-provider — Auto-open/close with configurable thresholds and cooldown (Closed/Open/Half-Open)
- Exponential Backoff — Progressive retry delays
- Anti-Thundering Herd — Mutex + semaphore protection against concurrent retry storms
- Combo Fallback Chains — If the primary provider fails, automatically falls through the chain with no intervention
- Combo Circuit Breaker — Auto-disables failing providers within a combo chain
- Health Dashboard — Uptime monitoring, circuit breaker states, lockouts, cache stats, p50/p95/p99 latency
🔧 7. "Configuring each AI tool is tedious and repetitive"
Developers use Cursor, Claude Code, Codex CLI, OpenClaw, Gemini CLI, Kilo Code... Each tool needs a different config (API endpoint, key, model). Reconfiguring when switching providers or models is a waste of time.
How OmniRoute solves it:
- CLI Tools Dashboard — Dedicated page with one-click setup for Claude Code, Codex CLI, OpenClaw, Kilo Code, Antigravity, Cline
- GitHub Copilot Config Generator — Generates
chatLanguageModels.jsonfor VS Code with bulk model selection - Onboarding Wizard — Guided 4-step setup for first-time users
- One endpoint, all models — Configure
http://localhost:20128/v1once, access 36+ providers
🔑 8. "Managing OAuth tokens from multiple providers is hell"
Claude Code, Codex, Gemini CLI, Copilot — all use OAuth 2.0 with expiring tokens. Developers need to re-authenticate constantly, deal with client_secret is missing, redirect_uri_mismatch, and failures on remote servers. OAuth on LAN/VPS is particularly problematic.
How OmniRoute solves it:
- Auto Token Refresh — OAuth tokens refresh in background before expiration
- OAuth 2.0 (PKCE) Built-in — Automatic flow for Claude Code, Codex, Gemini CLI, Copilot, Kiro, Qwen, iFlow
- Multi-Account OAuth — Multiple accounts per provider via JWT/ID token extraction
- OAuth LAN/Remote Fix — Private IP detection for
redirect_uri+ manual URL mode for remote servers - OAuth Behind Nginx — Uses
window.location.originfor reverse proxy compatibility - Remote OAuth Guide — Step-by-step guide for Google Cloud credentials on VPS/Docker
📊 9. "I don't know how much I'm spending or where"
Developers use multiple paid providers but have no unified view of spending. Each provider has its own billing dashboard, but there's no consolidated view. Unexpected costs can pile up.
How OmniRoute solves it:
- Cost Analytics Dashboard — Per-token cost tracking and budget management per provider
- Budget Limits per Tier — Spending ceiling per tier that triggers automatic fallback
- Per-Model Pricing Configuration — Configurable prices per model
- Usage Statistics Per API Key — Request count and last-used timestamp per key
- Analytics Dashboard — Stat cards, model usage chart, provider table with success rates and latency
🐛 10. "I can't diagnose errors and problems in AI calls"
When a call fails, the dev doesn't know if it was a rate limit, expired token, wrong format, or provider error. Fragmented logs across different terminals. Without observability, debugging is trial-and-error.
How OmniRoute solves it:
- Unified Logs Dashboard — 4 tabs: Request Logs, Proxy Logs, Audit Logs, Console
- Console Log Viewer — Real-time terminal-style viewer with color-coded levels, auto-scroll, search, filter
- SQLite Proxy Logs — Persistent logs that survive server restarts
- Translator Playground — 4 debugging modes: Playground (format translation), Chat Tester (round-trip), Test Bench (batch), Live Monitor (real-time)
- Request Telemetry — p50/p95/p99 latency + X-Request-Id tracing
- File-Based Logging with Rotation — Console interceptor captures everything to JSON log with size-based rotation
🏗️ 11. "Deploying and maintaining the gateway is complex"
Installing, configuring, and maintaining an AI proxy across different environments (local, VPS, Docker, cloud) is labor-intensive. Problems like hardcoded paths, EACCES on directories, port conflicts, and cross-platform builds add friction.
How OmniRoute solves it:
- npm global install —
npm install -g omniroute && omniroute— done - Docker Multi-Platform — AMD64 + ARM64 native (Apple Silicon, AWS Graviton, Raspberry Pi)
- Docker Compose Profiles —
base(no CLI tools) andcli(with Claude Code, Codex, OpenClaw) - Electron Desktop App — Native app for Windows/macOS/Linux with system tray, auto-start, offline mode
- Split-Port Mode — API and Dashboard on separate ports for advanced scenarios (reverse proxy, container networking)
- Cloud Sync — Config synchronization across devices via Cloudflare Workers
- DB Backups — Automatic backup, restore, export and import of all settings
🌍 12. "The interface is English-only and my team doesn't speak English"
Teams in non-English-speaking countries, especially in Latin America, Asia, and Europe, struggle with English-only interfaces. Language barriers reduce adoption and increase configuration errors.
How OmniRoute solves it:
- Dashboard i18n — 30 Languages — All 500+ keys translated including Arabic, Bulgarian, Danish, German, Spanish, Finnish, French, Hebrew, Hindi, Hungarian, Indonesian, Italian, Japanese, Korean, Malay, Dutch, Norwegian, Polish, Portuguese (PT/BR), Romanian, Russian, Slovak, Swedish, Thai, Ukrainian, Vietnamese, Chinese, Filipino, English
- RTL Support — Right-to-left support for Arabic and Hebrew
- Multi-Language READMEs — 30 complete documentation translations
- Language Selector — Globe icon in header for real-time switching
🔄 13. "I need more than chat — I need embeddings, images, audio"
AI isn't just chat completion. Devs need to generate images, transcribe audio, create embeddings for RAG, rerank documents, and moderate content. Each API has a different endpoint and format.
How OmniRoute solves it:
- Embeddings —
/v1/embeddingswith 6 providers and 9+ models - Image Generation —
/v1/images/generationswith 4 providers and 9+ models - Audio Transcription —
/v1/audio/transcriptions— Whisper-compatible - Text-to-Speech —
/v1/audio/speech— Multi-provider audio synthesis - Moderations —
/v1/moderations— Content safety checks - Reranking —
/v1/rerank— Document relevance reranking - Responses API — Full
/v1/responsessupport for Codex
🧪 14. "I have no way to test and compare quality across models"
Developers want to know which model is best for their use case — code, translation, reasoning — but comparing manually is slow. No integrated eval tools exist.
How OmniRoute solves it:
- LLM Evaluations — Golden set testing with 10 pre-loaded cases covering greetings, math, geography, code generation, JSON compliance, translation, markdown, safety refusal
- 4 Match Strategies —
exact,contains,regex,custom(JS function) - Translator Playground Test Bench — Batch testing with multiple inputs and expected outputs, cross-provider comparison
- Chat Tester — Full round-trip with visual response rendering
- Live Monitor — Real-time stream of all requests flowing through the proxy
📈 15. "I need to scale without losing performance"
As request volume grows, without caching the same questions generate duplicate costs. Without idempotency, duplicate requests waste processing. Per-provider rate limits must be respected.
How OmniRoute solves it:
- Semantic Cache — Two-tier cache (signature + semantic) reduces cost and latency
- Request Idempotency — 5s deduplication window for identical requests
- Rate Limit Detection — Per-provider RPM, min gap, and max concurrent tracking
- Editable Rate Limits — Configurable defaults in Settings → Resilience with persistence
- API Key Validation Cache — 3-tier cache for production performance
- Health Dashboard with Telemetry — p50/p95/p99 latency, cache stats, uptime
🤖 16. "I want to control model behavior globally"
Developers who want all responses in a specific language, with a specific tone, or want to limit reasoning tokens. Configuring this in every tool/request is impractical.
How OmniRoute solves it:
- System Prompt Injection — Global prompt applied to all requests
- Thinking Budget Validation — Reasoning token allocation control per request (passthrough, auto, custom, adaptive)
- 6 Routing Strategies — Global strategies that determine how requests are distributed
- Wildcard Router —
provider/*patterns route dynamically to any provider - Combo Enable/Disable Toggle — Toggle combos directly from the dashboard
- Provider Toggle — Enable/disable all connections for a provider with one click
- Blocked Providers — Exclude specific providers from
/v1/modelslisting
1. Cài đặt trên toàn cầu:
npm install -g omniroute
omniroute🎉 Trang tổng quan mở lúc http://localhost:20128
| Lệnh | Mô tả |
|---|---|
omniroute |
Máy chủ khởi động (cổng mặc định 20128) |
omniroute --port 3000 |
Sử dụng cổng tùy chỉnh |
omniroute --no-open |
Không tự động mở trình duyệt |
omniroute --help |
Hiển thị trợ giúp |
2. Kết nối nhà cung cấp MIỄN PHÍ:
Bảng điều khiển → Nhà cung cấp → Kết nối Mã Claude hoặc AntiGravity → Đăng nhập OAuth → Xong!
3. Sử dụng trong công cụ CLI của bạn:
Claude Code/Codex/Gemini CLI/OpenClaw/Cursor/Cline Settings:
Endpoint: http://localhost:20128/v1
API Key: [copy from dashboard]
Model: if/kimi-k2-thinking
Chỉ vậy thôi! Bắt đầu viết mã với các mô hình AI MIỄN PHÍ.
Thay thế - chạy từ nguồn:
cp .env.example .env
npm install
PORT=20128 NEXT_PUBLIC_BASE_URL=http://localhost:20128 npm run devOmniRoute có sẵn dưới dạng hình ảnh Docker công khai trên Docker Hub.
Chạy nhanh:
docker run -d \
--name omniroute \
--restart unless-stopped \
-p 20128:20128 \
-v omniroute-data:/app/data \
diegosouzapw/omniroute:latestVới tệp môi trường:
# Copy and edit .env first
cp .env.example .env
docker run -d \
--name omniroute \
--restart unless-stopped \
--env-file .env \
-p 20128:20128 \
-v omniroute-data:/app/data \
diegosouzapw/omniroute:latestSử dụng Docker Compose:
# Base profile (no CLI tools)
docker compose --profile base up -d
# CLI profile (Claude Code, Codex, OpenClaw built-in)
docker compose --profile cli up -d| Hình ảnh | Gắn thẻ | Kích thước | Mô tả |
|---|---|---|---|
diegosouzapw/omniroute |
latest |
~250MB | Bản phát hành ổn định mới nhất |
diegosouzapw/omniroute |
1.0.3 |
~250MB | Phiên bản hiện tại |
🆕 NEW! OmniRoute is now available as a native desktop application for Windows, macOS, and Linux.
- 🖥️ Native Window — Dedicated app window with system tray integration
- 🔄 Auto-Start — Launch OmniRoute on system login
- 🔔 Native Notifications — Get alerts for quota exhaustion or provider issues
- ⚡ One-Click Install — NSIS (Windows), DMG (macOS), AppImage (Linux)
- 🌐 Offline Mode — Works fully offline with bundled server
npm run electron:dev # Development mode
npm run electron:build # Current platform
npm run electron:build:win # Windows (.exe)
npm run electron:build:mac # macOS (.dmg)
npm run electron:build:linux # Linux (.AppImage)📖 Full documentation: electron/README.md
| Bậc | Nhà cung cấp | Chi phí | Đặt lại hạn ngạch | Tốt nhất cho |
|---|---|---|---|---|
| 💳 ĐĂNG KÝ | Mã Claude (Pro) | $20/tháng | 5h + hàng tuần | Đã đăng ký |
| Codex (Plus/Pro) | $20-200/tháng | 5h + hàng tuần | Người dùng OpenAI | |
| Song Tử CLI | MIỄN PHÍ | 180K/tháng + 1K/ngày | Mọi người! | |
| Phi công phụ GitHub | $10-19/tháng | Hàng tháng | Người dùng GitHub | |
| 🔑 KHÓA API | NVIDIA NIM | MIỄN PHÍ (1000 tín dụng) | Một lần | Kiểm tra bậc miễn phí |
| DeepSeek | Trả tiền cho mỗi lần sử dụng | Không có | Giá/chất lượng tốt nhất | |
| Groq | Cấp miễn phí + trả phí | Tỷ lệ giới hạn | Suy luận cực nhanh | |
| xAI (Grok) | Trả tiền cho mỗi lần sử dụng | Không có | Mô hình Grok | |
| Mistral | Cấp miễn phí + trả phí | Tỷ lệ giới hạn | AI Châu Âu | |
| OpenRouter | Trả tiền cho mỗi lần sử dụng | Không có | Hơn 100 mẫu | |
| 💰 RẺ | GLM-4.7 | 0,6 USD/1 triệu USD | 10 giờ sáng hàng ngày | Dự phòng ngân sách |
| MiniMax M2.1 | 0,2 USD/1 triệu USD | lăn 5 giờ | Lựa chọn rẻ nhất | |
| Kimi K2 | $9/tháng căn hộ | 10 triệu token/tháng | Chi phí dự đoán | |
| 🆓 MIỄN PHÍ | iFlow | $0 | Không giới hạn | 8 mẫu miễn phí |
| Qwen | $0 | Không giới hạn | 3 mẫu miễn phí | |
| Kiro | $0 | Không giới hạn | Claude miễn phí |
💡 Mẹo chuyên nghiệp: Bắt đầu với Gemini CLI (180K miễn phí/tháng) + combo iFlow (miễn phí không giới hạn) = chi phí $0!
| Tính năng | Nó làm gì |
|---|---|
| 🎯 Dự phòng 4 tầng thông minh | Tự động định tuyến: Đăng ký → Khóa API → Giá rẻ → Miễn phí |
| 📊 Theo dõi hạn ngạch theo thời gian thực | Số lượng mã thông báo trực tiếp + đếm ngược đặt lại cho mỗi nhà cung cấp |
| 🔄 Dịch định dạng | OpenAI ↔ Claude ↔ Gemini ↔ Con trỏ ↔ Kiro liền mạch + vệ sinh phản hồi |
| 👥 Hỗ trợ nhiều tài khoản | Nhiều tài khoản cho mỗi nhà cung cấp với lựa chọn thông minh |
| 🔄 Tự động làm mới mã thông báo | Mã thông báo OAuth tự động làm mới bằng thử lại |
| 🎨 Combo tùy chỉnh | 6 chiến lược: điền trước, quay vòng, p2c, ngẫu nhiên, ít sử dụng nhất, tối ưu hóa chi phí |
| 🧩 Mẫu tùy chỉnh | Thêm bất kỳ ID mẫu nào vào bất kỳ nhà cung cấp nào |
| 🌐 Bộ định tuyến ký tự đại diện | Định tuyến động các mẫu provider/* tới bất kỳ nhà cung cấp nào |
| 🧠 Ngân sách suy nghĩ | Các chế độ truyền qua, tự động, tùy chỉnh và thích ứng cho các mô hình lý luận |
| 🔀 Model Aliases | Auto-forward deprecated model IDs to current replacements (built-in + custom) |
| ⚡ Background Degradation | Auto-route background tasks (titles, summaries) to cheaper models |
| 💬 Tiêm nhắc nhở hệ thống | Lời nhắc hệ thống toàn cầu được áp dụng cho tất cả các yêu cầu |
| 📄 API phản hồi | Hỗ trợ đầy đủ API phản hồi OpenAI (/v1/responses) cho Codex |
| Tính năng | Nó làm gì |
|---|---|
| 🖼️ Tạo hình ảnh | /v1/images/generations — 4 nhà cung cấp, hơn 9 mô hình |
| 📐 Nhúng | /v1/embeddings — 6 nhà cung cấp, hơn 9 mô hình |
| 🎤 Phiên âm âm thanh | /v1/audio/transcriptions — Tương thích với lời thì thầm |
| 🔊 Chuyển văn bản thành giọng nói | /v1/audio/speech — Tổng hợp âm thanh từ nhiều nhà cung cấp |
| 🛡️ Kiểm duyệt | /v1/moderations — Kiểm tra an toàn nội dung |
| 🔀 Sắp xếp lại | /v1/rerank — Sắp xếp lại mức độ liên quan của tài liệu |
| Tính năng | Nó làm gì |
|---|---|
| 🔌 Ngắt mạch | Tự động mở/đóng theo từng nhà cung cấp với các ngưỡng có thể định cấu hình |
| 🛡️ Bầy chống sấm sét | Mutex + giới hạn tốc độ semaphore cho nhà cung cấp khóa API |
| 🧠 Bộ đệm ngữ nghĩa | Bộ đệm hai lớp (chữ ký + ngữ nghĩa) giảm chi phí và độ trễ |
| ⚡ Yêu cầu quyền bình đẳng | Khoảng thời gian loại trừ 5 giây đối với các yêu cầu trùng lặp |
| 🔒 Giả mạo vân tay TLS | Bỏ qua việc phát hiện bot dựa trên TLS thông qua wreq-js |
| 🌐 Lọc IP | Danh sách cho phép/danh sách chặn để kiểm soát truy cập API |
| 📊 Giới hạn tỷ lệ có thể chỉnh sửa | RPM có thể định cấu hình, khoảng cách tối thiểu và đồng thời tối đa ở cấp hệ thống |
| 💾 Rate Limit Persistence | Learned limits survive restarts via SQLite with 60s debounce + 24h staleness |
| 🔄 Token Refresh Resilience | Per-provider circuit breaker (5 fails→30min) + 30s timeout per attempt |
| 🛡 Bảo vệ điểm cuối API | Kiểm soát xác thực + chặn nhà cung cấp cho điểm cuối /models |
| 🔒 Khả năng hiển thị proxy | Huy hiệu được mã hóa màu: 🟢 toàn cầu, 🟡 nhà cung cấp, 🔵 mỗi kết nối với màn hình IP |
| 🌐 Cấu hình proxy 3 cấp | Định cấu hình proxy ở cấp độ toàn cầu, theo nhà cung cấp hoặc theo từng kết nối |
| Tính năng | Nó làm gì |
|---|---|
| 📝 Yêu cầu ghi nhật ký | Chế độ gỡ lỗi với nhật ký yêu cầu/phản hồi đầy đủ |
| 💾 Nhật ký proxy SQLite | Nhật ký proxy liên tục vẫn tồn tại khi khởi động lại máy chủ |
| 📊 Bảng thông tin phân tích | Recharts-Powered: thẻ thống kê, biểu đồ sử dụng mô hình, bảng nhà cung cấp |
| 📈 Theo dõi tiến độ | Chọn tham gia các sự kiện tiến trình SSE để phát trực tuyến |
| 🧪 Đánh giá LLM | Thử nghiệm set vàng với 4 chiến thuật trận đấu |
| 🔍 Yêu cầu đo từ xa | tổng hợp độ trễ p50/p95/p99 + theo dõi X-Request-Id |
| 📋 Bảng điều khiển nhật ký | Trang 4 tab hợp nhất: Nhật ký yêu cầu, Nhật ký proxy, Nhật ký kiểm tra, Bảng điều khiển |
| 🖥️ Trình xem nhật ký bảng điều khiển | Trình xem kiểu thiết bị đầu cuối thời gian thực với bộ lọc cấp độ, tìm kiếm, tự động cuộn |
| 📑 Ghi nhật ký dựa trên tệp | Trình chặn chặn của bảng điều khiển ghi lại tất cả đầu ra vào tệp nhật ký JSON bằng cách xoay |
| 🏥 Bảng thông tin sức khỏe | Thời gian hoạt động của hệ thống, trạng thái ngắt mạch, khóa, số liệu thống kê bộ đệm |
| 💰 Theo dõi chi phí | Quản lý ngân sách + cấu hình giá theo từng mô hình |
| Tính năng | Nó làm gì |
|---|---|
| 💾 Đồng bộ đám mây | Đồng bộ hóa cấu hình trên các thiết bị thông qua Cloudflare Workers |
| 🌐 Triển khai mọi nơi | Localhost, VPS, Docker, Công nhân Cloudflare |
| 🔑 Quản lý khóa API | Tạo, xoay vòng và phạm vi khóa API cho mỗi nhà cung cấp |
| 🧙 Trình hướng dẫn giới thiệu | Thiết lập có hướng dẫn 4 bước cho người dùng lần đầu |
| 🔧 Bảng điều khiển công cụ CLI | Định cấu hình bằng một cú nhấp chuột Claude, Codex, Cline, OpenClaw, Kilo, AntiGravity |
| 🔄 Sao lưu DB | Tự động sao lưu, khôi phục, xuất và nhập cho tất cả cài đặt |
| 🌐 Quốc tế hóa | I18n đầy đủ với hỗ trợ next-intl — Tiếng Anh + Tiếng Bồ Đào Nha (Brazil) |
| 🌍 Bộ chọn ngôn ngữ | Biểu tượng quả địa cầu trong tiêu đề để chuyển đổi ngôn ngữ theo thời gian thực (🇺🇸/🇧🇷) |
| 📂 Thư mục dữ liệu tùy chỉnh | DATA_DIR env var để ghi đè đường dẫn lưu trữ ~/.omniroute mặc định |
📖 Chi tiết tính năng
Tạo combo với dự phòng tự động:
Combo: "my-coding-stack"
1. cc/claude-opus-4-6 (your subscription)
2. nvidia/llama-3.3-70b (free NVIDIA API)
3. glm/glm-4.7 (cheap backup, $0.6/1M)
4. if/kimi-k2-thinking (free fallback)
→ Auto switches when quota runs out or errors occur
- Tiêu thụ mã thông báo trên mỗi nhà cung cấp
- Đặt lại đếm ngược (5 giờ, hàng ngày, hàng tuần)
- Ước tính chi phí cho các bậc trả phí
- Báo cáo chi tiêu hàng tháng
Dịch liền mạch giữa các định dạng:
- OpenAI ↔ Claude ↔ Gemini ↔ Phản hồi của OpenAI
- Công cụ CLI của bạn gửi định dạng OpenAI → OmniRoute dịch → Nhà cung cấp nhận định dạng gốc
- Hoạt động với mọi công cụ hỗ trợ điểm cuối OpenAI tùy chỉnh
- Sạch hóa phản hồi — Loại bỏ các trường không chuẩn để tương thích nghiêm ngặt với OpenAI SDK
- Chuẩn hóa vai trò —
developer→systemđối với non-OpenAI;system→userdành cho kiểu máy GLM/ERNIE - Trích xuất thẻ suy nghĩ —
<think>khối →reasoning_contentcho các mô hình tư duy - Đầu ra có cấu trúc —
json_schema→responseMimeType/responseSchemacủa Gemini
- Thêm nhiều tài khoản cho mỗi nhà cung cấp
- Tự động định tuyến vòng tròn hoặc dựa trên mức độ ưu tiên
- Dự phòng tài khoản tiếp theo khi đạt hạn ngạch
- Mã thông báo OAuth tự động làm mới trước khi hết hạn
- Không cần xác thực lại thủ công
- Trải nghiệm liền mạch trên tất cả các nhà cung cấp
- Tạo kết hợp mô hình không giới hạn
- 6 chiến lược: điền trước, quay vòng, sức mạnh của hai lựa chọn, ngẫu nhiên, ít sử dụng nhất, tối ưu hóa chi phí
- Chia sẻ combo trên các thiết bị với Cloud Sync
- Trạng thái hệ thống (thời gian hoạt động, phiên bản, mức sử dụng bộ nhớ)
- Trạng thái ngắt mạch của mỗi nhà cung cấp (Đóng/Mở/Nửa mở)
- Trạng thái giới hạn tỷ lệ và khóa hoạt động
- Thống kê bộ đệm chữ ký
- Đo từ xa độ trễ (p50/p95/p99) + bộ đệm nhắc nhở
- Đặt lại tình trạng sức khỏe chỉ bằng một cú nhấp chuột
OmniRoute bao gồm Sân chơi dịch thuật tích hợp mạnh mẽ với 4 chế độ để gỡ lỗi, kiểm tra và giám sát các bản dịch API:
| Chế độ | Mô tả |
|---|---|
| 💻Sân chơi | Dịch định dạng trực tiếp - dán bất kỳ nội dung yêu cầu API nào và xem ngay cách OmniRoute dịch nó giữa các định dạng nhà cung cấp (OpenAI ↔ Claude ↔ Gemini ↔ API phản hồi). Bao gồm các mẫu ví dụ và tự động phát hiện định dạng. |
| 💬 Trình kiểm tra trò chuyện | Gửi các yêu cầu trò chuyện thực tế thông qua OmniRoute và xem toàn bộ hành trình: thông tin đầu vào của bạn, yêu cầu được dịch, phản hồi của nhà cung cấp và phản hồi được dịch lại. Vô giá để xác nhận định tuyến kết hợp. |
| 🧪 Ghế thử nghiệm | Chế độ thử nghiệm hàng loạt - xác định nhiều trường hợp thử nghiệm với đầu vào và đầu ra dự kiến khác nhau, chạy tất cả chúng cùng một lúc và so sánh kết quả giữa các nhà cung cấp và mô hình. |
| 📱 Giám sát trực tiếp | Giám sát yêu cầu theo thời gian thực — xem các yêu cầu đến khi chúng truyền qua OmniRoute, xem các bản dịch định dạng đang diễn ra trực tiếp và xác định các vấn đề ngay lập tức. |
Truy cập: Bảng điều khiển → Trình dịch (thanh bên)
- Đồng bộ hóa nhà cung cấp, combo và cài đặt trên các thiết bị
- Đồng bộ nền tự động
- Lưu trữ được mã hóa an toàn
Vấn đề: Hạn ngạch hết hạn không được sử dụng, giới hạn tốc độ trong quá trình mã hóa nặng
Combo: "maximize-claude"
1. cc/claude-opus-4-6 (use subscription fully)
2. glm/glm-4.7 (cheap backup when quota out)
3. if/kimi-k2-thinking (free emergency fallback)
Monthly cost: $20 (subscription) + ~$5 (backup) = $25 total
vs. $20 + hitting limits = frustration
Vấn đề: Không đủ khả năng đăng ký, cần mã hóa AI đáng tin cậy
Combo: "free-forever"
1. gc/gemini-3-flash (180K free/month)
2. if/kimi-k2-thinking (unlimited free)
3. qw/qwen3-coder-plus (unlimited free)
Monthly cost: $0
Quality: Production-ready models
Vấn đề: Thời hạn, không đủ khả năng cho thời gian ngừng hoạt động
Combo: "always-on"
1. cc/claude-opus-4-6 (best quality)
2. cx/gpt-5.2-codex (second subscription)
3. glm/glm-4.7 (cheap, resets daily)
4. minimax/MiniMax-M2.1 (cheapest, 5h reset)
5. if/kimi-k2-thinking (free unlimited)
Result: 5 layers of fallback = zero downtime
Vấn đề: Cần trợ lý AI trong ứng dụng nhắn tin, hoàn toàn miễn phí
Combo: "openclaw-free"
1. if/glm-4.7 (unlimited free)
2. if/minimax-m2.1 (unlimited free)
3. if/kimi-k2-thinking (unlimited free)
Monthly cost: $0
Access via: WhatsApp, Telegram, Slack, Discord, iMessage, Signal...
💳 Nhà cung cấp đăng ký
Dashboard → Providers → Connect Claude Code
→ OAuth login → Auto token refresh
→ 5-hour + weekly quota tracking
Models:
cc/claude-opus-4-6
cc/claude-sonnet-4-5-20250929
cc/claude-haiku-4-5-20251001Mẹo chuyên nghiệp: Sử dụng Opus cho các tác vụ phức tạp, Sonnet cho tốc độ. OmniRoute theo dõi hạn ngạch cho mỗi mô hình!
Dashboard → Providers → Connect Codex
→ OAuth login (port 1455)
→ 5-hour + weekly reset
Models:
cx/gpt-5.2-codex
cx/gpt-5.1-codex-maxDashboard → Providers → Connect Gemini CLI
→ Google OAuth
→ 180K completions/month + 1K/day
Models:
gc/gemini-3-flash-preview
gc/gemini-2.5-proGiá trị tốt nhất: Cấp miễn phí rất lớn! Sử dụng điều này trước các bậc trả phí.
Dashboard → Providers → Connect GitHub
→ OAuth via GitHub
→ Monthly reset (1st of month)
Models:
gh/gpt-5
gh/claude-4.5-sonnet
gh/gemini-3-pro🔑 Nhà cung cấp khóa API
- Đăng ký: build.nvidia.com
- Nhận khóa API miễn phí (bao gồm 1000 tín dụng suy luận)
- Bảng điều khiển → Thêm nhà cung cấp → NVIDIA NIM:
- Khóa API:
nvapi-your-key
- Khóa API:
Mẫu máy: nvidia/llama-3.3-70b-instruct, nvidia/mistral-7b-instruct và hơn 50 mẫu khác
Mẹo chuyên nghiệp: API tương thích với OpenAI — hoạt động trơn tru với tính năng dịch định dạng của OmniRoute!
- Đăng ký: platform.deepseek.com
- Nhận khóa API
- Trang tổng quan → Thêm nhà cung cấp → DeepSeek
Mẫu xe: deepseek/deepseek-chat, deepseek/deepseek-coder
- Đăng ký: console.groq.com
- Nhận khóa API (bao gồm bậc miễn phí)
- Bảng điều khiển → Thêm nhà cung cấp → Groq
Mẫu xe: groq/llama-3.3-70b, groq/mixtral-8x7b
Mẹo chuyên nghiệp: Suy luận cực nhanh — tốt nhất cho mã hóa thời gian thực!
- Sign up: openrouter.ai
- Nhận khóa API
- Bảng điều khiển → Thêm nhà cung cấp → OpenRouter
Mô hình: Truy cập hơn 100 mô hình từ tất cả các nhà cung cấp chính thông qua một khóa API duy nhất.
💰 Nhà cung cấp giá rẻ (Dự phòng)
- Đăng ký: Zhipu AI
- Nhận khóa API từ Gói mã hóa
- Bảng điều khiển → Thêm khóa API:
- Nhà cung cấp:
glm - Khóa API:
your-key
- Nhà cung cấp:
Sử dụng: glm/glm-4.7
Mẹo chuyên nghiệp: Gói mã hóa cung cấp hạn ngạch 3× với chi phí 1/7! Đặt lại vào 10:00 sáng hàng ngày.
- Đăng ký: MiniMax
- Nhận khóa API
- Bảng điều khiển → Thêm khóa API
Sử dụng: minimax/MiniMax-M2.1
Mẹo chuyên nghiệp: Tùy chọn rẻ nhất cho ngữ cảnh dài (1 triệu mã thông báo)!
- Đăng ký: Moonshot AI
- Nhận khóa API
- Bảng điều khiển → Thêm khóa API
Sử dụng: kimi/kimi-latest
Mẹo chuyên nghiệp: Đã sửa lỗi 9 USD/tháng cho 10 triệu mã thông báo = 0,90 USD/1 triệu chi phí hiệu quả!
🆓 Nhà cung cấp MIỄN PHÍ (Dự phòng khẩn cấp)
Dashboard → Connect iFlow
→ iFlow OAuth login
→ Unlimited usage
Models:
if/kimi-k2-thinking
if/qwen3-coder-plus
if/glm-4.7
if/minimax-m2
if/deepseek-r1Dashboard → Connect Qwen
→ Device code authorization
→ Unlimited usage
Models:
qw/qwen3-coder-plus
qw/qwen3-coder-flashDashboard → Connect Kiro
→ AWS Builder ID or Google/GitHub
→ Unlimited usage
Models:
kr/claude-sonnet-4.5
kr/claude-haiku-4.5🎨 Tạo Combo
Dashboard → Combos → Create New
Name: premium-coding
Models:
1. cc/claude-opus-4-6 (Subscription primary)
2. glm/glm-4.7 (Cheap backup, $0.6/1M)
3. minimax/MiniMax-M2.1 (Cheapest fallback, $0.20/1M)
Use in CLI: premium-coding
Name: free-combo
Models:
1. gc/gemini-3-flash-preview (180K free/month)
2. if/kimi-k2-thinking (unlimited)
3. qw/qwen3-coder-plus (unlimited)
Cost: $0 forever!
🔧 Tích hợp CLI
Settings → Models → Advanced:
OpenAI API Base URL: http://localhost:20128/v1
OpenAI API Key: [from OmniRoute dashboard]
Model: cc/claude-opus-4-6
Sử dụng trang Công cụ CLI trong trang tổng quan để định cấu hình bằng một cú nhấp chuột hoặc chỉnh sửa ~/.claude/settings.json theo cách thủ công.
export OPENAI_BASE_URL="http://localhost:20128"
export OPENAI_API_KEY="your-omniroute-api-key"
codex "your prompt"Tùy chọn 1 — Trang tổng quan (được khuyến nghị):
Dashboard → CLI Tools → OpenClaw → Select Model → Apply
Tùy chọn 2 — Thủ công: Chỉnh sửa ~/.openclaw/openclaw.json:
{
"models": {
"providers": {
"omniroute": {
"baseUrl": "http://127.0.0.1:20128/v1",
"apiKey": "sk_omniroute",
"api": "openai-completions"
}
}
}
}Lưu ý: OpenClaw chỉ hoạt động với OmniRoute cục bộ. Sử dụng
127.0.0.1thay vìlocalhostđể tránh các vấn đề về độ phân giải IPv6.
Settings → API Configuration:
Provider: OpenAI Compatible
Base URL: http://localhost:20128/v1
API Key: [from OmniRoute dashboard]
Model: if/kimi-k2-thinking
OmniRoute bao gồm khung đánh giá tích hợp để kiểm tra chất lượng phản hồi LLM dựa trên bộ vàng. Truy cập thông qua Analytics → Đánh giá trong bảng điều khiển.
"Bộ vàng OmniRoute" được tải sẵn chứa 10 trường hợp thử nghiệm bao gồm:
- Lời chào, toán, địa lý, tạo mã
- Tuân thủ định dạng JSON, dịch thuật, đánh dấu
- Từ chối an toàn (nội dung có hại), đếm, logic boolean
| Chiến lược | Mô tả | Ví dụ |
|---|---|---|
exact |
Đầu ra phải khớp chính xác | "4" |
contains |
Đầu ra phải chứa chuỗi con (không phân biệt chữ hoa chữ thường) | "Paris" |
regex |
Đầu ra phải khớp với mẫu biểu thức chính quy | "1.*2.*3" |
custom |
Hàm JS tùy chỉnh trả về true/false | (output) => output.length > 10 |
Nhấp để mở rộng hướng dẫn khắc phục sự cố
"Mô hình ngôn ngữ không cung cấp tin nhắn"
- Đã hết hạn ngạch nhà cung cấp → Kiểm tra trình theo dõi hạn ngạch bảng điều khiển
- Giải pháp: Sử dụng combo dự phòng hoặc chuyển sang tầng rẻ hơn
Giới hạn tỷ lệ
- Hết hạn ngạch đăng ký → Dự phòng sang GLM/MiniMax
- Thêm tổ hợp:
cc/claude-opus-4-6 → glm/glm-4.7 → if/kimi-k2-thinking
Mã thông báo OAuth đã hết hạn
- Tự động làm mới bởi OmniRoute
- Nếu sự cố vẫn tiếp diễn: Bảng điều khiển → Nhà cung cấp → Kết nối lại
Chi phí cao
- Kiểm tra số liệu thống kê sử dụng trong Bảng điều khiển → Chi phí
- Chuyển mô hình chính sang GLM/MiniMax
- Sử dụng bậc miễn phí (Gemini CLI, iFlow) cho các tác vụ không quan trọng
Bảng điều khiển mở sai cổng
- Đặt
PORT=20128vàNEXT_PUBLIC_BASE_URL=http://localhost:20128
Lỗi đồng bộ hóa đám mây
- Xác minh
BASE_URLtrỏ tới phiên bản đang chạy của bạn - Xác minh
CLOUD_URLđiểm tới điểm cuối đám mây dự kiến của bạn - Giữ các giá trị
NEXT_PUBLIC_*được căn chỉnh với các giá trị phía máy chủ
Đăng nhập lần đầu không hoạt động
- Kiểm tra
INITIAL_PASSWORDtrong.env - Nếu không được đặt, mật khẩu dự phòng là
123456
Không có nhật ký yêu cầu
- Đặt
ENABLE_REQUEST_LOGS=truetrong.env
Kiểm tra kết nối cho thấy "Không hợp lệ" đối với các nhà cung cấp tương thích với OpenAI
- Nhiều nhà cung cấp không hiển thị điểm cuối
/models - OmniRoute v1.0.6+ bao gồm xác thực dự phòng thông qua hoàn thành trò chuyện
- Đảm bảo URL cơ sở bao gồm hậu tố
/v1
⚠️ QUAN TRỌNG đối với người sử dụng OmniRoute trên VPS/Docker/servidor remoto
Bởi vì OAuth làm cho AntiGravity / Gemini CLI có bị ảnh hưởng bởi các dịch vụ điều khiển từ xa không?
Os đã được chứng minh AntiGravity e Gemini CLI sử dụng Google OAuth 2.0 để xác thực. O Google exige que a redirect_uri usada no fluxo OAuth seja exatamente một trong các URI trước khi lập danh sách trên Google Cloud Console để ứng dụng.
Vì các thông tin xác thực OAuth không có OmniRoute estão cadastradas apenas para localhost. Bạn có thể truy cập OmniRoute bằng cách điều khiển lại máy chủ (ví dụ: https://omniroute.meuservidor.com), hoặc Google sẽ cung cấp thông tin xác thực với:
Error 400: redirect_uri_mismatch
Bạn nên chú ý OAuth 2.0 Client ID không có Google Cloud Console vì URI làm dịch vụ của bạn.
1. Truy cập vào Google Cloud Console
Abra: https://console.cloud.google.com/apis/credentials
2. Hãy yêu cầu ID khách hàng OAuth 2.0 mới
- Nhấn vào "+ Tạo thông tin xác thực" → "ID khách hàng OAuth"
- Mẹo ứng dụng: "Ứng dụng web"
- Tên: escolha qualquer nome (ví dụ:
OmniRoute Remote)
3. Adicione dưới dạng URI chuyển hướng được ủy quyền
Không có quảng cáo "URI chuyển hướng được ủy quyền", khuyến cáo:
https://seu-servidor.com/callback
Thay thế
seu-servidor.comtừ địa chỉ IP hoặc dịch vụ IP của bạn (bao gồm một cổng cần thiết, ví dụ:http://45.33.32.156:20128/callback).
4. Lưu và sao chép dưới dạng uy tín
Sau đó, Google đã đăng trên ID khách hàng và Bí mật khách hàng.
5. Định cấu hình theo các biến thể của môi trường
Không có .env (hoặc có nhiều biến thể môi trường xung quanh Docker):
# Para Antigravity:
ANTIGRAVITY_OAUTH_CLIENT_ID=seu-client-id.apps.googleusercontent.com
ANTIGRAVITY_OAUTH_CLIENT_SECRET=GOCSPX-seu-secret
# Para Gemini CLI:
GEMINI_OAUTH_CLIENT_ID=seu-client-id.apps.googleusercontent.com
GEMINI_OAUTH_CLIENT_SECRET=GOCSPX-seu-secret
GEMINI_CLI_OAUTH_CLIENT_SECRET=GOCSPX-seu-secret6. Reinicie hoặc OmniRoute
# Se usando npm:
npm run dev
# Se usando Docker:
docker restart omniroute7. Lều kết nối mới lạ
Bảng điều khiển → Nhà cung cấp → Anti Gravity (hoặc Gemini CLI) → OAuth
Google đã chuyển hướng điều chỉnh cho https://seu-servidor.com/callback và một chức năng xác thực.
Nếu không có câu hỏi nào về thông tin xác thực trước đây, bạn có thể sử dụng thông tin hướng dẫn sử dụng URL:
- O OmniRoute tìm kiếm URL tự động của Google
- Sau khi bạn tự động đăng ký, hoặc chuyển hướng Google sang
localhost(bạn không thể điều chỉnh lại dịch vụ) - Sao chép một URL hoàn chỉnh da cuối cùng của trình duyệt của bạn (mesmo que a página not carregue)
- URL này không có khả năng xuất hiện không có phương thức kết nối nào với OmniRoute
- Kết nối với nhau "Kết nối"
Chức năng giải pháp này có thể giúp tự động cấp quyền cho URL và có thể chuyển hướng độc lập đến mục tiêu hoặc không.
- Thời gian chạy: Node.js 18–22 LTS (
⚠️ Node.js 24+ không được hỗ trợ —better-sqlite3các tệp nhị phân gốc không tương thích) - Ngôn ngữ: TypeScript 5.9 — 100% TypeScript trên
src/vàopen-sse/(v1.0.6) - Khung: Next.js 16 + React 19 + Tailwind CSS 4
- Cơ sở dữ liệu: LowDB (JSON) + SQLite (trạng thái miền + nhật ký proxy)
- Truyền phát: Sự kiện do máy chủ gửi (SSE)
- Xác thực: OAuth 2.0 (PKCE) + JWT + Khóa API
- Thử nghiệm: Trình chạy thử nghiệm Node.js (hơn 368 bài kiểm tra đơn vị)
- CI/CD: GitHub Actions (tự động xuất bản npm + Docker Hub khi phát hành)
- Trang web: omniroute.online
- Gói: npmjs.com/package/omniroute
- Docker: hub.docker.com/r/diegosouzapw/omniroute
- Khả năng phục hồi: Ngắt mạch, lùi theo cấp số nhân, chống sét bầy đàn, giả mạo TLS
| Tài liệu | Mô tả |
|---|---|
| User Guide | Nhà cung cấp, combo, tích hợp CLI, triển khai |
| API Reference | Tất cả các điểm cuối có ví dụ |
| Troubleshooting | Các vấn đề thường gặp và giải pháp |
| Architecture | Kiến trúc hệ thống và nội bộ |
| Contributing | Thiết lập và hướng dẫn phát triển |
| OpenAPI Spec | Đặc tả OpenAPI 3.0 |
| Security Policy | Báo cáo lỗ hổng bảo mật và thực hành bảo mật |
| VM Deployment | Hướng dẫn đầy đủ: Thiết lập VM + nginx + Cloudflare |
| Features Gallery | Tham quan bảng điều khiển trực quan với ảnh chụp màn hình |
Nhấp để xem ảnh chụp màn hình trang tổng quan
| Trang | Ảnh chụp màn hình |
|---|---|
| Nhà cung cấp | ![]() |
| Combo | ![]() |
| Phân tích | ![]() |
| Sức khỏe | ![]() |
| Người dịch | ![]() |
| Cài đặt | ![]() |
| Công cụ CLI | ![]() |
| Nhật ký sử dụng | ![]() |
| Điểm cuối | ![]() |
OmniRoute có 210+ tính năng được lên kế hoạch qua nhiều giai đoạn phát triển. Dưới đây là các lĩnh vực chính:
| Danh mục | Tính năng dự kiến | Điểm nổi bật |
|---|---|---|
| 🧠 Định tuyến & thông minh | 25+ | Định tuyến có độ trễ thấp nhất, định tuyến dựa trên thẻ, ưu tiên hạn ngạch, chọn tài khoản P2C |
| 🔒 Bảo mật & Tuân thủ | 20+ | Tăng cường SSRF, che giấu thông tin xác thực, giới hạn tốc độ cho mỗi điểm cuối, phạm vi khóa quản lý |
| 📊 Khả năng quan sát | 15+ | Tích hợp OpenTelemetry, giám sát hạn ngạch thời gian thực, theo dõi chi phí trên mỗi mô hình |
| 🔄 Tích hợp nhà cung cấp | 20+ | Đăng ký mô hình động, thời gian hồi chiêu của nhà cung cấp, Codex nhiều tài khoản, phân tích hạn ngạch Copilot |
| ⚡ Hiệu suất | 15+ | Lớp bộ đệm kép, bộ đệm nhắc nhở, bộ đệm phản hồi, lưu giữ luồng, API hàng loạt |
| 🌐 Hệ sinh thái | 10+ | API WebSocket, cấu hình tải lại nóng, kho cấu hình phân tán, chế độ thương mại |
- 🔗 Tích hợp OpenCode — Hỗ trợ của nhà cung cấp gốc cho IDE mã hóa OpenCode AI
- 🔗 Tích hợp TRAE — Hỗ trợ đầy đủ cho khung phát triển TRAE AI
- 📦 Batch API — Xử lý hàng loạt không đồng bộ cho các yêu cầu hàng loạt
- 🎯 Định tuyến dựa trên thẻ — Định tuyến các yêu cầu dựa trên thẻ và siêu dữ liệu tùy chỉnh
- 💰 Chiến lược chi phí thấp nhất — Tự động chọn nhà cung cấp có sẵn rẻ nhất
📝 Thông số kỹ thuật đầy đủ tính năng có sẵn trong link (217 thông số kỹ thuật chi tiết)
💬 Tham gia cộng đồng của chúng tôi! WhatsApp Group — Nhận trợ giúp, chia sẻ mẹo và luôn cập nhật.
- Trang web: omniroute.online
- GitHub: github.com/diegosouzapw/OmniRoute
- Vấn đề: github.com/diegosouzapw/OmniRoute/issues
- WhatsApp: Community Group
- Dự án gốc: 9router by decolua
- Phân nhánh kho lưu trữ
- Tạo nhánh tính năng của bạn (
git checkout -b feature/amazing-feature) - Cam kết thay đổi của bạn (
git commit -m 'Add amazing feature') - Đẩy vào nhánh (
git push origin feature/amazing-feature) - Mở yêu cầu kéo
Xem CONTRIBUTING.md để biết hướng dẫn chi tiết.
# Create a release — npm publish happens automatically
gh release create v1.0.6 --title "v1.0.6" --generate-notesĐặc biệt cảm ơn 9router của decolua — dự án ban đầu đã truyền cảm hứng cho đợt phân nhánh này. OmniRoute được xây dựng dựa trên nền tảng đáng kinh ngạc đó với các tính năng bổ sung, API đa phương thức và viết lại TypeScript đầy đủ.
Đặc biệt cảm ơn CLIProxyAPI — cách triển khai Go ban đầu đã truyền cảm hứng cho cổng JavaScript này.
Giấy phép MIT - xem LICENSE để biết chi tiết.
omniroute.online








