ユニバーサル API プロキシ — 1 つのエンドポイント、36 以上のプロバイダー、ダウンタイムなし。
**チャット補完 • 埋め込み • 画像生成 • オーディオ • 再ランキング • 100% TypeScript **
AI を活用した IDE または CLI ツールを、無制限のコーディングのための無料 API ゲートウェイである OmniRoute 経由で接続します。
|
OpenClaw ⭐ 205K |
NanoBot ⭐ 20.9K |
PicoClaw ⭐ 14.6K |
ZeroClaw ⭐ 9.9K |
IronClaw ⭐ 2.1K |
|
OpenCode ⭐ 106K |
Codex CLI ⭐ 60.8K |
Claude Code ⭐ 67.3K |
Gemini CLI ⭐ 94.7K |
Kilo Code ⭐ 15.5K |
📡 すべてのエージェントは http://localhost:20128/v1 または http://cloud.omniroute.online/v1 経由で接続します — 1 つの構成、無制限のモデルとクォータ
🌐 ウェブサイト • 🚀 クイックスタート • 💡 主な機能 • 📖 ドキュメント • 💰 料金 • 💬 WhatsApp
🌐 対応言語: 🇺🇸 English | 🇧🇷 Português (Brasil) | 🇪🇸 Español | 🇫🇷 Français | 🇮🇹 Italiano | 🇷🇺 Русский | 🇨🇳 中文 (简体) | 🇩🇪 Deutsch | 🇮🇳 हिन्दी | 🇹🇭 ไทย | 🇺🇦 Українська | 🇸🇦 العربية | 🇯🇵 日本語 | 🇻🇳 Tiếng Việt | 🇧🇬 Български | 🇩🇰 Dansk | 🇫🇮 Suomi | 🇮🇱 עברית | 🇭🇺 Magyar | 🇮🇩 Bahasa Indonesia | 🇰🇷 한국어 | 🇲🇾 Bahasa Melayu | 🇳🇱 Nederlands | 🇳🇴 Norsk | 🇵🇹 Português (Portugal) | 🇷🇴 Română | 🇵🇱 Polski | 🇸🇰 Slovenčina | 🇸🇪 Svenska | 🇵🇭 Filipino
お金の無駄遣いや限界に達するのはやめましょう:
サブスクリプション割り当ては毎月未使用のまま期限切れになります
レート制限によりコーディングの途中で停止する
高価な API (プロバイダーごとに月額 20 ~ 50 ドル)
プロバイダー間の手動切り替え
OmniRoute はこれを解決します:
- ✅ サブスクリプションを最大化 - クォータを追跡し、リセットする前にすべてのビットを使用します
- ✅ 自動フォールバック - サブスクリプション → API キー → 安価 → 無料、ダウンタイムなし
- ✅ マルチアカウント - プロバイダーごとのアカウント間のラウンドロビン
- ✅ ユニバーサル - Claude Code、Codex、Gemini CLI、Cursor、Cline、OpenClaw、あらゆる CLI ツールで動作します
┌─────────────┐
│ Your CLI │ (Claude Code, Codex, Gemini CLI, OpenClaw, Cursor, Cline...)
│ Tool │
└──────┬──────┘
│ http://localhost:20128/v1
↓
┌─────────────────────────────────────────┐
│ OmniRoute (Smart Router) │
│ • Format translation (OpenAI ↔ Claude) │
│ • Quota tracking + Embeddings + Images │
│ • Auto token refresh │
└──────┬──────────────────────────────────┘
│
├─→ [Tier 1: SUBSCRIPTION] Claude Code, Codex, Gemini CLI
│ ↓ quota exhausted
├─→ [Tier 2: API KEY] DeepSeek, Groq, xAI, Mistral, NVIDIA NIM, etc.
│ ↓ budget limit
├─→ [Tier 3: CHEAP] GLM ($0.6/1M), MiniMax ($0.2/1M)
│ ↓ budget limit
└─→ [Tier 4: FREE] iFlow, Qwen, Kiro (unlimited)
Result: Never stop coding, minimal cost
Every developer using AI tools faces these problems daily. OmniRoute was built to solve them all — from cost overruns to regional blocks, from broken OAuth flows to zero observability.
💸 1. "I pay for an expensive subscription but still get interrupted by limits"
Developers pay $20–200/month for Claude Pro, Codex Pro, or GitHub Copilot. Even paying, quota has a ceiling — 5h of usage, weekly limits, or per-minute rate limits. Mid-coding session, the provider stops responding and the developer loses flow and productivity.
How OmniRoute solves it:
- Smart 4-Tier Fallback — If subscription quota runs out, automatically redirects to API Key → Cheap → Free with zero manual intervention
- Real-Time Quota Tracking — Shows token consumption in real-time with reset countdown (5h, daily, weekly)
- Multi-Account Support — Multiple accounts per provider with auto round-robin — when one runs out, switches to the next
- Custom Combos — Customizable fallback chains with 6 balancing strategies (fill-first, round-robin, P2C, random, least-used, cost-optimized)
- Codex Business Quotas — Business/Team workspace quota monitoring directly in the dashboard
🔌 2. "I need to use multiple providers but each has a different API"
OpenAI uses one format, Claude (Anthropic) uses another, Gemini yet another. If a dev wants to test models from different providers or fallback between them, they need to reconfigure SDKs, change endpoints, deal with incompatible formats. Custom providers (FriendLI, NIM) have non-standard model endpoints.
How OmniRoute solves it:
- Unified Endpoint — A single
http://localhost:20128/v1serves as proxy for all 36+ providers - Format Translation — Automatic and transparent: OpenAI ↔ Claude ↔ Gemini ↔ Responses API
- Response Sanitization — Strips non-standard fields (
x_groq,usage_breakdown,service_tier) that break OpenAI SDK v1.83+ - Role Normalization — Converts
developer→systemfor non-OpenAI providers;system→userfor GLM/ERNIE - Think Tag Extraction — Extracts
<think>blocks from models like DeepSeek R1 into standardizedreasoning_content - Structured Output for Gemini —
json_schema→responseMimeType/responseSchemaautomatic conversion streamdefaults tofalse— Aligns with OpenAI spec, avoiding unexpected SSE in Python/Rust/Go SDKs
🌐 3. "My AI provider blocks my region/country"
Providers like OpenAI/Codex block access from certain geographic regions. Users get errors like unsupported_country_region_territory during OAuth and API connections. This is especially frustrating for developers from developing countries.
How OmniRoute solves it:
- 3-Level Proxy Config — Configurable proxy at 3 levels: global (all traffic), per-provider (one provider only), and per-connection/key
- Color-Coded Proxy Badges — Visual indicators: 🟢 global proxy, 🟡 provider proxy, 🔵 connection proxy, always showing the IP
- OAuth Token Exchange Through Proxy — OAuth flow also goes through the proxy, solving
unsupported_country_region_territory - Connection Tests via Proxy — Connection tests use the configured proxy (no more direct bypass)
- SOCKS5 Support — Full SOCKS5 proxy support for outbound routing
- TLS Fingerprint Spoofing — Browser-like TLS fingerprint via
wreq-jsto bypass bot detection
🆓 4. "I want to use AI for coding but I have no money"
Not everyone can pay $20–200/month for AI subscriptions. Students, devs from emerging countries, hobbyists, and freelancers need access to quality models at zero cost.
How OmniRoute solves it:
- Free Tier Providers Built-in — Native support for 100% free providers: iFlow (8 unlimited models), Qwen (3 unlimited models), Kiro (Claude for free), Gemini CLI (180K/month free)
- Free-Only Combos — Chain
gc/gemini-3-flash → if/kimi-k2-thinking → qw/qwen3-coder-plus= $0/month with zero downtime - NVIDIA NIM Free Credits — 1000 free credits integrated
- Cost Optimized Strategy — Routing strategy that automatically chooses the cheapest available provider
🔒 5. "I need to protect my AI gateway from unauthorized access"
When exposing an AI gateway to the network (LAN, VPS, Docker), anyone with the address can consume the developer's tokens/quota. Without protection, APIs are vulnerable to misuse, prompt injection, and abuse.
How OmniRoute solves it:
- API Key Management — Generation, rotation, and scoping per provider with a dedicated
/dashboard/api-managerpage - Model-Level Permissions — Restrict API keys to specific models (
openai/*, wildcard patterns), with Allow All/Restrict toggle - API Endpoint Protection — Require a key for
/v1/modelsand block specific providers from the listing - Auth Guard + CSRF Protection — All dashboard routes protected with
withAuthmiddleware + CSRF tokens - Rate Limiter — Per-IP rate limiting with configurable windows
- IP Filtering — Allowlist/blocklist for access control
- Prompt Injection Guard — Sanitization against malicious prompt patterns
- AES-256-GCM Encryption — Credentials encrypted at rest
🛑 6. "My provider went down and I lost my coding flow"
AI providers can become unstable, return 5xx errors, or hit temporary rate limits. If a dev depends on a single provider, they're interrupted. Without circuit breakers, repeated retries can crash the application.
How OmniRoute solves it:
- Circuit Breaker per-provider — Auto-open/close with configurable thresholds and cooldown (Closed/Open/Half-Open)
- Exponential Backoff — Progressive retry delays
- Anti-Thundering Herd — Mutex + semaphore protection against concurrent retry storms
- Combo Fallback Chains — If the primary provider fails, automatically falls through the chain with no intervention
- Combo Circuit Breaker — Auto-disables failing providers within a combo chain
- Health Dashboard — Uptime monitoring, circuit breaker states, lockouts, cache stats, p50/p95/p99 latency
🔧 7. "Configuring each AI tool is tedious and repetitive"
Developers use Cursor, Claude Code, Codex CLI, OpenClaw, Gemini CLI, Kilo Code... Each tool needs a different config (API endpoint, key, model). Reconfiguring when switching providers or models is a waste of time.
How OmniRoute solves it:
- CLI Tools Dashboard — Dedicated page with one-click setup for Claude Code, Codex CLI, OpenClaw, Kilo Code, Antigravity, Cline
- GitHub Copilot Config Generator — Generates
chatLanguageModels.jsonfor VS Code with bulk model selection - Onboarding Wizard — Guided 4-step setup for first-time users
- One endpoint, all models — Configure
http://localhost:20128/v1once, access 36+ providers
🔑 8. "Managing OAuth tokens from multiple providers is hell"
Claude Code, Codex, Gemini CLI, Copilot — all use OAuth 2.0 with expiring tokens. Developers need to re-authenticate constantly, deal with client_secret is missing, redirect_uri_mismatch, and failures on remote servers. OAuth on LAN/VPS is particularly problematic.
How OmniRoute solves it:
- Auto Token Refresh — OAuth tokens refresh in background before expiration
- OAuth 2.0 (PKCE) Built-in — Automatic flow for Claude Code, Codex, Gemini CLI, Copilot, Kiro, Qwen, iFlow
- Multi-Account OAuth — Multiple accounts per provider via JWT/ID token extraction
- OAuth LAN/Remote Fix — Private IP detection for
redirect_uri+ manual URL mode for remote servers - OAuth Behind Nginx — Uses
window.location.originfor reverse proxy compatibility - Remote OAuth Guide — Step-by-step guide for Google Cloud credentials on VPS/Docker
📊 9. "I don't know how much I'm spending or where"
Developers use multiple paid providers but have no unified view of spending. Each provider has its own billing dashboard, but there's no consolidated view. Unexpected costs can pile up.
How OmniRoute solves it:
- Cost Analytics Dashboard — Per-token cost tracking and budget management per provider
- Budget Limits per Tier — Spending ceiling per tier that triggers automatic fallback
- Per-Model Pricing Configuration — Configurable prices per model
- Usage Statistics Per API Key — Request count and last-used timestamp per key
- Analytics Dashboard — Stat cards, model usage chart, provider table with success rates and latency
🐛 10. "I can't diagnose errors and problems in AI calls"
When a call fails, the dev doesn't know if it was a rate limit, expired token, wrong format, or provider error. Fragmented logs across different terminals. Without observability, debugging is trial-and-error.
How OmniRoute solves it:
- Unified Logs Dashboard — 4 tabs: Request Logs, Proxy Logs, Audit Logs, Console
- Console Log Viewer — Real-time terminal-style viewer with color-coded levels, auto-scroll, search, filter
- SQLite Proxy Logs — Persistent logs that survive server restarts
- Translator Playground — 4 debugging modes: Playground (format translation), Chat Tester (round-trip), Test Bench (batch), Live Monitor (real-time)
- Request Telemetry — p50/p95/p99 latency + X-Request-Id tracing
- File-Based Logging with Rotation — Console interceptor captures everything to JSON log with size-based rotation
🏗️ 11. "Deploying and maintaining the gateway is complex"
Installing, configuring, and maintaining an AI proxy across different environments (local, VPS, Docker, cloud) is labor-intensive. Problems like hardcoded paths, EACCES on directories, port conflicts, and cross-platform builds add friction.
How OmniRoute solves it:
- npm global install —
npm install -g omniroute && omniroute— done - Docker Multi-Platform — AMD64 + ARM64 native (Apple Silicon, AWS Graviton, Raspberry Pi)
- Docker Compose Profiles —
base(no CLI tools) andcli(with Claude Code, Codex, OpenClaw) - Electron Desktop App — Native app for Windows/macOS/Linux with system tray, auto-start, offline mode
- Split-Port Mode — API and Dashboard on separate ports for advanced scenarios (reverse proxy, container networking)
- Cloud Sync — Config synchronization across devices via Cloudflare Workers
- DB Backups — Automatic backup, restore, export and import of all settings
🌍 12. "The interface is English-only and my team doesn't speak English"
Teams in non-English-speaking countries, especially in Latin America, Asia, and Europe, struggle with English-only interfaces. Language barriers reduce adoption and increase configuration errors.
How OmniRoute solves it:
- Dashboard i18n — 30 Languages — All 500+ keys translated including Arabic, Bulgarian, Danish, German, Spanish, Finnish, French, Hebrew, Hindi, Hungarian, Indonesian, Italian, Japanese, Korean, Malay, Dutch, Norwegian, Polish, Portuguese (PT/BR), Romanian, Russian, Slovak, Swedish, Thai, Ukrainian, Vietnamese, Chinese, Filipino, English
- RTL Support — Right-to-left support for Arabic and Hebrew
- Multi-Language READMEs — 30 complete documentation translations
- Language Selector — Globe icon in header for real-time switching
🔄 13. "I need more than chat — I need embeddings, images, audio"
AI isn't just chat completion. Devs need to generate images, transcribe audio, create embeddings for RAG, rerank documents, and moderate content. Each API has a different endpoint and format.
How OmniRoute solves it:
- Embeddings —
/v1/embeddingswith 6 providers and 9+ models - Image Generation —
/v1/images/generationswith 4 providers and 9+ models - Audio Transcription —
/v1/audio/transcriptions— Whisper-compatible - Text-to-Speech —
/v1/audio/speech— Multi-provider audio synthesis - Moderations —
/v1/moderations— Content safety checks - Reranking —
/v1/rerank— Document relevance reranking - Responses API — Full
/v1/responsessupport for Codex
🧪 14. "I have no way to test and compare quality across models"
Developers want to know which model is best for their use case — code, translation, reasoning — but comparing manually is slow. No integrated eval tools exist.
How OmniRoute solves it:
- LLM Evaluations — Golden set testing with 10 pre-loaded cases covering greetings, math, geography, code generation, JSON compliance, translation, markdown, safety refusal
- 4 Match Strategies —
exact,contains,regex,custom(JS function) - Translator Playground Test Bench — Batch testing with multiple inputs and expected outputs, cross-provider comparison
- Chat Tester — Full round-trip with visual response rendering
- Live Monitor — Real-time stream of all requests flowing through the proxy
📈 15. "I need to scale without losing performance"
As request volume grows, without caching the same questions generate duplicate costs. Without idempotency, duplicate requests waste processing. Per-provider rate limits must be respected.
How OmniRoute solves it:
- Semantic Cache — Two-tier cache (signature + semantic) reduces cost and latency
- Request Idempotency — 5s deduplication window for identical requests
- Rate Limit Detection — Per-provider RPM, min gap, and max concurrent tracking
- Editable Rate Limits — Configurable defaults in Settings → Resilience with persistence
- API Key Validation Cache — 3-tier cache for production performance
- Health Dashboard with Telemetry — p50/p95/p99 latency, cache stats, uptime
🤖 16. "I want to control model behavior globally"
Developers who want all responses in a specific language, with a specific tone, or want to limit reasoning tokens. Configuring this in every tool/request is impractical.
How OmniRoute solves it:
- System Prompt Injection — Global prompt applied to all requests
- Thinking Budget Validation — Reasoning token allocation control per request (passthrough, auto, custom, adaptive)
- 6 Routing Strategies — Global strategies that determine how requests are distributed
- Wildcard Router —
provider/*patterns route dynamically to any provider - Combo Enable/Disable Toggle — Toggle combos directly from the dashboard
- Provider Toggle — Enable/disable all connections for a provider with one click
- Blocked Providers — Exclude specific providers from
/v1/modelslisting
1.グローバルにインストール:
npm install -g omniroute
omniroute🎉 ダッシュボードは http://localhost:20128 に開きます
| コマンド | 説明 |
|---|---|
omniroute |
サーバーを起動します (デフォルトのポート 20128) |
omniroute --port 3000 |
カスタムポートを使用する |
omniroute --no-open |
ブラウザを自動的に開かない |
omniroute --help |
ヘルプを表示 |
2.無料のプロバイダーに接続します:
ダッシュボード → プロバイダー → Claude Code または Antigravity に接続 → OAuth ログイン → 完了!
3. CLI ツールで使用します:
Claude Code/Codex/Gemini CLI/OpenClaw/Cursor/Cline Settings:
Endpoint: http://localhost:20128/v1
API Key: [copy from dashboard]
Model: if/kimi-k2-thinking
それだけです! 無料の AI モデルを使用してコーディングを始めましょう。
代替 — ソースから実行:
cp .env.example .env
npm install
PORT=20128 NEXT_PUBLIC_BASE_URL=http://localhost:20128 npm run devOmniRoute は、Docker Hub のパブリック Docker イメージとして利用できます。
クイック実行:
docker run -d \
--name omniroute \
--restart unless-stopped \
-p 20128:20128 \
-v omniroute-data:/app/data \
diegosouzapw/omniroute:latest環境ファイルあり:
# Copy and edit .env first
cp .env.example .env
docker run -d \
--name omniroute \
--restart unless-stopped \
--env-file .env \
-p 20128:20128 \
-v omniroute-data:/app/data \
diegosouzapw/omniroute:latestDocker Compose の使用:
# Base profile (no CLI tools)
docker compose --profile base up -d
# CLI profile (Claude Code, Codex, OpenClaw built-in)
docker compose --profile cli up -d| 画像 | タグ | サイズ | 説明 |
|---|---|---|---|
diegosouzapw/omniroute |
latest |
~250MB | 最新の安定版リリース |
diegosouzapw/omniroute |
1.0.3 |
~250MB | 現在のバージョン |
🆕 新機能! OmniRouteがネイティブデスクトップアプリケーションとしてWindows、macOS、Linuxで利用可能になりました。
- 🖥️ ネイティブウィンドウ — システムトレイ統合付きの専用ウィンドウ
- 🔄 自動起動 — システムログイン時にOmniRouteを起動
- 🔔 ネイティブ通知 — クォータ枯渇やプロバイダー問題のアラート
- ⚡ ワンクリックインストール — NSIS (Windows)、DMG (macOS)、AppImage (Linux)
- 🌐 オフラインモード — 内蔵サーバーで完全オフライン動作
npm run electron:dev # 開発モード
npm run electron:build # 現在のプラットフォーム
npm run electron:build:win # Windows (.exe)
npm run electron:build:mac # macOS (.dmg)
npm run electron:build:linux # Linux (.AppImage)📖 完全なドキュメント:electron/README.md
| 階層 | プロバイダー | コスト | クォータのリセット | 最適な用途 |
|---|---|---|---|---|
| 💳 サブスクリプション | クロード・コード (プロ) | $20/月 | 5 時間 + 毎週 | すでに購読済み |
| コーデックス (プラス/プロ) | $20-200/月 | 5 時間 + 毎週 | OpenAI ユーザー | |
| ジェミニ CLI | 無料 | 180K/月 + 1K/日 | みんな! | |
| GitHub コパイロット | $10-19/月 | 月刊 | GitHub ユーザー | |
| 🔑 API キー | NVIDIA NIM | 無料 (1000 クレジット) | ワンタイム | 無料枠のテスト |
| ディープシーク | 従量課金制 | なし | 最高の価格/品質 | |
| グロク | 無料利用枠 + 有料 | レート制限 | 超高速推論 | |
| xAI (グロック) | 従量課金制 | なし | Grok モデル | |
| ミストラル | 無料利用枠 + 有料 | レート制限 | ヨーロッパのAI | |
| オープンルーター | 従量課金制 | なし | 100 以上のモデル | |
| 💰安い | GLM-4.7 | $0.6/100万 | 毎日午前 10 時 | 予算のバックアップ |
| ミニマックス M2.1 | $0.2/100万 | 5時間ローリング | 最も安いオプション | |
| キミ K2 | 月額 9 ドルのフラット | 1,000 万トークン/月 | 予測可能なコスト | |
| 🆓 無料 | iFlow | $0 | 無制限 | 8 モデルは無料 |
| クウェン | $0 | 無制限 | 3 モデルは無料 | |
| キロ | $0 | 無制限 | クロード・フリー |
💡 プロのヒント: Gemini CLI (180,000 無料/月) + iFlow (無制限の無料) コンボ = コスト 0 ドルから始めましょう!
| 特集 | 何をするのか |
|---|---|
| 🎯 スマート 4 層フォールバック | 自動ルート: サブスクリプション → API キー → 格安 → 無料 |
| 📊 リアルタイムのクォータ追跡 | プロバイダーごとのライブ トークン数 + リセット カウントダウン |
| 🔄 フォーマット変換 | OpenAI ↔ Claude ↔ Gemini ↔ Cursor ↔ Kiro シームレス + 応答サニタイズ |
| 👥 マルチアカウントのサポート | インテリジェントな選択によるプロバイダーごとの複数のアカウント |
| 🔄 自動トークン更新 | OAuth トークンは再試行によって自動的に更新されます。 |
| 🎨 カスタムコンボ | 6 つの戦略: フィルファースト、ラウンドロビン、p2c、ランダム、最小使用、コスト最適化 |
| 🧩 カスタムモデル | 任意のモデル ID を任意のプロバイダーに追加する |
| 🌐 ワイルドカードルーター | provider/* パターンを任意のプロバイダーに動的にルーティングする |
| 🧠 予算を考える | 推論モデルのパススルー、自動、カスタム、および適応モード |
| 🔀 Model Aliases | Auto-forward deprecated model IDs to current replacements (built-in + custom) |
| ⚡ Background Degradation | Auto-route background tasks (titles, summaries) to cheaper models |
| 💬 システム プロンプト インジェクション | すべてのリクエストに適用されるグローバル システム プロンプト |
| 📄 レスポンス API | Codex の OpenAI Response API (/v1/responses) の完全なサポート |
| 特集 | 何をするのか |
|---|---|
| 🖼️ 画像生成 | /v1/images/generations — 4 つのプロバイダー、9 つ以上のモデル |
| 📐 埋め込み | /v1/embeddings — 6 つのプロバイダー、9 つ以上のモデル |
| 🎤 音声文字起こし | /v1/audio/transcriptions — ウィスパー互換 |
| 🔊 テキスト読み上げ | /v1/audio/speech — マルチプロバイダーのオーディオ合成 |
| 🛡️ モデレーション | /v1/moderations — コンテンツの安全性チェック |
| 🔀 再ランキング | /v1/rerank — ドキュメントの関連性の再ランキング |
| 特集 | 何をするのか |
|---|---|
| 🔌 サーキットブレーカー | 設定可能なしきい値によるプロバイダーごとの自動開閉 |
| 🛡️ 対雷鳴の群れ | API キープロバイダーのミューテックス + セマフォのレート制限 |
| 🧠 セマンティック キャッシュ | 2 層キャッシュ (シグネチャ + セマンティック) によりコストと遅延が削減 |
| ⚡ 冪等性のリクエスト | 重複リクエストに対する 5 秒の重複除去ウィンドウ |
| 🔒 TLS 指紋スプーフィング | wreq-js 経由で TLS ベースのボット検出をバイパスする |
| 🌐 IP フィルタリング | API アクセス制御の許可リスト/ブロックリスト |
| 📊 編集可能なレート制限 | システム レベルで構成可能な RPM、最小ギャップ、最大同時実行 |
| 💾 Rate Limit Persistence | Learned limits survive restarts via SQLite with 60s debounce + 24h staleness |
| 🔄 Token Refresh Resilience | Per-provider circuit breaker (5 fails→30min) + 30s timeout per attempt |
| 🛡 API エンドポイント保護 | /models エンドポイントの認証ゲート + プロバイダー ブロック |
| 🔒 プロキシの可視性 | 色分けされたバッジ: 🟢 グローバル、🟡 プロバイダー、🔵 IP 表示による接続ごと |
| 🌐 3 レベルのプロキシ構成 | グローバル、プロバイダーごと、または接続ごとのレベルでプロキシを構成する |
| 特集 | 何をするのか |
|---|---|
| 📝 リクエストログ | 完全なリクエスト/レスポンス ログを含むデバッグ モード |
| 💾 SQLite プロキシ ログ | 永続的なプロキシ ログはサーバーの再起動後も存続します。 |
| 📊 分析ダッシュボード | Recharts を活用: 統計カード、モデル使用状況チャート、プロバイダー テーブル |
| 📈 進捗状況の追跡 | ストリーミング用の SSE 進行状況イベントをオプトインする |
| 🧪 LLM 評価 | 4 つの試合戦略によるゴールデン セット テスト |
| 🔍 テレメトリのリクエスト | p50/p95/p99 レイテンシ集計 + X-Request-Id トレース |
| 📋 ログ ダッシュボード | 統合された 4 つのタブ ページ: リクエスト ログ、プロキシ ログ、監査ログ、コンソール |
| 🖥️ コンソール ログ ビューア | レベルフィルター、検索、自動スクロール機能を備えたリアルタイムターミナルスタイルのビューア |
| 📑 ファイルベースのロギング | コンソール インターセプターは、ローテーションを使用してすべての出力を JSON ログ ファイルにキャプチャします。 |
| 🏥 健康ダッシュボード | システム稼働時間、サーキット ブレーカーの状態、ロックアウト、キャッシュ統計 |
| 💰 コスト追跡 | 予算管理 + モデルごとの価格設定 |
| 特集 | 何をするのか |
|---|---|
| 💾 クラウド同期 | Cloudflare Workers 経由でデバイス間で構成を同期する |
| 🌐 どこにでも展開 | Localhost、VPS、Docker、Cloudflare ワーカー |
| 🔑 API キー管理 | プロバイダーごとに API キーを生成、ローテーション、スコープ設定する |
| 🧙 オンボーディング ウィザード | 初めてのユーザーのための 4 ステップのガイド付きセットアップ |
| 🔧 CLI ツール ダッシュボード | Claude、Codex、Cline、OpenClaw、Kilo、Antigravity をワンクリックで設定 |
| 🔄 DB バックアップ | すべての設定の自動バックアップ、復元、エクスポートとインポート |
| 🌐 国際化 | next-intl を備えた完全な i18n — 英語 + ポルトガル語 (ブラジル) のサポート |
| 🌍 言語セレクター | リアルタイム言語切り替え用のヘッダーの地球儀アイコン (🇺🇸/🇧🇷) |
| 📂 カスタム データ ディレクトリ | デフォルトの ~/.omniroute ストレージ パスをオーバーライドする DATA_DIR 環境変数 |
📖 機能の詳細
自動フォールバックを使用してコンボを作成します。
Combo: "my-coding-stack"
1. cc/claude-opus-4-6 (your subscription)
2. nvidia/llama-3.3-70b (free NVIDIA API)
3. glm/glm-4.7 (cheap backup, $0.6/1M)
4. if/kimi-k2-thinking (free fallback)
→ Auto switches when quota runs out or errors occur
- プロバイダーごとのトークン消費量
- リセットカウントダウン(5時間、毎日、毎週)
- 有料レベルのコストの見積もり
- 毎月の支出レポート
フォーマット間でのシームレスな翻訳:
- OpenAI ↔ クロード ↔ ジェミニ ↔ OpenAI の応答
- CLI ツールが OpenAI 形式を送信 → OmniRoute が変換 → プロバイダーがネイティブ形式を受信
- カスタム OpenAI エンドポイントをサポートするあらゆるツールと連携
- レスポンスのサニタイズ — 厳密な OpenAI SDK 互換性のために非標準フィールドを削除します
- ロールの正規化 — 非 OpenAI の場合は
developer→system。system→user(GLM/ERNIE モデルの場合) - 思考タグの抽出 —
<think>ブロック → 思考モデル用のreasoning_content - 構造化された出力 —
json_schema→ Gemini のresponseMimeType/responseSchema
- プロバイダーごとに複数のアカウントを追加
- 自動ラウンドロビンまたは優先順位ベースのルーティング
- クォータに達した場合、次のアカウントにフォールバックします
- OAuth トークンは有効期限が切れる前に自動的に更新されます
- 手動による再認証は必要ありません
- すべてのプロバイダーにわたるシームレスなエクスペリエンス
- 無制限のモデルの組み合わせを作成
- 6 つの戦略: フィルファースト、ラウンドロビン、2 つの選択肢の累乗、ランダム、最小使用、コスト最適化
- Cloud Sync を使用してデバイス間でコンボを共有
- システムステータス (稼働時間、バージョン、メモリ使用量)
- プロバイダーごとのサーキットブレーカーの状態 (クローズ/オープン/ハーフオープン)
- レート制限ステータスとアクティブなロックアウト
- 署名キャッシュ統計
- レイテンシ テレメトリ (p50/p95/p99) + プロンプト キャッシュ
- ワンクリックで健康状態をリセット
OmniRoute には、API 翻訳のデバッグ、テスト、監視のための 4 つのモードを備えた強力な組み込みのトランスレータ プレイグラウンドが含まれています。
| モード | 説明 |
|---|---|
| 💻遊び場 | 直接形式変換 — API リクエスト本文を貼り付けると、OmniRoute がプロバイダー形式 (OpenAI ↔ Claude ↔ Gemini ↔ Responses API) 間でそれをどのように変換するかを即座に確認できます。テンプレートの例と形式の自動検出が含まれています。 |
| 💬 チャット テスター | 実際のチャット リクエストを OmniRoute 経由で送信すると、入力、翻訳されたリクエスト、プロバイダーの応答、そして返される翻訳された応答という完全なラウンドトリップを確認できます。コンボ ルーティングを検証するのに非常に役立ちます。 |
| 🧪 テストベンチ | バッチ テスト モード - 異なる入力と予想される出力を持つ複数のテスト ケースを定義し、それらをすべて一度に実行し、プロバイダーやモデル間で結果を比較します。 |
| 📱 ライブモニター | リアルタイムのリクエスト監視 — 受信リクエストが OmniRoute を通過するのを監視し、ライブで行われているフォーマット変換を確認し、問題を即座に特定します。 |
アクセス: ダッシュボード → トランスレーター (サイドバー)
- デバイス間でプロバイダー、コンボ、設定を同期します
- 自動バックグラウンド同期
- 安全な暗号化ストレージ
問題: 大量のコーディング中にクォータが使用されずに期限切れになり、レート制限が発生する
Combo: "maximize-claude"
1. cc/claude-opus-4-6 (use subscription fully)
2. glm/glm-4.7 (cheap backup when quota out)
3. if/kimi-k2-thinking (free emergency fallback)
Monthly cost: $20 (subscription) + ~$5 (backup) = $25 total
vs. $20 + hitting limits = frustration
問題: サブスクリプションを購入する余裕がないため、信頼性の高い AI コーディングが必要です
Combo: "free-forever"
1. gc/gemini-3-flash (180K free/month)
2. if/kimi-k2-thinking (unlimited free)
3. qw/qwen3-coder-plus (unlimited free)
Monthly cost: $0
Quality: Production-ready models
問題: 締め切りが迫っており、ダウンタイムを許すことができません
Combo: "always-on"
1. cc/claude-opus-4-6 (best quality)
2. cx/gpt-5.2-codex (second subscription)
3. glm/glm-4.7 (cheap, resets daily)
4. minimax/MiniMax-M2.1 (cheapest, 5h reset)
5. if/kimi-k2-thinking (free unlimited)
Result: 5 layers of fallback = zero downtime
問題: メッセージング アプリには AI アシスタントが必要ですが、完全に無料です
Combo: "openclaw-free"
1. if/glm-4.7 (unlimited free)
2. if/minimax-m2.1 (unlimited free)
3. if/kimi-k2-thinking (unlimited free)
Monthly cost: $0
Access via: WhatsApp, Telegram, Slack, Discord, iMessage, Signal...
💳 サブスクリプションプロバイダー
Dashboard → Providers → Connect Claude Code
→ OAuth login → Auto token refresh
→ 5-hour + weekly quota tracking
Models:
cc/claude-opus-4-6
cc/claude-sonnet-4-5-20250929
cc/claude-haiku-4-5-20251001プロのヒント: 複雑なタスクには Opus を使用し、速度を求める場合は Sonnet を使用します。 OmniRoute はモデルごとの割り当てを追跡します。
Dashboard → Providers → Connect Codex
→ OAuth login (port 1455)
→ 5-hour + weekly reset
Models:
cx/gpt-5.2-codex
cx/gpt-5.1-codex-maxDashboard → Providers → Connect Gemini CLI
→ Google OAuth
→ 180K completions/month + 1K/day
Models:
gc/gemini-3-flash-preview
gc/gemini-2.5-proベストバリュー: 膨大な無料枠!有料レベルの前にこれを使用してください。
Dashboard → Providers → Connect GitHub
→ OAuth via GitHub
→ Monthly reset (1st of month)
Models:
gh/gpt-5
gh/claude-4.5-sonnet
gh/gemini-3-pro🔑 API キープロバイダー
- サインアップ: build.nvidia.com
- 無料の API キーを取得します (1000 推論クレジットが含まれます)
- ダッシュボード → プロバイダーの追加 → NVIDIA NIM:
- API キー:
nvapi-your-key
- API キー:
モデル: nvidia/llama-3.3-70b-instruct、nvidia/mistral-7b-instruct、および 50 以上
プロのヒント: OpenAI 互換 API — OmniRoute のフォーマット変換とシームレスに連携します。
- サインアップ: platform.deepseek.com
- APIキーを取得する
- ダッシュボード → プロバイダーの追加 → DeepSeek
モデル: deepseek/deepseek-chat、deepseek/deepseek-coder
- サインアップ: console.groq.com
- API キーを取得します (無料利用枠を含む)
- ダッシュボード → プロバイダーの追加 → Groq
モデル: groq/llama-3.3-70b、groq/mixtral-8x7b
プロのヒント: 超高速推論 — リアルタイム コーディングに最適です。
- サインアップ: openrouter.ai
- APIキーを取得する
- ダッシュボード → プロバイダーの追加 → OpenRouter
モデル: 単一の API キーを通じて、すべての主要プロバイダーの 100 以上のモデルにアクセスします。
💰 格安プロバイダー (バックアップ)
- サインアップ: Zhipu AI 2.コーディングプランからAPIキーを取得
- ダッシュボード → API キーの追加:
- プロバイダー:
glm - API キー:
your-key
- プロバイダー:
使用方法: glm/glm-4.7
プロのヒント: コーディング プランでは、1/7 のコストで 3 倍の割り当てを提供します。毎日午前 10 時にリセットされます。
- サインアップ: MiniMax
- APIキーを取得する
- ダッシュボード → APIキーの追加
使用方法: minimax/MiniMax-M2.1
プロのヒント: 長いコンテキスト (100 万トークン) の最も安価なオプション!
- 購読: Moonshot AI
- APIキーを取得する
- ダッシュボード → APIキーの追加
使用方法: kimi/kimi-latest
プロのヒント: 1,000 万トークンの固定 $9/月 = 0.90 ドル/100 万の実効コスト!
🆓 無料プロバイダー (緊急バックアップ)
Dashboard → Connect iFlow
→ iFlow OAuth login
→ Unlimited usage
Models:
if/kimi-k2-thinking
if/qwen3-coder-plus
if/glm-4.7
if/minimax-m2
if/deepseek-r1Dashboard → Connect Qwen
→ Device code authorization
→ Unlimited usage
Models:
qw/qwen3-coder-plus
qw/qwen3-coder-flashDashboard → Connect Kiro
→ AWS Builder ID or Google/GitHub
→ Unlimited usage
Models:
kr/claude-sonnet-4.5
kr/claude-haiku-4.5🎨 コンボを作成
Dashboard → Combos → Create New
Name: premium-coding
Models:
1. cc/claude-opus-4-6 (Subscription primary)
2. glm/glm-4.7 (Cheap backup, $0.6/1M)
3. minimax/MiniMax-M2.1 (Cheapest fallback, $0.20/1M)
Use in CLI: premium-coding
Name: free-combo
Models:
1. gc/gemini-3-flash-preview (180K free/month)
2. if/kimi-k2-thinking (unlimited)
3. qw/qwen3-coder-plus (unlimited)
Cost: $0 forever!
🔧 CLI 統合
Settings → Models → Advanced:
OpenAI API Base URL: http://localhost:20128/v1
OpenAI API Key: [from OmniRoute dashboard]
Model: cc/claude-opus-4-6
ダッシュボードの CLI ツール ページを使用してワンクリック構成するか、~/.claude/settings.json を手動で編集します。
export OPENAI_BASE_URL="http://localhost:20128"
export OPENAI_API_KEY="your-omniroute-api-key"
codex "your prompt"オプション 1 — ダッシュボード (推奨):
Dashboard → CLI Tools → OpenClaw → Select Model → Apply
オプション 2 — 手動: ~/.openclaw/openclaw.json を編集:
{
"models": {
"providers": {
"omniroute": {
"baseUrl": "http://127.0.0.1:20128/v1",
"apiKey": "sk_omniroute",
"api": "openai-completions"
}
}
}
}注: OpenClaw はローカル OmniRoute でのみ機能します。 IPv6 解決の問題を回避するには、
localhostではなく127.0.0.1を使用してください。
Settings → API Configuration:
Provider: OpenAI Compatible
Base URL: http://localhost:20128/v1
API Key: [from OmniRoute dashboard]
Model: if/kimi-k2-thinking
OmniRoute には、ゴールデン セットに対して LLM 応答品質をテストするための評価フレームワークが組み込まれています。ダッシュボードの Analytics → Evals からアクセスします。
プリロードされた「OmniRoute Golden Set」には、以下をカバーする 10 のテスト ケースが含まれています。
- 挨拶、数学、地理、コード生成
- JSON形式への準拠、翻訳、マークダウン
- 安全拒否(有害なコンテンツ)、カウント、ブール論理
| 戦略 | 説明 | 例 |
|---|---|---|
exact |
出力は正確に一致する必要があります | "4" |
contains |
出力には部分文字列が含まれている必要があります (大文字と小文字は区別されません)。 "Paris" |
|
regex |
出力は正規表現パターンと一致する必要があります | "1.*2.*3" |
custom |
カスタム JS 関数は true/false を返します。 (output) => output.length > 10 |
クリックしてトラブルシューティング ガイドを展開
「言語モデルがメッセージを提供しませんでした」
- プロバイダー クォータが枯渇した → ダッシュボード クォータ トラッカーを確認してください
- 解決策: コンボフォールバックを使用するか、より安価なレベルに切り替える
レート制限
- サブスクリプション クォータ アウト → GLM/MiniMax へのフォールバック
- コンボを追加:
cc/claude-opus-4-6 → glm/glm-4.7 → if/kimi-k2-thinking
OAuth トークンの有効期限が切れました
- OmniRouteによる自動更新
- 問題が解決しない場合: ダッシュボード → プロバイダー → 再接続
高コスト
- [ダッシュボード] → [コスト] で使用状況の統計を確認します。
- プライマリ モデルを GLM/MiniMax に切り替えます
- 重要ではないタスクには無料枠 (Gemini CLI、iFlow) を使用する
ダッシュボードが間違ったポートで開きます
PORT=20128およびNEXT_PUBLIC_BASE_URL=http://localhost:20128を設定します
クラウド同期エラー
BASE_URLが実行中のインスタンスを指していることを確認しますCLOUD_URLが予想されるクラウド エンドポイントを指していることを確認しますNEXT_PUBLIC_*値をサーバー側の値と一致させます。
最初のログインが機能しない
.envのINITIAL_PASSWORDを確認してください- 設定されていない場合、フォールバック パスワードは
123456です
リクエストログなし
.envにENABLE_REQUEST_LOGS=trueを設定します
OpenAI 互換プロバイダーの接続テストで「無効」と表示される
- 多くのプロバイダーは
/modelsエンドポイントを公開していません - OmniRoute v1.0.6+ には、チャット完了によるフォールバック検証が含まれています
- ベース URL に
/v1サフィックスが含まれていることを確認してください
⚠️ VPS/Docker/サーバーリモートの OmniRoute に関する重要事項
反重力 と Gemini CLI を使用して Google OAuth 2.0 を認証します。 O Google exige que a redirect_uri usada no fluxo OAuth seja exatamente uma das URIs pré-cadastradas Google Cloud Console でアプリケーションを実行できません。
認証情報として OAuth は、localhost** の OmniRoute データベース管理機能を備えていません。 OmniRoute サーバー リモートへのアクセス (例: https://omniroute.meuservidor.com)、Google による認証:
Error 400: redirect_uri_mismatch
OAuth 2.0 クライアント ID では、Google Cloud Console の URI がサーバーを参照するための正確な基準が設定されています。
1. Google Cloud コンソールへのアクセス
アブラ: https://console.cloud.google.com/apis/credentials
2.新しい OAuth 2.0 クライアント ID
- Clique em 「+ 認証情報の作成」 → 「OAuth クライアント ID」
- 応用情報: 「Web アプリケーション」
- 名前: escolha qualquer 名前 (例:
OmniRoute Remote)
3.承認されたリダイレクト URI としての Adicione
「承認されたリダイレクト URI」 はありません、アディシオン:
https://seu-servidor.com/callback
seu-servidor.comを IP サーバーとして置き換えてください (必要なポータルを含む、例:http://45.33.32.156:20128/callback)。
4.コピーを認証情報として保存
Google のほとんどの情報、クライアント ID、または クライアント シークレット を使用してください。
5.環境変数として設定
.env は使用できません (Docker の環境変数を変更します):
# Para Antigravity:
ANTIGRAVITY_OAUTH_CLIENT_ID=seu-client-id.apps.googleusercontent.com
ANTIGRAVITY_OAUTH_CLIENT_SECRET=GOCSPX-seu-secret
# Para Gemini CLI:
GEMINI_OAUTH_CLIENT_ID=seu-client-id.apps.googleusercontent.com
GEMINI_OAUTH_CLIENT_SECRET=GOCSPX-seu-secret
GEMINI_CLI_OAUTH_CLIENT_SECRET=GOCSPX-seu-secret6.レイニシー・オ・オムニルート
# Se usando npm:
npm run dev
# Se usando Docker:
docker restart omniroute7.テンテ コネクター ノヴァメンテ
ダッシュボード → プロバイダー → Antigravity (Gemini CLI) → OAuth
https://seu-servidor.com/callback の認証機能を Google でリダイレクトして修正します。
URL のマニュアル:
- OmniRoute は Google の自動 URL を提供します
localhostによる Google の自動リダイレクト (サーバー リモートの要求)- URL をコピーしてください ブラウザを使用してブラウザを開きます (カレーグのページを表示します)
- コール エッサ URL は、OmniRoute の接続モーダルなしです。
- クリーク**「接続」**
自動回避策の機能は URL から独立してリダイレクトされます。
- ランタイム: Node.js 18–22 LTS (
⚠️ Node.js 24+ は サポートされていません —better-sqlite3ネイティブ バイナリは互換性がありません) - 言語: TypeScript 5.9 —
src/およびopen-sse/で 100% TypeScript (v1.0.6) - フレームワーク: Next.js 16 + React 19 + Tailwind CSS 4
- データベース: LowDB (JSON) + SQLite (ドメイン状態 + プロキシ ログ)
- ストリーミング: サーバー送信イベント (SSE)
- 認証: OAuth 2.0 (PKCE) + JWT + API キー
- テスト: Node.js テスト ランナー (368 以上の単体テスト)
- CI/CD: GitHub アクション (自動 npm パブリッシュ + リリース時の Docker Hub)
- ウェブサイト: omniroute.online
- パッケージ: npmjs.com/package/omniroute
- Docker: hub.docker.com/r/diegosouzapw/omniroute
- 復元力: サーキット ブレーカー、エクスポネンシャル バックオフ、サンダーリング ハード対策、TLS スプーフィング
| ドキュメント | 説明 |
|---|---|
| User Guide | プロバイダー、コンボ、CLI 統合、展開 |
| API Reference | すべてのエンドポイントと例 |
| Troubleshooting | よくある問題と解決策 |
| Architecture | システム アーキテクチャと内部構造 |
| Contributing | 開発セットアップとガイドライン |
| OpenAPI Spec | OpenAPI 3.0 仕様 |
| Security Policy | 脆弱性の報告とセキュリティの実践 |
| VM Deployment | 完全ガイド: VM + nginx + Cloudflare セットアップ |
| Features Gallery | スクリーンショットを含むビジュアル ダッシュボード ツアー |
OmniRoute には、複数の開発フェーズにわたって 210 以上の機能が計画されています。主要な領域は次のとおりです。
| カテゴリー | 計画されている機能 | ハイライト |
|---|---|---|
| 🧠 ルーティングとインテリジェンス | 25+ | 最低レイテンシのルーティング、タグベースのルーティング、クォータ プリフライト、P2C アカウントの選択 |
| 🔒 セキュリティとコンプライアンス | 20歳以上 | SSRF の強化、資格情報のクローキング、エンドポイントごとのレート制限、管理キーのスコーピング |
| 📊 可観測性 | 15 歳以上 | OpenTelemetry 統合、リアルタイム クォータ監視、モデルごとのコスト追跡 |
| 🔄 プロバイダーの統合 | 20歳以上 | 動的モデル レジストリ、プロバイダーのクールダウン、マルチアカウント Codex、Copilot クォータ解析 |
| ⚡ パフォーマンス | 15 歳以上 | デュアル キャッシュ レイヤー、プロンプト キャッシュ、応答キャッシュ、ストリーミング キープアライブ、バッチ API |
| 🌐 生態系 | 10+ | WebSocket API、構成ホットリロード、分散構成ストア、商用モード |
- 🔗 OpenCode Integration — OpenCode AI コーディング IDE のネイティブ プロバイダー サポート
- 🔗 TRAE 統合 — TRAE AI 開発フレームワークの完全サポート
- 📦 バッチ API — 一括リクエストの非同期バッチ処理
- 🎯 タグベースのルーティング — カスタムタグとメタデータに基づいてリクエストをルーティングします
- 💰 最低コスト戦略 — 利用可能な最も安価なプロバイダーを自動的に選択します
📝 link で全機能の仕様が利用可能 (217 の詳細仕様)
💬 コミュニティに参加してください! WhatsApp Group — ヘルプを取得し、ヒントを共有し、最新情報を入手してください。
- ウェブサイト: omniroute.online
- GitHub: github.com/diegosouzapw/OmniRoute
- 問題: github.com/diegosouzapw/OmniRoute/issues
- WhatsApp: Community Group
- オリジナル プロジェクト: 9router by decolua
- リポジトリをフォークする
- 機能ブランチを作成します (
git checkout -b feature/amazing-feature) - 変更をコミットします (
git commit -m 'Add amazing feature') - ブランチにプッシュします (
git push origin feature/amazing-feature) - プルリクエストを開く
詳細なガイドラインについては、CONTRIBUTING.md を参照してください。
# Create a release — npm publish happens automatically
gh release create v1.0.6 --title "v1.0.6" --generate-notesこのフォークのきっかけとなった元のプロジェクトである decolua による 9router に感謝します。 OmniRoute は、追加機能、マルチモーダル API、完全な TypeScript の書き換えを備えた素晴らしい基盤の上に構築されています。
この JavaScript 移植のきっかけとなったオリジナルの Go 実装である CLIProxyAPI に感謝します。
MIT ライセンス - 詳細については、LICENSE を参照してください。








