You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
🎯 Perkara yang Selesaikan OmniRoute — 30 Titik Sakit Nyata & Kes Penggunaan
Setiap pembangun yang menggunakan alatan AI menghadapi masalah ini setiap hari. OmniRoute dibina untuk menyelesaikan kesemuanya — daripada lebihan kos kepada blok serantau, daripada aliran OAuth yang rosak kepada operasi protokol dan kebolehmerhatian perusahaan.
💸 1. "Saya membayar untuk langganan yang mahal tetapi masih terganggu oleh had"
Pembangun membayar $20–200/bulan untuk Claude Pro, Codex Pro atau GitHub Copilot. Walaupun membayar, kuota mempunyai siling — 5j penggunaan, had mingguan atau had kadar seminit. Sesi pertengahan pengekodan, pembekal berhenti bertindak balas dan pembangun kehilangan aliran dan produktiviti.
Cara OmniRoute menyelesaikannya:
Smart 4-Tier Fallback — Jika kuota langganan habis, diubah hala secara automatik ke API Key → Murah → Percuma tanpa campur tangan manual
Penjejakan Kuota Masa Nyata — Menunjukkan penggunaan token dalam masa nyata dengan kira detik tetapan semula (5j, harian, mingguan)
Sokongan Berbilang Akaun — Berbilang akaun bagi setiap pembekal dengan auto round-robin — apabila satu kehabisan, beralih kepada yang seterusnya
Kombo Tersuai — Rantaian sandaran yang boleh disesuaikan dengan 6 strategi pengimbangan (isi dahulu, round-robin, P2C, rawak, paling kurang digunakan, dioptimumkan kos)
Kuota Perniagaan Codex — Pemantauan kuota ruang kerja Perniagaan/Pasukan terus dalam papan pemuka
🔌 2. "Saya perlu menggunakan berbilang penyedia tetapi setiap satu mempunyai API yang berbeza"
OpenAI menggunakan satu format, Claude (Anthropic) menggunakan satu lagi, Gemini satu lagi. Jika pembangun ingin menguji model daripada pembekal yang berbeza atau sandaran antara mereka, mereka perlu mengkonfigurasi semula SDK, menukar titik akhir, menangani format yang tidak serasi. Pembekal tersuai (FriendLI, NIM) mempunyai titik akhir model bukan standard.
Cara OmniRoute menyelesaikannya:
Titik Akhir Disatukan — Satu http://localhost:20128/v1 berfungsi sebagai proksi untuk kesemua 36+ pembekal
Format Terjemahan — Automatik dan telus: OpenAI ↔ Claude ↔ Gemini ↔ Responses API
Pembersihan Tindak Balas — Mengosongkan medan bukan standard (x_groq, usage_breakdown, service_tier) yang memecahkan OpenAI SDK v1.83+
Penormalan Peranan — Menukar developer → system untuk penyedia bukan OpenAI; system → user untuk GLM/ERNIE
Think Tag Extraction — Mengekstrak blok <think> daripada model seperti DeepSeek R1 ke dalam reasoning_content standard
Output Berstruktur untuk Gemini — json_schema → responseMimeType/responseSchema penukaran automatik
stream lalai kepada false — Menjajarkan dengan spesifikasi OpenAI, mengelakkan SSE yang tidak dijangka dalam Python/Rust/Go SDK
🌐 3. "Pembekal AI saya menyekat wilayah/negara saya"
Penyedia seperti OpenAI/Codex menyekat akses daripada kawasan geografi tertentu. Pengguna mendapat ralat seperti unsupported_country_region_territory semasa sambungan OAuth dan API. Ini amat mengecewakan bagi pemaju dari negara membangun.
Cara OmniRoute menyelesaikannya:
Konfigurasi Proksi 3 Tahap — Proksi boleh dikonfigurasikan pada 3 peringkat: global (semua trafik), setiap pembekal (satu pembekal sahaja) dan setiap sambungan/kunci
Lencana Proksi Berkod Warna — Penunjuk visual: 🟢 proksi global, 🟡 proksi pembekal, 🔵 proksi sambungan, sentiasa menunjukkan IP
Pertukaran Token OAuth Melalui Proksi — Aliran OAuth juga melalui proksi, menyelesaikan unsupported_country_region_territory
Ujian Sambungan melalui Proksi — Ujian sambungan menggunakan proksi yang dikonfigurasikan (tiada lagi pintasan langsung)
Sokongan SOCKS5 — Sokongan proksi SOCKS5 penuh untuk penghalaan keluar
TLS Fingerprint Spoofing — Cap jari TLS seperti pelayar melalui wreq-js untuk memintas pengesanan bot
🆓 4. "Saya mahu menggunakan AI untuk pengekodan tetapi saya tidak mempunyai wang"
Tidak semua orang boleh membayar $20–200/bulan untuk langganan AI. Pelajar, pembangun dari negara baru muncul, penggemar dan pekerja bebas memerlukan akses kepada model berkualiti pada kos sifar.
Cara OmniRoute menyelesaikannya:
Pembekal Peringkat Percuma Terbina dalam — Sokongan asli untuk 100% pembekal percuma: iFlow (8 model tanpa had), Qwen (3 model tanpa had), Kiro (Claude secara percuma), Gemini CLI (180K/bulan percuma)
Kombo Percuma Sahaja — Rantaian gc/gemini-3-flash → if/kimi-k2-thinking → qw/qwen3-coder-plus = $0/bulan dengan masa henti sifar
Kredit Percuma NVIDIA NIM — 1000 kredit percuma disepadukan
Strategi Dioptimumkan Kos — Strategi penghalaan yang secara automatik memilih pembekal yang tersedia paling murah
🔒 5. "Saya perlu melindungi gerbang AI saya daripada akses tanpa kebenaran"
Apabila mendedahkan get laluan AI kepada rangkaian (LAN, VPS, Docker), sesiapa sahaja yang mempunyai alamat boleh menggunakan token/kuota pembangun. Tanpa perlindungan, API terdedah kepada penyalahgunaan, suntikan segera dan penyalahgunaan.
Cara OmniRoute menyelesaikannya:
Pengurusan Kunci API — Penjanaan, penggiliran dan skop setiap pembekal dengan halaman /dashboard/api-manager khusus
Kebenaran Tahap Model — Hadkan kunci API kepada model tertentu (openai/*, corak kad bebas), dengan Togol Benarkan Semua/Sekat
Perlindungan Titik Akhir API — Memerlukan kunci untuk /v1/models dan menyekat penyedia tertentu daripada penyenaraian
Auth Guard + CSRF Protection — Semua laluan papan pemuka dilindungi dengan withAuth middleware + token CSRF
Penghad Kadar — Pengehadan kadar Per-IP dengan tetingkap boleh dikonfigurasikan
Penapisan IP — Senarai Benar/senarai sekat untuk kawalan akses
Pengawal Suntikan Segera — Pensanitasi terhadap corak segera yang berniat jahat
Penyulitan AES-256-GCM — Bukti kelayakan disulitkan semasa rehat
🛑 6. "Pembekal saya gagal dan saya kehilangan aliran pengekodan saya"
Pembekal AI boleh menjadi tidak stabil, mengembalikan ralat 5xx atau mencapai had kadar sementara. Jika pembangun bergantung pada penyedia tunggal, mereka akan terganggu. Tanpa pemutus litar, percubaan semula berulang boleh ranap aplikasi.
Cara OmniRoute menyelesaikannya:
Pemutus Litar bagi setiap pembekal — Auto buka/tutup dengan ambang boleh dikonfigurasikan dan cooldown (Ditutup/Buka/Separuh Terbuka)
Penyingkiran Eksponen — Kelewatan percubaan semula progresif
Kawanan Anti Gemuruh — Mutex + perlindungan semafor terhadap ribut percubaan semula serentak
Kombo Rantai Sandar — Jika pembekal utama gagal, secara automatik jatuh melalui rantaian tanpa campur tangan
Pemutus Litar Kombo — Lumpuhkan automatik pembekal yang gagal dalam rantaian kombo
Papan Pemuka Kesihatan — Pemantauan masa aktif, keadaan pemutus litar, penguncian, statistik cache, kependaman p50/p95/p99
🔧 7. "Mengkonfigurasi setiap alat AI adalah membosankan dan berulang"
Pembangun menggunakan Kursor, Kod Claude, Codex CLI, OpenClaw, Gemini CLI, Kod Kilo... Setiap alat memerlukan konfigurasi yang berbeza (titik akhir API, kunci, model). Mengkonfigurasi semula apabila menukar pembekal atau model adalah membuang masa.
Cara OmniRoute menyelesaikannya:
Papan Pemuka Alat CLI — Halaman khusus dengan persediaan satu klik untuk Claude Code, Codex CLI, OpenClaw, Kilo Code, Antigravity, Cline
GitHub Copilot Config Generator — Menghasilkan chatLanguageModels.json untuk Kod VS dengan pemilihan model pukal
Onboarding Wizard — Persediaan 4 langkah berpandu untuk pengguna kali pertama
Satu titik akhir, semua model — Konfigurasikan http://localhost:20128/v1 sekali, akses 36+ pembekal
🔑 8. "Menguruskan token OAuth daripada berbilang penyedia adalah neraka"
Kod Claude, Codex, Gemini CLI, Copilot — semuanya menggunakan OAuth 2.0 dengan token tamat tempoh. Pembangun perlu sentiasa mengesahkan semula, menangani client_secret is missing, redirect_uri_mismatch dan kegagalan pada pelayan jauh. OAuth pada LAN/VPS amat bermasalah.
Cara OmniRoute menyelesaikannya:
Muat Semula Token Auto — Token OAuth dimuat semula di latar belakang sebelum tamat tempoh
OAuth 2.0 (PKCE) Terbina dalam — Aliran automatik untuk Kod Claude, Codex, Gemini CLI, Copilot, Kiro, Qwen, iFlow
OAuth Berbilang Akaun — Berbilang akaun bagi setiap pembekal melalui pengekstrakan token JWT/ID
OAuth LAN/Remote Fix — Pengesanan IP peribadi untuk redirect_uri + mod URL manual untuk pelayan jauh
OAuth Behind Nginx — Menggunakan window.location.origin untuk keserasian proksi terbalik
Panduan OAuth Jauh — Panduan langkah demi langkah untuk kelayakan Google Cloud pada VPS/Docker
📊 9. "Saya tidak tahu berapa banyak yang saya belanjakan atau di mana"
Pembangun menggunakan berbilang penyedia berbayar tetapi tidak mempunyai pandangan bersatu tentang perbelanjaan. Setiap pembekal mempunyai papan pemuka pengebilan sendiri, tetapi tiada paparan disatukan. Kos yang tidak dijangka boleh bertimbun.
Cara OmniRoute menyelesaikannya:
Papan Pemuka Analitis Kos — Penjejakan kos per-token dan pengurusan belanjawan bagi setiap pembekal
Had Belanjawan setiap Peringkat — Siling perbelanjaan setiap peringkat yang mencetuskan sandaran automatik
Konfigurasi Harga Per-Model — Harga boleh dikonfigurasikan bagi setiap model
Statistik Penggunaan Setiap Kunci API — Kiraan permintaan dan cap masa yang terakhir digunakan setiap kunci
Papan Pemuka Analitik — Kad statistik, carta penggunaan model, jadual pembekal dengan kadar kejayaan dan kependaman
🐛 10. "Saya tidak dapat mendiagnosis ralat dan masalah dalam panggilan AI"
Apabila panggilan gagal, pembangun tidak tahu sama ada ia adalah had kadar, token tamat tempoh, format yang salah atau ralat pembekal. Log berpecah-belah merentasi terminal yang berbeza. Tanpa pemerhatian, penyahpepijatan adalah percubaan-dan-ralat.
Pemapar Log Konsol — Pemapar gaya terminal masa nyata dengan tahap berkod warna, tatal automatik, carian, penapis
Log Proksi SQLite — Log berterusan yang bertahan dimulakan semula
Taman Permainan Penterjemah — 4 mod nyahpepijat: Taman Permainan (terjemahan format), Penguji Sembang (perjalanan pergi balik), Bangku Ujian (batch), Monitor Langsung (masa nyata)
Pengelogan Berasaskan Fail dengan Putaran — Pemintas konsol menangkap segala-galanya ke log JSON dengan putaran berasaskan saiz
🏗️ 11. "Menyedia dan menyelenggara gerbang adalah rumit"
Memasang, mengkonfigurasi dan menyelenggara proksi AI merentas persekitaran yang berbeza (tempatan, VPS, Docker, awan) adalah intensif buruh. Masalah seperti laluan berkod keras, EACCES pada direktori, konflik port dan binaan merentas platform menambah geseran.
Profil Karang Docker — base (tiada alat CLI) dan cli (dengan Kod Claude, Codex, OpenClaw)
Apl Desktop Elektron — Apl asli untuk Windows/macOS/Linux dengan dulang sistem, auto mula, mod luar talian
Mod Split-Port — API dan Papan Pemuka pada port berasingan untuk senario lanjutan (proksi terbalik, rangkaian kontena)
Cloud Sync — Konfigurasikan penyegerakan merentas peranti melalui Cloudflare Workers
Sandaran DB — Sandaran automatik, pulihkan, eksport dan import semua tetapan
🌍 12. "Antara muka adalah bahasa Inggeris sahaja dan pasukan saya tidak berbahasa Inggeris"
Pasukan di negara bukan berbahasa Inggeris, terutamanya di Amerika Latin, Asia dan Eropah, bergelut dengan antara muka bahasa Inggeris sahaja. Halangan bahasa mengurangkan penggunaan dan meningkatkan ralat konfigurasi.
Cara OmniRoute menyelesaikannya:
Papan pemuka i18n — 30 Bahasa — Semua 500+ kunci diterjemahkan termasuk bahasa Arab, Bulgaria, Denmark, Jerman, Sepanyol, Finland, Perancis, Ibrani, Hindi, Hungary, Indonesia, Itali, Jepun, Korea, Melayu, Belanda, Norway, Poland, Portugis (PT/BR), Romania, Rusia, Slovak, Sweden, Thai, Ukraine, Vietnam, Cina
Sokongan RTL — Sokongan kanan ke kiri untuk bahasa Arab dan Ibrani
README Berbilang Bahasa — 30 terjemahan dokumentasi lengkap
Pemilih Bahasa — Ikon Glob dalam pengepala untuk penukaran masa nyata
🔄 13. "Saya perlukan lebih daripada sembang — saya perlukan benam, imej, audio"
AI bukan sekadar penyelesaian sembang. Pembangun perlu menjana imej, menyalin audio, membuat pembenaman untuk RAG, menyusun semula dokumen dan kandungan sederhana. Setiap API mempunyai titik akhir dan format yang berbeza.
Cara OmniRoute menyelesaikannya:
Pembenaman — /v1/embeddings dengan 6 pembekal dan 9+ model
Penjanaan Imej — /v1/images/generations dengan 10 pembekal dan 20+ model (OpenAI, xAI, Together, Bunga Api, Nebius, Hiperbolik, NanoBanana, Antigraviti, SD WebUI, ComfyUI)
Teks-ke-Video — /v1/videos/generations — ComfyUI (AnimateDiff, SVD) dan SD WebUI
Penyusunan semula — /v1/rerank — Penyusunan semula perkaitan dokumen
Respons API — Sokongan penuh /v1/responses untuk Codex
🧪 14. "Saya tiada cara untuk menguji dan membandingkan kualiti merentas model"
Pembangun ingin mengetahui model mana yang terbaik untuk kes penggunaan mereka — kod, terjemahan, penaakulan — tetapi membandingkan secara manual adalah perlahan. Tiada alat eval bersepadu wujud.
Cara OmniRoute menyelesaikannya:
LLM Evaluations — Ujian set emas dengan 10 kes pra-muat meliputi salam, matematik, geografi, penjanaan kod, pematuhan JSON, terjemahan, penurunan harga, penolakan keselamatan
Bangku Ujian Taman Permainan Penterjemah — Ujian kelompok dengan berbilang input dan output yang dijangka, perbandingan merentas pembekal
Penguji Sembang — Perjalanan pergi balik penuh dengan pemaparan respons visual
Pantau Langsung — Strim masa nyata semua permintaan yang mengalir melalui proksi
📈 15. "Saya perlu skala tanpa kehilangan prestasi"
Apabila volum permintaan bertambah, tanpa menyimpan cache soalan yang sama menjana kos pendua. Tanpa idempotensi, pendua meminta pemprosesan sisa. Had kadar setiap pembekal mesti dipatuhi.
Cara OmniRoute menyelesaikannya:
Cache Semantik — Cache dua peringkat (tandatangan + semantik) mengurangkan kos dan kependaman
Request Idempotency — tetingkap penyahduplikasi 5s untuk permintaan yang sama
Pengesanan Had Kadar — RPM setiap pembekal, jurang min dan penjejakan serentak maks
Had Kadar Boleh Diedit — Lalai boleh dikonfigurasikan dalam Tetapan → Ketahanan dengan kegigihan
Cache Pengesahan Kunci API — Cache 3 peringkat untuk prestasi pengeluaran
Papan Pemuka Kesihatan dengan Telemetri — kependaman p50/p95/p99, statistik cache, masa beroperasi
🤖 16. "Saya mahu mengawal tingkah laku model secara global"
Pembangun yang mahukan semua respons dalam bahasa tertentu, dengan nada tertentu atau ingin mengehadkan token penaakulan. Mengkonfigurasi ini dalam setiap alat/permintaan adalah tidak praktikal.
Cara OmniRoute menyelesaikannya:
System Prompt Injection — Gesaan global digunakan untuk semua permintaan
Pengesahan Belanjawan Berfikir — Kawalan peruntukan token penaakulan setiap permintaan (laluan, auto, tersuai, adaptif)
6 Strategi Penghalaan — Strategi global yang menentukan cara permintaan diedarkan
Penghala Wildcard — Corak provider/* halakan secara dinamik kepada mana-mana pembekal
Kombo Dayakan/Lumpuhkan Togol — Togol kombo terus dari papan pemuka
Togol Pembekal — Dayakan/lumpuhkan semua sambungan untuk pembekal dengan satu klik
Pembekal Disekat — Kecualikan pembekal khusus daripada penyenaraian /v1/models
🧰 17. "Saya memerlukan alatan MCP sebagai keupayaan produk kelas pertama"
Banyak get laluan AI mendedahkan MCP hanya sebagai butiran pelaksanaan tersembunyi. Pasukan memerlukan lapisan operasi yang boleh dilihat dan boleh diurus.
Cara OmniRoute menyelesaikannya:
MCP muncul dalam navigasi papan pemuka dan tab protokol titik akhir
Halaman pengurusan MCP khusus dengan proses, alatan, skop dan audit
Permulaan pantas terbina dalam untuk omniroute --mcp dan onboarding pelanggan
🧠 18. "Saya memerlukan orkestrasi A2A dengan laluan tugas penyegerakan + aliran"
Aliran kerja ejen memerlukan balasan langsung dan pelaksanaan strim jangka panjang dengan kawalan kitaran hayat.
Cara OmniRoute menyelesaikannya:
Titik akhir A2A JSON-RPC (POST /a2a) dengan message/send dan message/stream
Penstriman SSE dengan penyebaran keadaan terminal
API kitaran hayat tugas untuk tasks/get dan tasks/cancel
🛰️ 19. "Saya memerlukan kesihatan proses MCP sebenar, bukan status yang diduga"
Pasukan operasi perlu mengetahui sama ada MCP sebenarnya masih hidup, bukan hanya sama ada API boleh dicapai.
Cara OmniRoute menyelesaikannya:
Fail degupan jantung masa jalan dengan PID, cap masa, pengangkutan, kiraan alat dan mod skop
API status MCP yang menggabungkan degupan jantung + aktiviti terkini
Kad status UI untuk kesegaran proses/masa hidup/degupan jantung
📋 20. "Saya memerlukan pelaksanaan alat MCP yang boleh diaudit"
Apabila alat mengubah konfigurasi atau mencetuskan tindakan ops, pasukan memerlukan kebolehkesanan forensik.
Cara OmniRoute menyelesaikannya:
Pengelogan audit yang disokong SQLite untuk panggilan alat MCP
Tapis mengikut alat, kejayaan/kegagalan, kunci API dan penomboran
Jadual audit papan pemuka + titik akhir statistik untuk automasi
🔐 21. "Saya memerlukan keizinan MCP berskop bagi setiap penyepaduan"
Pelanggan yang berbeza harus mempunyai akses paling tidak istimewa kepada kategori alat.
Cara OmniRoute menyelesaikannya:
9 skop MCP berbutir untuk akses alat terkawal
Penguatkuasaan skop dan keterlihatan dalam UI pengurusan MCP
Postur lalai yang selamat untuk perkakas operasi
⚙️ 22. "Saya memerlukan kawalan operasi tanpa mengatur semula"
Pasukan memerlukan perubahan masa jalan yang cepat semasa insiden atau peristiwa kos.
Cara OmniRoute menyelesaikannya:
Tukar pengaktifan kombo terus dari papan pemuka MCP
Gunakan profil daya tahan daripada pek dasar yang telah ditetapkan
Tetapkan semula keadaan pemutus litar daripada panel operasi yang sama
🔄 23. "Saya memerlukan keterlihatan dan pembatalan kitaran hayat tugas A2A secara langsung"
Tanpa keterlihatan kitaran hayat, insiden tugasan menjadi sukar untuk dicuba.
Cara OmniRoute menyelesaikannya:
Penyenaraian tugas/penapisan mengikut keadaan/kemahiran dengan penomboran
Latih tubi tentang metadata tugas, peristiwa dan artifak
Titik akhir pembatalan tugas dan tindakan UI dengan pengesahan
🌊 24. "Saya memerlukan metrik strim aktif untuk beban A2A"
Aliran kerja penstriman memerlukan cerapan operasi tentang konkurensi dan sambungan langsung.
Cara OmniRoute menyelesaikannya:
Kaunter aliran aktif disepadukan ke dalam status A2A
Cap masa tugas terakhir dan kiraan setiap negeri
Kad papan pemuka A2A untuk pemantauan operasi masa nyata
🪪 25. "Saya memerlukan penemuan ejen standard untuk pelanggan"
Pelanggan dan orkestra luar memerlukan metadata yang boleh dibaca mesin untuk onboarding.
Cara OmniRoute menyelesaikannya:
Kad Agen terdedah pada /.well-known/agent.json
Keupayaan dan kemahiran ditunjukkan dalam UI pengurusan
API status A2A termasuk metadata penemuan untuk automasi
🧭 26. "Saya memerlukan kebolehtemuan protokol dalam produk UX"
Jika pengguna tidak dapat menemui permukaan protokol, penggunaan dan kualiti sokongan akan menurun.
Cara OmniRoute menyelesaikannya:
Entri bar sisi untuk MCP dan A2A
Tab Protokol halaman titik akhir dengan permulaan pantas dan status
Pautan dari gambaran keseluruhan ke papan pemuka pengurusan khusus
🧪 27. "Saya memerlukan pengesahan protokol hujung ke hujung dengan pelanggan sebenar"
Ujian olok-olok tidak mencukupi untuk mengesahkan keserasian protokol sebelum dikeluarkan.
Cara OmniRoute menyelesaikannya:
Suite E2E yang but apl dan menggunakan pengangkutan pelanggan MCP SDK sebenar
Ujian pelanggan A2A untuk penemuan, menghantar, menstrim, mendapatkan dan membatalkan aliran
Periksa silang dakwaan terhadap audit MCP dan API tugasan A2A
📡 28. "Saya memerlukan pemerhatian bersatu merentas semua antara muka"
Memisahkan kebolehmerhatian mengikut protokol mewujudkan titik buta dan MTTR yang lebih panjang.
Cara OmniRoute menyelesaikannya:
Papan pemuka/log/analisis bersatu dalam satu produk
Combo: "always-on"
1. cc/claude-opus-4-6
2. cx/gpt-5.2-codex
3. glm/glm-4.7
4. minimax/MiniMax-M2.1
5. if/kimi-k2-thinking
Outcome: deep fallback depth for deadline-critical workloads
Playbook D: Operasi ejen dengan MCP + A2A
1) Start MCP transport (`omniroute --mcp`) for tool-driven operations
2) Run A2A tasks via `message/send` and `message/stream`
3) Observe via /dashboard/mcp and /dashboard/a2a
4) Control incidents with resilience profile + task cancellation
⚡ Mula Pantas
1. Pasang secara global:
npm install -g omniroute
omniroute
🎉 Papan pemuka dibuka pada http://localhost:20128
Perintah
Penerangan
omniroute
Mulakan pelayan (port lalai 20128)
omniroute --port 3000
Gunakan port tersuai
omniroute --no-open
Jangan auto buka penyemak imbas
omniroute --help
Tunjukkan bantuan
2. Sambungkan pembekal PERCUMA:
Papan pemuka → Pembekal → Sambung Kod Claude atau Antigraviti → Log masuk OAuth → Selesai!
3. Gunakan dalam alat CLI anda:
Claude Code/Codex/Gemini CLI/OpenClaw/Cursor/Cline Settings:Endpoint:http://localhost:20128/v1
API Key: [copy from dashboard]
Model:if/kimi-k2-thinking
Itu sahaja! Mulakan pengekodan dengan model AI PERCUMA.
Alternatif — dijalankan dari sumber:
cp .env.example .env
npm install
PORT=20128 NEXT_PUBLIC_BASE_URL=http://localhost:20128 npm run dev
🐳 Docker
OmniRoute tersedia sebagai imej Docker awam pada Docker Hub.
🌐 Offline Mode — Works fully offline with bundled server
npm run electron:dev # Development mode
npm run electron:build # Current platform
npm run electron:build:win # Windows (.exe)
npm run electron:build:mac # macOS (.dmg)
npm run electron:build:linux # Linux (.AppImage)
Auto round-robin atau penghalaan berasaskan keutamaan
Berundur ke akaun seterusnya apabila seseorang mencapai kuota
🔄 Muat Semula Token Auto
Token OAuth dimuat semula secara automatik sebelum tamat tempoh
Tiada pengesahan semula manual diperlukan
Pengalaman lancar merentas semua pembekal
🎨 Kombo Tersuai
Buat kombinasi model tanpa had
6 strategi: isikan dahulu, round-robin, kuasa dua pilihan, rawak, paling kurang digunakan, dioptimumkan kos
Kongsi gabungan merentas peranti dengan Cloud Sync
🏥 Papan Pemuka Kesihatan
Status sistem (masa hidup, versi, penggunaan memori)
Keadaan pemutus litar bagi setiap pembekal (Tertutup/Terbuka/Separuh Terbuka)
Status had kadar dan sekatan aktif
Statistik cache tandatangan
Telemetri kependaman (p50/p95/p99) + cache segera
Tetapkan semula status kesihatan dengan satu klik
🔧 Taman Permainan Penterjemah
OmniRoute termasuk Taman Permainan Penterjemah terbina dalam yang berkuasa dengan 4 mod untuk penyahpepijatan, ujian dan pemantauan terjemahan API:
Mod
Penerangan
💻 Taman permainan
Terjemahan format langsung — tampal mana-mana badan permintaan API dan lihat serta-merta cara OmniRoute menterjemahkannya antara format pembekal (OpenAI ↔ Claude ↔ Gemini ↔ Responses API). Termasuk templat contoh dan pengesanan automatik format.
💬 Penguji Sembang
Hantar permintaan sembang sebenar melalui OmniRoute dan lihat perjalanan pergi balik penuh: input anda, permintaan yang diterjemahkan, respons pembekal dan balasan yang diterjemahkan kembali. Tidak ternilai untuk mengesahkan penghalaan kombo.
🧪 Bangku Ujian
Mod ujian kelompok — tentukan berbilang kes ujian dengan input dan output yang dijangkakan berbeza, jalankan semuanya sekali gus dan bandingkan hasil merentas pembekal dan model.
📱 Pemantau Langsung
Pemantauan permintaan masa nyata — tonton permintaan masuk semasa ia mengalir melalui OmniRoute, lihat terjemahan format berlaku secara langsung dan kenal pasti isu serta-merta.
Akses: Papan Pemuka → Penterjemah (bar sisi)
💾 Penyegerakan Awan
Penyegerakan penyedia, gabungan dan tetapan merentas peranti
Penyegerakan latar belakang automatik
Storan yang disulitkan selamat
🧪 Penilaian (Evals)
OmniRoute termasuk rangka kerja penilaian terbina dalam untuk menguji kualiti tindak balas LLM terhadap set emas. Aksesnya melalui Analytics → Evals dalam papan pemuka.
Set Emas Terbina dalam
"Set Emas OmniRoute" pra-muat mengandungi 10 kes ujian yang meliputi:
Salam, matematik, geografi, penjanaan kod
Pematuhan format JSON, terjemahan, penurunan harga
Nota: OpenClaw hanya berfungsi dengan OmniRoute tempatan. Gunakan 127.0.0.1 dan bukannya localhost untuk mengelakkan isu resolusi IPv6.
Cline / Teruskan / RooCode
Settings → API Configuration:Provider: OpenAI Compatible
Base URL:http://localhost:20128/v1
API Key: [from OmniRoute dashboard]
Model:if/kimi-k2-thinking
🐛 Menyelesaikan masalah
Klik untuk mengembangkan panduan penyelesaian masalah
"Model bahasa tidak memberikan mesej"
Kuota pembekal habis → Semak penjejak kuota papan pemuka
Penyelesaian: Gunakan sandaran kombo atau tukar kepada peringkat yang lebih murah
Jika isu berterusan: Papan Pemuka → Pembekal → Sambung semula
Kos tinggi
Semak statistik penggunaan dalam Papan Pemuka → Kos
Tukar model utama kepada GLM/MiniMax
Gunakan peringkat percuma (Gemini CLI, iFlow) untuk tugasan yang tidak kritikal
Papan pemuka dibuka pada port yang salah
Tetapkan PORT=20128 dan NEXT_PUBLIC_BASE_URL=http://localhost:20128
Ralat penyegerakan awan
Sahkan BASE_URL mata pada contoh larian anda
Sahkan CLOUD_URL mata ke titik akhir awan anda yang dijangkakan
Pastikan nilai NEXT_PUBLIC_* sejajar dengan nilai sebelah pelayan
Log masuk pertama tidak berfungsi
Semak INITIAL_PASSWORD dalam .env
Jika tidak ditetapkan, kata laluan sandaran ialah 123456
Tiada log permintaan
Tetapkan ENABLE_REQUEST_LOGS=true dalam .env
Ujian sambungan menunjukkan "Tidak sah" untuk pembekal yang serasi dengan OpenAI
Banyak pembekal tidak mendedahkan titik akhir /models
OmniRoute v1.0.6+ termasuk pengesahan sandaran melalui pelengkapan sembang
Pastikan URL asas mengandungi akhiran /v1
🔐 OAuth
⚠️ PENTING untuk biasa menggunakan OmniRoute em VPS/Docker/servidor remoto
Adakah OAuth melakukan Antigraviti / Gemini CLI tidak menggunakan perkhidmatan anda?
Ia membuktikan Antigraviti dan Gemini CLI menggunakan Google OAuth 2.0 untuk autenticação. O Google exige que a redirect_uri gunakan tiada fluks OAuth seja exatamente uma das URIs sebelum kadastrada tiada Google Cloud Console untuk aplicativo.
Sebagai credenciais OAuth embutidas no OmniRoute estão cadastradas apenas untuk localhost. Quando você acessa o OmniRoute em um servidor remoto (cth: https://omniroute.meuservidor.com), o Google rejeita a autenticação com:
Error 400: redirect_uri_mismatch
Penyelesaian: Konfigurasikan suas próprias credenciais OAuth
Você precisa criar um OAuth 2.0 Client ID no Google Cloud Console com a URI do seu servidor.
Terima kasih khas kepada 9router oleh decolua — projek asal yang mengilhamkan garpu ini. OmniRoute membina asas yang luar biasa itu dengan ciri tambahan, API berbilang modal dan penulisan semula TypeScript penuh.
Terima kasih khas kepada CLIProxyAPI — pelaksanaan Go asal yang mengilhamkan port JavaScript ini.