🌐 Languages: 🇺🇸 English | 🇧🇷 Português (Brasil) | 🇪🇸 Español | 🇫🇷 Français | 🇮🇹 Italiano | 🇷🇺 Русский | 🇨🇳 中文 (简体) | 🇩🇪 Deutsch | 🇮🇳 हिन्दी | 🇹🇭 ไทย | 🇺🇦 Українська | 🇸🇦 العربية | 🇯🇵 日本語 | 🇻🇳 Tiếng Việt | 🇧🇬 Български | 🇩🇰 Dansk | 🇫🇮 Suomi | 🇮🇱 עברית | 🇭🇺 Magyar | 🇮🇩 Bahasa Indonesia | 🇰🇷 한국어 | 🇲🇾 Bahasa Melayu | 🇳🇱 Nederlands | 🇳🇴 Norsk | 🇵🇹 Português (Portugal) | 🇷🇴 Română | 🇵🇱 Polski | 🇸🇰 Slovenčina | 🇸🇪 Svenska | 🇵🇭 Filipino
คู่มือฉบับสมบูรณ์สำหรับการกำหนดค่าผู้ให้บริการ การสร้างคอมโบ การผสานรวมเครื่องมือ CLI และการปรับใช้ OmniRoute
- Pricing at a Glance
- Use Cases
- Provider Setup
- CLI Integration
- Deployment
- Available Models
- Advanced Features
| ชั้น | ผู้ให้บริการ | ราคา | รีเซ็ตโควต้า | ดีที่สุดสำหรับ |
|---|---|---|---|---|
| 💳 สมัครสมาชิก | รหัสคลอดด์ (Pro) | $20/เดือน | 5 ชม. + รายสัปดาห์ | สมัครสมาชิกแล้ว |
| Codex (พลัส/โปร) | $20-200/เดือน | 5 ชม. + รายสัปดาห์ | ผู้ใช้ OpenAI | |
| ราศีเมถุน CLI | ฟรี | 180K/เดือน + 1K/วัน | ทุกคน! | |
| นักบิน GitHub | $10-19/เดือน | รายเดือน | ผู้ใช้ GitHub | |
| 🔑 คีย์ API | DeepSeek | จ่ายตามการใช้งาน | ไม่มี | การใช้เหตุผลราคาถูก |
| กรอค | จ่ายตามการใช้งาน | ไม่มี | การอนุมานที่รวดเร็วเป็นพิเศษ | |
| xAI (โกรก) | จ่ายตามการใช้งาน | ไม่มี | Grok 4 การใช้เหตุผล | |
| มิสทรัล | จ่ายตามการใช้งาน | ไม่มี | โมเดลที่โฮสต์โดยสหภาพยุโรป | |
| ความฉงนสนเท่ห์ | จ่ายตามการใช้งาน | ไม่มี | การค้นหาเสริม | |
| ร่วมกัน AI | จ่ายตามการใช้งาน | ไม่มี | โมเดลโอเพ่นซอร์ส | |
| ดอกไม้ไฟ AI | จ่ายตามการใช้งาน | ไม่มี | ภาพ FLUX ที่รวดเร็ว | |
| สมอง | จ่ายตามการใช้งาน | ไม่มี | ความเร็วระดับเวเฟอร์ | |
| เชื่อมโยง | จ่ายตามการใช้งาน | ไม่มี | คำสั่ง R+ RAG | |
| NVIDIA NIM | จ่ายตามการใช้งาน | ไม่มี | โมเดลองค์กร | |
| 💰 ราคาถูก | GLM-4.7 | $0.6/1M | ทุกวัน 10.00 น. | สำรองงบประมาณ |
| MiniMax M2.1 | $0.2/1M | กลิ้ง 5 ชั่วโมง | ตัวเลือกที่ถูกที่สุด | |
| คิมิ K2 | $9/เดือน คงที่ | 10M โทเค็น/เดือน | ต้นทุนที่คาดการณ์ได้ | |
| 🆓 ฟรี | ไอโฟลว์ | $0 | ไม่จำกัด | ฟรี 8 รุ่น |
| ควีน | $0 | ไม่จำกัด | ฟรี 3 รุ่น | |
| คิโระ | $0 | ไม่จำกัด | คลอดด์ฟรี |
💡 เคล็ดลับสำหรับมืออาชีพ: เริ่มต้นด้วย Gemini CLI (ฟรี 180,000 ต่อเดือน) + iFlow (ฟรีไม่จำกัด) คอมโบ = ค่าใช้จ่าย $0!
ปัญหา: โควต้าหมดอายุโดยไม่ได้ใช้ อัตราจำกัดระหว่างการเขียนโค้ดจำนวนมาก
Combo: "maximize-claude"
1. cc/claude-opus-4-6 (use subscription fully)
2. glm/glm-4.7 (cheap backup when quota out)
3. if/kimi-k2-thinking (free emergency fallback)
Monthly cost: $20 (subscription) + ~$5 (backup) = $25 total
vs. $20 + hitting limits = frustration
ปัญหา: ไม่สามารถสมัครสมาชิกได้ ต้องการการเข้ารหัส AI ที่เชื่อถือได้
Combo: "free-forever"
1. gc/gemini-3-flash (180K free/month)
2. if/kimi-k2-thinking (unlimited free)
3. qw/qwen3-coder-plus (unlimited free)
Monthly cost: $0
Quality: Production-ready models
ปัญหา: กำหนดเวลา ไม่สามารถหยุดการทำงานได้
Combo: "always-on"
1. cc/claude-opus-4-6 (best quality)
2. cx/gpt-5.2-codex (second subscription)
3. glm/glm-4.7 (cheap, resets daily)
4. minimax/MiniMax-M2.1 (cheapest, 5h reset)
5. if/kimi-k2-thinking (free unlimited)
Result: 5 layers of fallback = zero downtime
Monthly cost: $20-200 (subscriptions) + $10-20 (backup)
ปัญหา: ต้องการผู้ช่วย AI ในแอปส่งข้อความ ไม่มีค่าใช้จ่ายใดๆ ทั้งสิ้น
Combo: "openclaw-free"
1. if/glm-4.7 (unlimited free)
2. if/minimax-m2.1 (unlimited free)
3. if/kimi-k2-thinking (unlimited free)
Monthly cost: $0
Access via: WhatsApp, Telegram, Slack, Discord, iMessage, Signal...
Dashboard → Providers → Connect Claude Code
→ OAuth login → Auto token refresh
→ 5-hour + weekly quota tracking
Models:
cc/claude-opus-4-6
cc/claude-sonnet-4-5-20250929
cc/claude-haiku-4-5-20251001เคล็ดลับสำหรับมือโปร: ใช้ Opus สำหรับงานที่ซับซ้อน และใช้ Sonnet เพื่อความรวดเร็ว โควต้าการติดตาม OmniRoute ต่อรุ่น!
Dashboard → Providers → Connect Codex
→ OAuth login (port 1455)
→ 5-hour + weekly reset
Models:
cx/gpt-5.2-codex
cx/gpt-5.1-codex-maxDashboard → Providers → Connect Gemini CLI
→ Google OAuth
→ 180K completions/month + 1K/day
Models:
gc/gemini-3-flash-preview
gc/gemini-2.5-proคุ้มค่าที่สุด: ระดับฟรีมหาศาล! ใช้สิ่งนี้ก่อนระดับที่ชำระเงิน
Dashboard → Providers → Connect GitHub
→ OAuth via GitHub
→ Monthly reset (1st of month)
Models:
gh/gpt-5
gh/claude-4.5-sonnet
gh/gemini-3-pro- ลงทะเบียน: Zhipu AI
- รับคีย์ API จาก Coding Plan
- แดชบอร์ด → เพิ่มคีย์ API: ผู้ให้บริการ:
glm, คีย์ API:your-key
ใช้: glm/glm-4.7 — เคล็ดลับสำหรับมืออาชีพ: แผนการเขียนโค้ดเสนอโควต้า 3× ในราคา 1/7! รีเซ็ตทุกวัน 10.00 น.
- ลงทะเบียน: MiniMax
- รับคีย์ API → แดชบอร์ด → เพิ่มคีย์ API
ใช้: minimax/MiniMax-M2.1 — เคล็ดลับสำหรับมือโปร: ตัวเลือกที่ถูกที่สุดสำหรับบริบทแบบยาว (โทเค็น 1M)!
- สมัครสมาชิก: Moonshot AI
- รับคีย์ API → แดชบอร์ด → เพิ่มคีย์ API
ใช้: kimi/kimi-latest — เคล็ดลับสำหรับมืออาชีพ: แก้ไข $9/เดือนสำหรับโทเค็น 10M = $0.90/ต้นทุนจริง 1M!
Dashboard → Connect iFlow → OAuth login → Unlimited usage
Models: if/kimi-k2-thinking, if/qwen3-coder-plus, if/glm-4.7, if/minimax-m2, if/deepseek-r1Dashboard → Connect Qwen → Device code auth → Unlimited usage
Models: qw/qwen3-coder-plus, qw/qwen3-coder-flashDashboard → Connect Kiro → AWS Builder ID or Google/GitHub → Unlimited
Models: kr/claude-sonnet-4.5, kr/claude-haiku-4.5Dashboard → Combos → Create New
Name: premium-coding
Models:
1. cc/claude-opus-4-6 (Subscription primary)
2. glm/glm-4.7 (Cheap backup, $0.6/1M)
3. minimax/MiniMax-M2.1 (Cheapest fallback, $0.20/1M)
Use in CLI: premium-coding
Name: free-combo
Models:
1. gc/gemini-3-flash-preview (180K free/month)
2. if/kimi-k2-thinking (unlimited)
3. qw/qwen3-coder-plus (unlimited)
Cost: $0 forever!
Settings → Models → Advanced:
OpenAI API Base URL: http://localhost:20128/v1
OpenAI API Key: [from omniroute dashboard]
Model: cc/claude-opus-4-6
แก้ไข ~/.claude/config.json:
{
"anthropic_api_base": "http://localhost:20128/v1",
"anthropic_api_key": "your-omniroute-api-key"
}export OPENAI_BASE_URL="http://localhost:20128"
export OPENAI_API_KEY="your-omniroute-api-key"
codex "your prompt"แก้ไข ~/.openclaw/openclaw.json:
{
"agents": {
"defaults": {
"model": { "primary": "omniroute/if/glm-4.7" }
}
},
"models": {
"providers": {
"omniroute": {
"baseUrl": "http://localhost:20128/v1",
"apiKey": "your-omniroute-api-key",
"api": "openai-completions",
"models": [{ "id": "if/glm-4.7", "name": "glm-4.7" }]
}
}
}
}หรือใช้แดชบอร์ด: เครื่องมือ CLI → OpenClaw → กำหนดค่าอัตโนมัติ
Provider: OpenAI Compatible
Base URL: http://localhost:20128/v1
API Key: [from dashboard]
Model: cc/claude-opus-4-6
git clone https://github.com/diegosouzapw/OmniRoute.git
cd OmniRoute && npm install && npm run build
export JWT_SECRET="your-secure-secret-change-this"
export INITIAL_PASSWORD="your-password"
export DATA_DIR="/var/lib/omniroute"
export PORT="20128"
export HOSTNAME="0.0.0.0"
export NODE_ENV="production"
export NEXT_PUBLIC_BASE_URL="http://localhost:20128"
export API_KEY_SECRET="endpoint-proxy-api-key-secret"
npm run start
# Or: pm2 start npm --name omniroute -- start# Build image (default = runner-cli with codex/claude/droid preinstalled)
docker build -t omniroute:cli .
# Portable mode (recommended)
docker run -d --name omniroute -p 20128:20128 --env-file ./.env -v omniroute-data:/app/data omniroute:cliสำหรับโหมดรวมโฮสต์ที่มีไบนารี CLI โปรดดูส่วนนักเทียบท่าในเอกสารหลัก
| ตัวแปร | ค่าเริ่มต้น | คำอธิบาย |
|---|---|---|
JWT_SECRET |
omniroute-default-secret-change-me |
เคล็ดลับการลงนาม JWT (การเปลี่ยนแปลงในการผลิต) |
INITIAL_PASSWORD |
123456 |
รหัสผ่านเข้าสู่ระบบครั้งแรก |
DATA_DIR |
~/.omniroute |
ไดเร็กทอรีข้อมูล (db, การใช้งาน, บันทึก) |
PORT |
ค่าเริ่มต้นของเฟรมเวิร์ก | พอร์ตบริการ (20128 ในตัวอย่าง) |
HOSTNAME |
ค่าเริ่มต้นของเฟรมเวิร์ก | ผูกโฮสต์ (ค่าเริ่มต้นของ Docker คือ 0.0.0.0) |
NODE_ENV |
รันไทม์เริ่มต้น | ตั้งค่า production สำหรับการปรับใช้ |
BASE_URL |
http://localhost:20128 |
URL ฐานภายในฝั่งเซิร์ฟเวอร์ |
CLOUD_URL |
https://omniroute.dev |
URL ฐานปลายทางการซิงค์บนคลาวด์ |
API_KEY_SECRET |
endpoint-proxy-api-key-secret |
ข้อมูลลับ HMAC สำหรับคีย์ API ที่สร้างขึ้น |
REQUIRE_API_KEY |
false |
บังคับใช้คีย์ Bearer API บน /v1/* |
ENABLE_REQUEST_LOGS |
false |
เปิดใช้งานบันทึกคำขอ/การตอบกลับ |
AUTH_COOKIE_SECURE |
false |
บังคับ Secure คุกกี้รับรองความถูกต้อง (หลังพร็อกซีย้อนกลับ HTTPS) |
สำหรับการอ้างอิงตัวแปรสภาพแวดล้อมแบบเต็ม โปรดดูที่ README
ดูรุ่นที่มีทั้งหมด
**รหัสโคลด (`cc/`)** — โปร/สูงสุด: `cc/claude-opus-4-6`, `cc/claude-sonnet-4-5-20250929`, `cc/claude-haiku-4-5-20251001`โคเด็กซ์ (cx/) — บวก/โปร: cx/gpt-5.2-codex, cx/gpt-5.1-codex-max
ราศีเมถุน CLI (gc/) — ฟรี: gc/gemini-3-flash-preview, gc/gemini-2.5-pro
โปรแกรมควบคุม GitHub (gh/): gh/gpt-5, gh/claude-4.5-sonnet
GLM (glm/) — $0.6/1M: glm/glm-4.7
MiniMax (minimax/) — $0.2/1M: minimax/MiniMax-M2.1
iFlow (if/) — ฟรี: if/kimi-k2-thinking, if/qwen3-coder-plus, if/deepseek-r1
คิวเวน (qw/) — ฟรี: qw/qwen3-coder-plus, qw/qwen3-coder-flash
คิโระ (kr/) — ฟรี: kr/claude-sonnet-4.5, kr/claude-haiku-4.5
ดีพซีค (ds/): ds/deepseek-chat, ds/deepseek-reasoner
โกรก (groq/): groq/llama-3.3-70b-versatile, groq/llama-4-maverick-17b-128e-instruct
xAI (xai/): xai/grok-4, xai/grok-4-0709-fast-reasoning, xai/grok-code-mini
มิสทรัล (mistral/): mistral/mistral-large-2501, mistral/codestral-2501
ความสับสน (pplx/): pplx/sonar-pro, pplx/sonar
** AI ร่วมกัน (together/)**: together/meta-llama/Llama-3.3-70B-Instruct-Turbo
ดอกไม้ไฟ AI (fireworks/): fireworks/accounts/fireworks/models/deepseek-v3p1
เซรีบร้า (cerebras/): cerebras/llama-3.3-70b
เชื่อมโยงกัน (cohere/): cohere/command-r-plus-08-2024
NVIDIA NIM (nvidia/): nvidia/nvidia/llama-3.3-70b-instruct
เพิ่ม ID รุ่นใดๆ ให้กับผู้ให้บริการโดยไม่ต้องรอการอัปเดตแอป:
# Via API
curl -X POST http://localhost:20128/api/provider-models \
-H "Content-Type: application/json" \
-d '{"provider": "openai", "modelId": "gpt-4.5-preview", "modelName": "GPT-4.5 Preview"}'
# List: curl http://localhost:20128/api/provider-models?provider=openai
# Remove: curl -X DELETE "http://localhost:20128/api/provider-models?provider=openai&model=gpt-4.5-preview"หรือใช้แดชบอร์ด: ผู้ให้บริการ → [ผู้ให้บริการ] → โมเดลที่กำหนดเอง
กำหนดเส้นทางคำขอโดยตรงไปยังผู้ให้บริการเฉพาะด้วยการตรวจสอบโมเดล:
POST http://localhost:20128/v1/providers/openai/chat/completions
POST http://localhost:20128/v1/providers/openai/embeddings
POST http://localhost:20128/v1/providers/fireworks/images/generationsคำนำหน้าผู้ให้บริการจะถูกเพิ่มอัตโนมัติหากไม่มี โมเดลที่ไม่ตรงกันส่งคืน 400
# Set global proxy
curl -X PUT http://localhost:20128/api/settings/proxy \
-d '{"global": {"type":"http","host":"proxy.example.com","port":"8080"}}'
# Per-provider proxy
curl -X PUT http://localhost:20128/api/settings/proxy \
-d '{"providers": {"openai": {"type":"socks5","host":"proxy.example.com","port":"1080"}}}'
# Test proxy
curl -X POST http://localhost:20128/api/settings/proxy/test \
-d '{"proxy":{"type":"socks5","host":"proxy.example.com","port":"1080"}}'ลำดับความสำคัญ: เฉพาะคีย์ → เฉพาะคอมโบ → เฉพาะผู้ให้บริการ → ทั่วโลก → สภาพแวดล้อม
curl http://localhost:20128/api/models/catalogส่งคืนโมเดลที่จัดกลุ่มตามผู้ให้บริการที่มีประเภท (chat, embedding, image)
- ซิงค์ผู้ให้บริการ คอมโบ และการตั้งค่าระหว่างอุปกรณ์ต่างๆ
- การซิงค์พื้นหลังอัตโนมัติพร้อมการหมดเวลา + ล้มเหลวอย่างรวดเร็ว
- ต้องการ
BASE_URL/CLOUD_URLฝั่งเซิร์ฟเวอร์ในการใช้งานจริง
- Semantic Cache — แคชอัตโนมัติไม่สตรีม อุณหภูมิ=0 การตอบสนอง (บายพาสด้วย
X-OmniRoute-No-Cache: true) - คำขอ Idempotency — กรองคำขอที่ซ้ำกันภายใน 5 วินาทีผ่านส่วนหัว
Idempotency-KeyหรือX-Request-Id - การติดตามความคืบหน้า — เลือกใช้กิจกรรม SSE
event: progressผ่านส่วนหัวX-OmniRoute-Progress: true
เข้าถึงได้ผ่าน Dashboard → Translator แก้ไขข้อบกพร่องและเห็นภาพว่า OmniRoute แปลคำขอ API ระหว่างผู้ให้บริการอย่างไร
| โหมด | วัตถุประสงค์ |
|---|---|
| สนามเด็กเล่น | เลือกรูปแบบต้นทาง/เป้าหมาย วางคำขอ และดูผลลัพธ์ที่แปลได้ทันที |
| เครื่องมือทดสอบแชท | ส่งข้อความแชทสดผ่านพร็อกซีและตรวจสอบรอบคำขอ/การตอบกลับทั้งหมด |
| ม้านั่งทดสอบ | เรียกใช้การทดสอบเป็นกลุ่มโดยใช้รูปแบบต่างๆ ร่วมกันเพื่อตรวจสอบความถูกต้องของการแปล |
| ถ่ายทอดสด | ดูการแปลแบบเรียลไทม์ตามคำขอที่ไหลผ่านพร็อกซี |
กรณีการใช้งาน:
- ตรวจแก้จุดบกพร่องว่าทำไมการรวมไคลเอนต์/ผู้ให้บริการเฉพาะจึงล้มเหลว
- ตรวจสอบว่าแท็กการคิด การเรียกใช้เครื่องมือ และการแจ้งเตือนของระบบแปลอย่างถูกต้อง
- เปรียบเทียบความแตกต่างของรูปแบบระหว่างรูปแบบ OpenAI, Claude, Gemini และ Responses API
กำหนดค่าผ่าน แดชบอร์ด → การตั้งค่า → การกำหนดเส้นทาง
| กลยุทธ์ | คำอธิบาย |
|---|---|
| กรอกก่อน | ใช้บัญชีตามลำดับความสำคัญ — บัญชีหลักจะจัดการคำขอทั้งหมดจนกว่าจะไม่พร้อมใช้งาน |
| โรบินตัวกลม | วนรอบบัญชีทั้งหมดด้วยขีดจำกัดที่กำหนดได้ (ค่าเริ่มต้น: 3 สายต่อบัญชี) |
| P2C (พลังสองตัวเลือก) | เลือกบัญชีและเส้นทางแบบสุ่ม 2 บัญชีไปยังบัญชีที่ดีต่อสุขภาพมากขึ้น — สร้างสมดุลระหว่างภาระกับการรับรู้เรื่องสุขภาพ |
| สุ่ม | สุ่มเลือกบัญชีสำหรับแต่ละคำขอโดยใช้ Fisher-Yates shuffle |
| ใช้น้อยที่สุด | กำหนดเส้นทางไปยังบัญชีที่มีการประทับเวลา lastUsedAt เก่าที่สุด กระจายการรับส่งข้อมูลเท่าๆ กัน |
| ปรับต้นทุนให้เหมาะสม | กำหนดเส้นทางไปยังบัญชีที่มีค่าลำดับความสำคัญต่ำสุด ปรับให้เหมาะสมสำหรับผู้ให้บริการที่มีต้นทุนต่ำที่สุด |
สร้างรูปแบบไวด์การ์ดเพื่อทำการแมปชื่อโมเดลใหม่:
Pattern: claude-sonnet-* → Target: cc/claude-sonnet-4-5-20250929
Pattern: gpt-* → Target: gh/gpt-5.1-codex
Wildcard รองรับ * (อักขระใดก็ได้) และ ? (อักขระเดี่ยว)
กำหนดห่วงโซ่ทางเลือกส่วนกลางที่ใช้กับคำขอทั้งหมด:
Chain: production-fallback
1. cc/claude-opus-4-6
2. gh/gpt-5.1-codex
3. glm/glm-4.7
กำหนดค่าผ่าน แดชบอร์ด → การตั้งค่า → ความยืดหยุ่น
OmniRoute ใช้ความยืดหยุ่นระดับผู้ให้บริการด้วยองค์ประกอบสี่ประการ:
-
โปรไฟล์ผู้ให้บริการ — การกำหนดค่าต่อผู้ให้บริการสำหรับ:
- เกณฑ์ความล้มเหลว (จำนวนความล้มเหลวก่อนเปิด)
- ระยะเวลาคูลดาวน์
- ความไวในการตรวจจับขีด จำกัด อัตรา
- พารามิเตอร์แบ็คออฟเอ็กซ์โปเนนเชียล
-
ขีดจำกัดอัตราที่แก้ไขได้ — ค่าเริ่มต้นระดับระบบที่กำหนดค่าได้ในแดชบอร์ด:
- คำขอต่อนาที (RPM) — คำขอสูงสุดต่อนาทีต่อบัญชี
- เวลาขั้นต่ำระหว่างคำขอ — ช่องว่างขั้นต่ำเป็นมิลลิวินาทีระหว่างคำขอ
- คำขอพร้อมกันสูงสุด — คำขอพร้อมกันสูงสุดต่อบัญชี
- คลิก แก้ไข เพื่อแก้ไข จากนั้น บันทึก หรือ ยกเลิก ค่ายังคงมีอยู่ผ่าน API ความยืดหยุ่น
-
เซอร์กิตเบรกเกอร์ — ติดตามความล้มเหลวของผู้ให้บริการแต่ละราย และเปิดวงจรโดยอัตโนมัติเมื่อถึงเกณฑ์:
- ปิด (สมบูรณ์) — คำขอดำเนินไปตามปกติ
- เปิด — ผู้ให้บริการถูกบล็อกชั่วคราวหลังจากเกิดข้อผิดพลาดซ้ำแล้วซ้ำอีก
- HALF_OPEN — ทดสอบว่าผู้ให้บริการฟื้นตัวหรือไม่
-
นโยบายและตัวระบุที่ถูกล็อค — แสดงสถานะเซอร์กิตเบรกเกอร์และตัวระบุที่ถูกล็อคพร้อมความสามารถในการบังคับปลดล็อค
-
การตรวจจับขีดจำกัดอัตราอัตโนมัติ — ตรวจสอบส่วนหัว
429และRetry-Afterเพื่อหลีกเลี่ยงไม่ให้ถึงขีดจำกัดอัตราของผู้ให้บริการในเชิงรุก
เคล็ดลับสำหรับมือโปร: ใช้ปุ่ม รีเซ็ตทั้งหมด เพื่อล้างเซอร์กิตเบรกเกอร์และคูลดาวน์ทั้งหมดเมื่อผู้ให้บริการฟื้นตัวจากการหยุดทำงาน
จัดการการสำรองฐานข้อมูลใน แดชบอร์ด → การตั้งค่า → ระบบและที่เก็บข้อมูล
| การกระทำ | คำอธิบาย |
|---|---|
| ฐานข้อมูลการส่งออก | ดาวน์โหลดฐานข้อมูล SQLite ปัจจุบันเป็นไฟล์ .sqlite |
| ส่งออกทั้งหมด (.tar.gz) | ดาวน์โหลดไฟล์เก็บถาวรการสำรองข้อมูลแบบเต็ม รวมถึง: ฐานข้อมูล การตั้งค่า คอมโบ การเชื่อมต่อของผู้ให้บริการ (ไม่มีข้อมูลประจำตัว) ข้อมูลเมตาของคีย์ API |
| นำเข้าฐานข้อมูล | อัปโหลดไฟล์ .sqlite เพื่อแทนที่ฐานข้อมูลปัจจุบัน การสำรองข้อมูลก่อนนำเข้าจะถูกสร้างขึ้นโดยอัตโนมัติ |
# API: Export database
curl -o backup.sqlite http://localhost:20128/api/db-backups/export
# API: Export all (full archive)
curl -o backup.tar.gz http://localhost:20128/api/db-backups/exportAll
# API: Import database
curl -X POST http://localhost:20128/api/db-backups/import \
-F "file=@backup.sqlite"การตรวจสอบการนำเข้า: ไฟล์ที่นำเข้าได้รับการตรวจสอบความถูกต้อง (การตรวจสอบ SQLite Pragma), ตารางที่จำเป็น (provider_connections, provider_nodes, combos, api_keys) และขนาด (สูงสุด 100MB)
กรณีการใช้งาน:
- โยกย้าย OmniRoute ระหว่างเครื่อง
- สร้างการสำรองข้อมูลภายนอกสำหรับการกู้คืนระบบ
- แบ่งปันการกำหนดค่าระหว่างสมาชิกในทีม (ส่งออกทั้งหมด → แชร์ไฟล์เก็บถาวร)
หน้าการตั้งค่าแบ่งออกเป็น 5 แท็บเพื่อให้ง่ายต่อการนำทาง:
| แท็บ | สารบัญ |
|---|---|
| ความปลอดภัย | การตั้งค่าการเข้าสู่ระบบ/รหัสผ่าน, การควบคุมการเข้าถึง IP, การตรวจสอบสิทธิ์ API สำหรับ /models และการบล็อกผู้ให้บริการ |
| การกำหนดเส้นทาง | กลยุทธ์การกำหนดเส้นทางทั่วโลก (6 ตัวเลือก), นามแฝงโมเดลไวด์การ์ด, เชนทางเลือก, ค่าเริ่มต้นคอมโบ |
| ความยืดหยุ่น | โปรไฟล์ผู้ให้บริการ ขีดจำกัดอัตราที่แก้ไขได้ สถานะเซอร์กิตเบรกเกอร์ นโยบาย และตัวระบุที่ถูกล็อค |
| เอไอ | คิดการกำหนดค่างบประมาณ, การแทรกพร้อมท์ของระบบทั่วโลก, สถิติแคชพร้อมต์ |
| ขั้นสูง | การกำหนดค่าพร็อกซีส่วนกลาง (HTTP/SOCKS5) |
เข้าถึงได้ผ่าน แดชบอร์ด → ค่าใช้จ่าย
| แท็บ | วัตถุประสงค์ |
|---|---|
| งบประมาณ | กำหนดขีดจำกัดการใช้จ่ายต่อคีย์ API ด้วยงบประมาณรายวัน/รายสัปดาห์/รายเดือนและการติดตามแบบเรียลไทม์ |
| ราคา | ดูและแก้ไขรายการการกำหนดราคาโมเดล — ต้นทุนต่อโทเค็นอินพุต/เอาท์พุต 1K ต่อผู้ให้บริการ |
# API: Set a budget
curl -X POST http://localhost:20128/api/usage/budget \
-H "Content-Type: application/json" \
-d '{"keyId": "key-123", "limit": 50.00, "period": "monthly"}'
# API: Get current budget status
curl http://localhost:20128/api/usage/budgetการติดตามต้นทุน: ทุกคำขอจะบันทึกการใช้โทเค็นและคำนวณต้นทุนโดยใช้ตารางราคา ดูรายละเอียดใน แดชบอร์ด → การใช้งาน ตามผู้ให้บริการ รุ่น และคีย์ API
OmniRoute รองรับการถอดเสียงผ่านปลายทางที่เข้ากันได้กับ OpenAI:
POST /v1/audio/transcriptions
Authorization: Bearer your-api-key
Content-Type: multipart/form-data
# Example with curl
curl -X POST http://localhost:20128/v1/audio/transcriptions \
-H "Authorization: Bearer your-api-key" \
-F "file=@audio.mp3" \
-F "model=deepgram/nova-3"ผู้ให้บริการที่มีอยู่: Deepgram (deepgram/), AssemblyAI (assemblyai/)
รูปแบบเสียงที่รองรับ: mp3, wav, m4a, flac, ogg, webm
กำหนดค่าการปรับสมดุลต่อคอมโบใน แดชบอร์ด → คอมโบ → สร้าง/แก้ไข → กลยุทธ์
| กลยุทธ์ | คำอธิบาย |
|---|---|
| โรบินตัวกลม | หมุนเวียนไปตามโมเดลต่างๆ ตามลำดับ |
| ลำดับความสำคัญ | ลองใช้โมเดลแรกเสมอ ถอยกลับเฉพาะข้อผิดพลาด |
| สุ่ม | เลือกโมเดลแบบสุ่มจากคอมโบสำหรับแต่ละคำขอ |
| ถ่วงน้ำหนัก | เส้นทางตามสัดส่วนตามน้ำหนักที่กำหนดต่อรุ่น |
| ใช้งานน้อยที่สุด | กำหนดเส้นทางไปยังโมเดลที่มีคำขอล่าสุดน้อยที่สุด (ใช้เมตริกผสม) |
| การเพิ่มประสิทธิภาพต้นทุน | เส้นทางไปยังรุ่นที่ถูกที่สุด (ใช้ตารางราคา) |
ค่าเริ่มต้นคอมโบสากลสามารถตั้งค่าได้ใน แดชบอร์ด → การตั้งค่า → การกำหนดเส้นทาง → ค่าเริ่มต้นคอมโบ
เข้าถึงได้ทาง Dashboard → Health ภาพรวมความสมบูรณ์ของระบบเรียลไทม์พร้อมการ์ด 6 ใบ:
| บัตร | มันแสดงอะไร |
|---|---|
| สถานะระบบ | สถานะการออนไลน์ เวอร์ชัน การใช้หน่วยความจำ ไดเร็กทอรีข้อมูล |
| สุขภาพของผู้ให้บริการ | สถานะเซอร์กิตเบรกเกอร์ต่อผู้ให้บริการ (ปิด/เปิด/เปิดครึ่ง) |
| จำกัดอัตรา | คูลดาวน์จำกัดอัตราที่ใช้งานอยู่ต่อบัญชีพร้อมเวลาที่เหลืออยู่ |
| การล็อกที่ใช้งานอยู่ | ผู้ให้บริการถูกบล็อกชั่วคราวโดยนโยบายการล็อค |
| แคชลายเซ็น | สถิติแคชการขจัดข้อมูลซ้ำซ้อน (คีย์ที่ใช้งานอยู่ อัตราการเข้าถึง) |
| การวัดระยะไกลแบบหน่วงเวลา | การรวมเวลาแฝง p50/p95/p99 ต่อผู้ให้บริการ |
เคล็ดลับสำหรับมือโปร: หน้าสุขภาพจะรีเฟรชอัตโนมัติทุกๆ 10 วินาที ใช้การ์ดเซอร์กิตเบรกเกอร์เพื่อระบุว่าผู้ให้บริการรายใดกำลังประสบปัญหา