คู่มือการใช้งาน

คู่มือฉบับสมบูรณ์สำหรับการกำหนดค่าผู้ให้บริการ การสร้างคอมโบ การผสานรวมเครื่องมือ CLI และการปรับใช้ OmniRoute

สารบัญ

Pricing at a Glance
Use Cases
Provider Setup
CLI Integration
Deployment
Available Models
Advanced Features

💰 ราคาโดยสรุป

ชั้น	ผู้ให้บริการ	ราคา	รีเซ็ตโควต้า	ดีที่สุดสำหรับ
💳 สมัครสมาชิก	รหัสคลอดด์ (Pro)	$20/เดือน	5 ชม. + รายสัปดาห์	สมัครสมาชิกแล้ว
	Codex (พลัส/โปร)	$20-200/เดือน	5 ชม. + รายสัปดาห์	ผู้ใช้ OpenAI
	ราศีเมถุน CLI	ฟรี	180K/เดือน + 1K/วัน	ทุกคน!
	นักบิน GitHub	$10-19/เดือน	รายเดือน	ผู้ใช้ GitHub
🔑 คีย์ API	DeepSeek	จ่ายตามการใช้งาน	ไม่มี	การใช้เหตุผลราคาถูก
	กรอค	จ่ายตามการใช้งาน	ไม่มี	การอนุมานที่รวดเร็วเป็นพิเศษ
	xAI (โกรก)	จ่ายตามการใช้งาน	ไม่มี	Grok 4 การใช้เหตุผล
	มิสทรัล	จ่ายตามการใช้งาน	ไม่มี	โมเดลที่โฮสต์โดยสหภาพยุโรป
	ความฉงนสนเท่ห์	จ่ายตามการใช้งาน	ไม่มี	การค้นหาเสริม
	ร่วมกัน AI	จ่ายตามการใช้งาน	ไม่มี	โมเดลโอเพ่นซอร์ส
	ดอกไม้ไฟ AI	จ่ายตามการใช้งาน	ไม่มี	ภาพ FLUX ที่รวดเร็ว
	สมอง	จ่ายตามการใช้งาน	ไม่มี	ความเร็วระดับเวเฟอร์
	เชื่อมโยง	จ่ายตามการใช้งาน	ไม่มี	คำสั่ง R+ RAG
	NVIDIA NIM	จ่ายตามการใช้งาน	ไม่มี	โมเดลองค์กร
💰 ราคาถูก	GLM-4.7	$0.6/1M	ทุกวัน 10.00 น.	สำรองงบประมาณ
	MiniMax M2.1	$0.2/1M	กลิ้ง 5 ชั่วโมง	ตัวเลือกที่ถูกที่สุด
	คิมิ K2	$9/เดือน คงที่	10M โทเค็น/เดือน	ต้นทุนที่คาดการณ์ได้
🆓 ฟรี	ไอโฟลว์	$0	ไม่จำกัด	ฟรี 8 รุ่น
	ควีน	$0	ไม่จำกัด	ฟรี 3 รุ่น
	คิโระ	$0	ไม่จำกัด	คลอดด์ฟรี

💡 เคล็ดลับสำหรับมืออาชีพ: เริ่มต้นด้วย Gemini CLI (ฟรี 180,000 ต่อเดือน) + iFlow (ฟรีไม่จำกัด) คอมโบ = ค่าใช้จ่าย $0!

🎯 กรณีการใช้งาน

กรณีที่ 1: "ฉันสมัครสมาชิก Claude Pro"

ปัญหา: โควต้าหมดอายุโดยไม่ได้ใช้ อัตราจำกัดระหว่างการเขียนโค้ดจำนวนมาก

Combo: "maximize-claude"
  1. cc/claude-opus-4-6        (use subscription fully)
  2. glm/glm-4.7               (cheap backup when quota out)
  3. if/kimi-k2-thinking       (free emergency fallback)

Monthly cost: $20 (subscription) + ~$5 (backup) = $25 total
vs. $20 + hitting limits = frustration

กรณีที่ 2: "ฉันต้องการต้นทุนเป็นศูนย์"

ปัญหา: ไม่สามารถสมัครสมาชิกได้ ต้องการการเข้ารหัส AI ที่เชื่อถือได้

Combo: "free-forever"
  1. gc/gemini-3-flash         (180K free/month)
  2. if/kimi-k2-thinking       (unlimited free)
  3. qw/qwen3-coder-plus       (unlimited free)

Monthly cost: $0
Quality: Production-ready models

กรณีที่ 3: "ฉันต้องการการเข้ารหัสตลอด 24 ชั่วโมงทุกวัน ไม่มีการหยุดชะงัก"

ปัญหา: กำหนดเวลา ไม่สามารถหยุดการทำงานได้

Combo: "always-on"
  1. cc/claude-opus-4-6        (best quality)
  2. cx/gpt-5.2-codex          (second subscription)
  3. glm/glm-4.7               (cheap, resets daily)
  4. minimax/MiniMax-M2.1      (cheapest, 5h reset)
  5. if/kimi-k2-thinking       (free unlimited)

Result: 5 layers of fallback = zero downtime
Monthly cost: $20-200 (subscriptions) + $10-20 (backup)

กรณีที่ 4: "ฉันต้องการ AI ฟรีใน OpenClaw"

ปัญหา: ต้องการผู้ช่วย AI ในแอปส่งข้อความ ไม่มีค่าใช้จ่ายใดๆ ทั้งสิ้น

Combo: "openclaw-free"
  1. if/glm-4.7                (unlimited free)
  2. if/minimax-m2.1           (unlimited free)
  3. if/kimi-k2-thinking       (unlimited free)

Monthly cost: $0
Access via: WhatsApp, Telegram, Slack, Discord, iMessage, Signal...

📖 การตั้งค่าผู้ให้บริการ

🔐 ผู้ให้บริการสมัครสมาชิก

รหัสคลอด (Pro/Max)

Dashboard → Providers → Connect Claude Code
→ OAuth login → Auto token refresh
→ 5-hour + weekly quota tracking

Models:
  cc/claude-opus-4-6
  cc/claude-sonnet-4-5-20250929
  cc/claude-haiku-4-5-20251001

เคล็ดลับสำหรับมือโปร: ใช้ Opus สำหรับงานที่ซับซ้อน และใช้ Sonnet เพื่อความรวดเร็ว โควต้าการติดตาม OmniRoute ต่อรุ่น!

OpenAI Codex (พลัส/โปร)

Dashboard → Providers → Connect Codex
→ OAuth login (port 1455)
→ 5-hour + weekly reset

Models:
  cx/gpt-5.2-codex
  cx/gpt-5.1-codex-max

Gemini CLI (ฟรี 180K/เดือน!)

Dashboard → Providers → Connect Gemini CLI
→ Google OAuth
→ 180K completions/month + 1K/day

Models:
  gc/gemini-3-flash-preview
  gc/gemini-2.5-pro

คุ้มค่าที่สุด: ระดับฟรีมหาศาล! ใช้สิ่งนี้ก่อนระดับที่ชำระเงิน

นักบิน GitHub

Dashboard → Providers → Connect GitHub
→ OAuth via GitHub
→ Monthly reset (1st of month)

Models:
  gh/gpt-5
  gh/claude-4.5-sonnet
  gh/gemini-3-pro

💰 ผู้ให้บริการราคาถูก

GLM-4.7 (รีเซ็ตรายวัน, $0.6/1M)

ลงทะเบียน: Zhipu AI
รับคีย์ API จาก Coding Plan
แดชบอร์ด → เพิ่มคีย์ API: ผู้ให้บริการ: glm, คีย์ API: your-key

ใช้: glm/glm-4.7 — เคล็ดลับสำหรับมืออาชีพ: แผนการเขียนโค้ดเสนอโควต้า 3× ในราคา 1/7! รีเซ็ตทุกวัน 10.00 น.

MiniMax M2.1 (รีเซ็ต 5 ชม., $0.20/1M)

ลงทะเบียน: MiniMax
รับคีย์ API → แดชบอร์ด → เพิ่มคีย์ API

ใช้: minimax/MiniMax-M2.1 — เคล็ดลับสำหรับมือโปร: ตัวเลือกที่ถูกที่สุดสำหรับบริบทแบบยาว (โทเค็น 1M)!

Kimi K2 ($9/เดือน)

สมัครสมาชิก: Moonshot AI
รับคีย์ API → แดชบอร์ด → เพิ่มคีย์ API

ใช้: kimi/kimi-latest — เคล็ดลับสำหรับมืออาชีพ: แก้ไข $9/เดือนสำหรับโทเค็น 10M = $0.90/ต้นทุนจริง 1M!

🆓 ผู้ให้บริการฟรี

iFlow (ฟรี 8 รุ่น)

Dashboard → Connect iFlow → OAuth login → Unlimited usage

Models: if/kimi-k2-thinking, if/qwen3-coder-plus, if/glm-4.7, if/minimax-m2, if/deepseek-r1

Qwen (ฟรี 3 รุ่น)

Dashboard → Connect Qwen → Device code auth → Unlimited usage

Models: qw/qwen3-coder-plus, qw/qwen3-coder-flash

คิโระ (โคลด ฟรี)

Dashboard → Connect Kiro → AWS Builder ID or Google/GitHub → Unlimited

Models: kr/claude-sonnet-4.5, kr/claude-haiku-4.5

🎨 คอมโบ

ตัวอย่างที่ 1: เพิ่มการสมัครสมาชิกให้สูงสุด → การสำรองข้อมูลราคาถูก

Dashboard → Combos → Create New

Name: premium-coding
Models:
  1. cc/claude-opus-4-6 (Subscription primary)
  2. glm/glm-4.7 (Cheap backup, $0.6/1M)
  3. minimax/MiniMax-M2.1 (Cheapest fallback, $0.20/1M)

Use in CLI: premium-coding

ตัวอย่างที่ 2: ฟรีเท่านั้น (ไม่มีค่าใช้จ่าย)

Name: free-combo
Models:
  1. gc/gemini-3-flash-preview (180K free/month)
  2. if/kimi-k2-thinking (unlimited)
  3. qw/qwen3-coder-plus (unlimited)

Cost: $0 forever!

สมบูรณ์ บูรณาการ CLI

เคอร์เซอร์ IDE

Settings → Models → Advanced:
  OpenAI API Base URL: http://localhost:20128/v1
  OpenAI API Key: [from omniroute dashboard]
  Model: cc/claude-opus-4-6

รหัสคลอด

แก้ไข ~/.claude/config.json:

{
  "anthropic_api_base": "http://localhost:20128/v1",
  "anthropic_api_key": "your-omniroute-api-key"
}

Codex CLI

export OPENAI_BASE_URL="http://localhost:20128"
export OPENAI_API_KEY="your-omniroute-api-key"
codex "your prompt"

โอเพ่นคลอว์

แก้ไข ~/.openclaw/openclaw.json:

{
  "agents": {
    "defaults": {
      "model": { "primary": "omniroute/if/glm-4.7" }
    }
  },
  "models": {
    "providers": {
      "omniroute": {
        "baseUrl": "http://localhost:20128/v1",
        "apiKey": "your-omniroute-api-key",
        "api": "openai-completions",
        "models": [{ "id": "if/glm-4.7", "name": "glm-4.7" }]
      }
    }
  }
}

หรือใช้แดชบอร์ด: เครื่องมือ CLI → OpenClaw → กำหนดค่าอัตโนมัติ

ไคลน์ / ดำเนินการต่อ / RooCode

Provider: OpenAI Compatible
Base URL: http://localhost:20128/v1
API Key: [from dashboard]
Model: cc/claude-opus-4-6

🚀 การปรับใช้

การปรับใช้ VPS

git clone https://github.com/diegosouzapw/OmniRoute.git
cd OmniRoute && npm install && npm run build

export JWT_SECRET="your-secure-secret-change-this"
export INITIAL_PASSWORD="your-password"
export DATA_DIR="/var/lib/omniroute"
export PORT="20128"
export HOSTNAME="0.0.0.0"
export NODE_ENV="production"
export NEXT_PUBLIC_BASE_URL="http://localhost:20128"
export API_KEY_SECRET="endpoint-proxy-api-key-secret"

npm run start
# Or: pm2 start npm --name omniroute -- start

นักเทียบท่า

# Build image (default = runner-cli with codex/claude/droid preinstalled)
docker build -t omniroute:cli .

# Portable mode (recommended)
docker run -d --name omniroute -p 20128:20128 --env-file ./.env -v omniroute-data:/app/data omniroute:cli

สำหรับโหมดรวมโฮสต์ที่มีไบนารี CLI โปรดดูส่วนนักเทียบท่าในเอกสารหลัก

ตัวแปรสภาพแวดล้อม

ตัวแปร	ค่าเริ่มต้น	คำอธิบาย
`JWT_SECRET`	`omniroute-default-secret-change-me`	เคล็ดลับการลงนาม JWT (การเปลี่ยนแปลงในการผลิต)
`INITIAL_PASSWORD`	`123456`	รหัสผ่านเข้าสู่ระบบครั้งแรก
`DATA_DIR`	`~/.omniroute`	ไดเร็กทอรีข้อมูล (db, การใช้งาน, บันทึก)
`PORT`	ค่าเริ่มต้นของเฟรมเวิร์ก	พอร์ตบริการ (`20128` ในตัวอย่าง)
`HOSTNAME`	ค่าเริ่มต้นของเฟรมเวิร์ก	ผูกโฮสต์ (ค่าเริ่มต้นของ Docker คือ `0.0.0.0`)
`NODE_ENV`	รันไทม์เริ่มต้น	ตั้งค่า `production` สำหรับการปรับใช้
`BASE_URL`	`http://localhost:20128`	URL ฐานภายในฝั่งเซิร์ฟเวอร์
`CLOUD_URL`	`https://omniroute.dev`	URL ฐานปลายทางการซิงค์บนคลาวด์
`API_KEY_SECRET`	`endpoint-proxy-api-key-secret`	ข้อมูลลับ HMAC สำหรับคีย์ API ที่สร้างขึ้น
`REQUIRE_API_KEY`	`false`	บังคับใช้คีย์ Bearer API บน `/v1/*`
`ENABLE_REQUEST_LOGS`	`false`	เปิดใช้งานบันทึกคำขอ/การตอบกลับ
`AUTH_COOKIE_SECURE`	`false`	บังคับ `Secure` คุกกี้รับรองความถูกต้อง (หลังพร็อกซีย้อนกลับ HTTPS)

สำหรับการอ้างอิงตัวแปรสภาพแวดล้อมแบบเต็ม โปรดดูที่ README

📊 รุ่นที่มีจำหน่าย

ดูรุ่นที่มีทั้งหมด

**รหัสโคลด (`cc/`)** — โปร/สูงสุด: `cc/claude-opus-4-6`, `cc/claude-sonnet-4-5-20250929`, `cc/claude-haiku-4-5-20251001`

โคเด็กซ์ (cx/) — บวก/โปร: cx/gpt-5.2-codex, cx/gpt-5.1-codex-max

ราศีเมถุน CLI (gc/) — ฟรี: gc/gemini-3-flash-preview, gc/gemini-2.5-pro

โปรแกรมควบคุม GitHub (gh/): gh/gpt-5, gh/claude-4.5-sonnet

GLM (glm/) — $0.6/1M: glm/glm-4.7

MiniMax (minimax/) — $0.2/1M: minimax/MiniMax-M2.1

iFlow (if/) — ฟรี: if/kimi-k2-thinking, if/qwen3-coder-plus, if/deepseek-r1

คิวเวน (qw/) — ฟรี: qw/qwen3-coder-plus, qw/qwen3-coder-flash

คิโระ (kr/) — ฟรี: kr/claude-sonnet-4.5, kr/claude-haiku-4.5

ดีพซีค (ds/): ds/deepseek-chat, ds/deepseek-reasoner

โกรก (groq/): groq/llama-3.3-70b-versatile, groq/llama-4-maverick-17b-128e-instruct

xAI (xai/): xai/grok-4, xai/grok-4-0709-fast-reasoning, xai/grok-code-mini

มิสทรัล (mistral/): mistral/mistral-large-2501, mistral/codestral-2501

ความสับสน (pplx/): pplx/sonar-pro, pplx/sonar

** AI ร่วมกัน (together/)**: together/meta-llama/Llama-3.3-70B-Instruct-Turbo

ดอกไม้ไฟ AI (fireworks/): fireworks/accounts/fireworks/models/deepseek-v3p1

เซรีบร้า (cerebras/): cerebras/llama-3.3-70b

เชื่อมโยงกัน (cohere/): cohere/command-r-plus-08-2024

NVIDIA NIM (nvidia/): nvidia/nvidia/llama-3.3-70b-instruct

🧩 คุณสมบัติขั้นสูง

โมเดลที่กำหนดเอง

เพิ่ม ID รุ่นใดๆ ให้กับผู้ให้บริการโดยไม่ต้องรอการอัปเดตแอป:

# Via API
curl -X POST http://localhost:20128/api/provider-models \
  -H "Content-Type: application/json" \
  -d '{"provider": "openai", "modelId": "gpt-4.5-preview", "modelName": "GPT-4.5 Preview"}'

# List: curl http://localhost:20128/api/provider-models?provider=openai
# Remove: curl -X DELETE "http://localhost:20128/api/provider-models?provider=openai&model=gpt-4.5-preview"

หรือใช้แดชบอร์ด: ผู้ให้บริการ → [ผู้ให้บริการ] → โมเดลที่กำหนดเอง

เส้นทางของผู้ให้บริการเฉพาะ

กำหนดเส้นทางคำขอโดยตรงไปยังผู้ให้บริการเฉพาะด้วยการตรวจสอบโมเดล:

POST http://localhost:20128/v1/providers/openai/chat/completions
POST http://localhost:20128/v1/providers/openai/embeddings
POST http://localhost:20128/v1/providers/fireworks/images/generations

คำนำหน้าผู้ให้บริการจะถูกเพิ่มอัตโนมัติหากไม่มี โมเดลที่ไม่ตรงกันส่งคืน 400

การกำหนดค่าพร็อกซีเครือข่าย

# Set global proxy
curl -X PUT http://localhost:20128/api/settings/proxy \
  -d '{"global": {"type":"http","host":"proxy.example.com","port":"8080"}}'

# Per-provider proxy
curl -X PUT http://localhost:20128/api/settings/proxy \
  -d '{"providers": {"openai": {"type":"socks5","host":"proxy.example.com","port":"1080"}}}'

# Test proxy
curl -X POST http://localhost:20128/api/settings/proxy/test \
  -d '{"proxy":{"type":"socks5","host":"proxy.example.com","port":"1080"}}'

ลำดับความสำคัญ: เฉพาะคีย์ → เฉพาะคอมโบ → เฉพาะผู้ให้บริการ → ทั่วโลก → สภาพแวดล้อม

โมเดลแคตตาล็อก API

curl http://localhost:20128/api/models/catalog

ส่งคืนโมเดลที่จัดกลุ่มตามผู้ให้บริการที่มีประเภท (chat, embedding, image)

คลาวด์ซิงค์

ซิงค์ผู้ให้บริการ คอมโบ และการตั้งค่าระหว่างอุปกรณ์ต่างๆ
การซิงค์พื้นหลังอัตโนมัติพร้อมการหมดเวลา + ล้มเหลวอย่างรวดเร็ว
ต้องการ BASE_URL/CLOUD_URL ฝั่งเซิร์ฟเวอร์ในการใช้งานจริง

LLM Gateway Intelligence (ระยะที่ 9)

Semantic Cache — แคชอัตโนมัติไม่สตรีม อุณหภูมิ=0 การตอบสนอง (บายพาสด้วย X-OmniRoute-No-Cache: true)
คำขอ Idempotency — กรองคำขอที่ซ้ำกันภายใน 5 วินาทีผ่านส่วนหัว Idempotency-Key หรือ X-Request-Id
การติดตามความคืบหน้า — เลือกใช้กิจกรรม SSE event: progress ผ่านส่วนหัว X-OmniRoute-Progress: true

สนามเด็กเล่นนักแปล

เข้าถึงได้ผ่าน Dashboard → Translator แก้ไขข้อบกพร่องและเห็นภาพว่า OmniRoute แปลคำขอ API ระหว่างผู้ให้บริการอย่างไร

โหมด	วัตถุประสงค์
สนามเด็กเล่น	เลือกรูปแบบต้นทาง/เป้าหมาย วางคำขอ และดูผลลัพธ์ที่แปลได้ทันที
เครื่องมือทดสอบแชท	ส่งข้อความแชทสดผ่านพร็อกซีและตรวจสอบรอบคำขอ/การตอบกลับทั้งหมด
ม้านั่งทดสอบ	เรียกใช้การทดสอบเป็นกลุ่มโดยใช้รูปแบบต่างๆ ร่วมกันเพื่อตรวจสอบความถูกต้องของการแปล
ถ่ายทอดสด	ดูการแปลแบบเรียลไทม์ตามคำขอที่ไหลผ่านพร็อกซี

กรณีการใช้งาน:

ตรวจแก้จุดบกพร่องว่าทำไมการรวมไคลเอนต์/ผู้ให้บริการเฉพาะจึงล้มเหลว
ตรวจสอบว่าแท็กการคิด การเรียกใช้เครื่องมือ และการแจ้งเตือนของระบบแปลอย่างถูกต้อง
เปรียบเทียบความแตกต่างของรูปแบบระหว่างรูปแบบ OpenAI, Claude, Gemini และ Responses API

กลยุทธ์การกำหนดเส้นทาง

กำหนดค่าผ่าน แดชบอร์ด → การตั้งค่า → การกำหนดเส้นทาง

กลยุทธ์	คำอธิบาย
กรอกก่อน	ใช้บัญชีตามลำดับความสำคัญ — บัญชีหลักจะจัดการคำขอทั้งหมดจนกว่าจะไม่พร้อมใช้งาน
โรบินตัวกลม	วนรอบบัญชีทั้งหมดด้วยขีดจำกัดที่กำหนดได้ (ค่าเริ่มต้น: 3 สายต่อบัญชี)
P2C (พลังสองตัวเลือก)	เลือกบัญชีและเส้นทางแบบสุ่ม 2 บัญชีไปยังบัญชีที่ดีต่อสุขภาพมากขึ้น — สร้างสมดุลระหว่างภาระกับการรับรู้เรื่องสุขภาพ
สุ่ม	สุ่มเลือกบัญชีสำหรับแต่ละคำขอโดยใช้ Fisher-Yates shuffle
ใช้น้อยที่สุด	กำหนดเส้นทางไปยังบัญชีที่มีการประทับเวลา `lastUsedAt` เก่าที่สุด กระจายการรับส่งข้อมูลเท่าๆ กัน
ปรับต้นทุนให้เหมาะสม	กำหนดเส้นทางไปยังบัญชีที่มีค่าลำดับความสำคัญต่ำสุด ปรับให้เหมาะสมสำหรับผู้ให้บริการที่มีต้นทุนต่ำที่สุด

นามแฝงโมเดลไวด์การ์ด

สร้างรูปแบบไวด์การ์ดเพื่อทำการแมปชื่อโมเดลใหม่:

Pattern: claude-sonnet-*     →  Target: cc/claude-sonnet-4-5-20250929
Pattern: gpt-*               →  Target: gh/gpt-5.1-codex

Wildcard รองรับ * (อักขระใดก็ได้) และ ? (อักขระเดี่ยว)

โซ่สำรอง

กำหนดห่วงโซ่ทางเลือกส่วนกลางที่ใช้กับคำขอทั้งหมด:

Chain: production-fallback
  1. cc/claude-opus-4-6
  2. gh/gpt-5.1-codex
  3. glm/glm-4.7

ความยืดหยุ่นและเซอร์กิตเบรกเกอร์

กำหนดค่าผ่าน แดชบอร์ด → การตั้งค่า → ความยืดหยุ่น

OmniRoute ใช้ความยืดหยุ่นระดับผู้ให้บริการด้วยองค์ประกอบสี่ประการ:

โปรไฟล์ผู้ให้บริการ — การกำหนดค่าต่อผู้ให้บริการสำหรับ:
- เกณฑ์ความล้มเหลว (จำนวนความล้มเหลวก่อนเปิด)
- ระยะเวลาคูลดาวน์
- ความไวในการตรวจจับขีด จำกัด อัตรา
- พารามิเตอร์แบ็คออฟเอ็กซ์โปเนนเชียล
ขีดจำกัดอัตราที่แก้ไขได้ — ค่าเริ่มต้นระดับระบบที่กำหนดค่าได้ในแดชบอร์ด:
- คำขอต่อนาที (RPM) — คำขอสูงสุดต่อนาทีต่อบัญชี
- เวลาขั้นต่ำระหว่างคำขอ — ช่องว่างขั้นต่ำเป็นมิลลิวินาทีระหว่างคำขอ
- คำขอพร้อมกันสูงสุด — คำขอพร้อมกันสูงสุดต่อบัญชี
- คลิก แก้ไข เพื่อแก้ไข จากนั้น บันทึก หรือ ยกเลิก ค่ายังคงมีอยู่ผ่าน API ความยืดหยุ่น
เซอร์กิตเบรกเกอร์ — ติดตามความล้มเหลวของผู้ให้บริการแต่ละราย และเปิดวงจรโดยอัตโนมัติเมื่อถึงเกณฑ์:
- ปิด (สมบูรณ์) — คำขอดำเนินไปตามปกติ
- เปิด — ผู้ให้บริการถูกบล็อกชั่วคราวหลังจากเกิดข้อผิดพลาดซ้ำแล้วซ้ำอีก
- HALF_OPEN — ทดสอบว่าผู้ให้บริการฟื้นตัวหรือไม่
นโยบายและตัวระบุที่ถูกล็อค — แสดงสถานะเซอร์กิตเบรกเกอร์และตัวระบุที่ถูกล็อคพร้อมความสามารถในการบังคับปลดล็อค
การตรวจจับขีดจำกัดอัตราอัตโนมัติ — ตรวจสอบส่วนหัว 429 และ Retry-After เพื่อหลีกเลี่ยงไม่ให้ถึงขีดจำกัดอัตราของผู้ให้บริการในเชิงรุก

เคล็ดลับสำหรับมือโปร: ใช้ปุ่ม รีเซ็ตทั้งหมด เพื่อล้างเซอร์กิตเบรกเกอร์และคูลดาวน์ทั้งหมดเมื่อผู้ให้บริการฟื้นตัวจากการหยุดทำงาน

ส่งออก / นำเข้าฐานข้อมูล

จัดการการสำรองฐานข้อมูลใน แดชบอร์ด → การตั้งค่า → ระบบและที่เก็บข้อมูล

การกระทำ	คำอธิบาย
ฐานข้อมูลการส่งออก	ดาวน์โหลดฐานข้อมูล SQLite ปัจจุบันเป็นไฟล์ `.sqlite`
ส่งออกทั้งหมด (.tar.gz)	ดาวน์โหลดไฟล์เก็บถาวรการสำรองข้อมูลแบบเต็ม รวมถึง: ฐานข้อมูล การตั้งค่า คอมโบ การเชื่อมต่อของผู้ให้บริการ (ไม่มีข้อมูลประจำตัว) ข้อมูลเมตาของคีย์ API
นำเข้าฐานข้อมูล	อัปโหลดไฟล์ `.sqlite` เพื่อแทนที่ฐานข้อมูลปัจจุบัน การสำรองข้อมูลก่อนนำเข้าจะถูกสร้างขึ้นโดยอัตโนมัติ

# API: Export database
curl -o backup.sqlite http://localhost:20128/api/db-backups/export

# API: Export all (full archive)
curl -o backup.tar.gz http://localhost:20128/api/db-backups/exportAll

# API: Import database
curl -X POST http://localhost:20128/api/db-backups/import \
  -F "file=@backup.sqlite"

การตรวจสอบการนำเข้า: ไฟล์ที่นำเข้าได้รับการตรวจสอบความถูกต้อง (การตรวจสอบ SQLite Pragma), ตารางที่จำเป็น (provider_connections, provider_nodes, combos, api_keys) และขนาด (สูงสุด 100MB)

กรณีการใช้งาน:

โยกย้าย OmniRoute ระหว่างเครื่อง
สร้างการสำรองข้อมูลภายนอกสำหรับการกู้คืนระบบ
แบ่งปันการกำหนดค่าระหว่างสมาชิกในทีม (ส่งออกทั้งหมด → แชร์ไฟล์เก็บถาวร)

แดชบอร์ดการตั้งค่า

หน้าการตั้งค่าแบ่งออกเป็น 5 แท็บเพื่อให้ง่ายต่อการนำทาง:

แท็บ	สารบัญ
ความปลอดภัย	การตั้งค่าการเข้าสู่ระบบ/รหัสผ่าน, การควบคุมการเข้าถึง IP, การตรวจสอบสิทธิ์ API สำหรับ `/models` และการบล็อกผู้ให้บริการ
การกำหนดเส้นทาง	กลยุทธ์การกำหนดเส้นทางทั่วโลก (6 ตัวเลือก), นามแฝงโมเดลไวด์การ์ด, เชนทางเลือก, ค่าเริ่มต้นคอมโบ
ความยืดหยุ่น	โปรไฟล์ผู้ให้บริการ ขีดจำกัดอัตราที่แก้ไขได้ สถานะเซอร์กิตเบรกเกอร์ นโยบาย และตัวระบุที่ถูกล็อค
เอไอ	คิดการกำหนดค่างบประมาณ, การแทรกพร้อมท์ของระบบทั่วโลก, สถิติแคชพร้อมต์
ขั้นสูง	การกำหนดค่าพร็อกซีส่วนกลาง (HTTP/SOCKS5)

ต้นทุนและการจัดการงบประมาณ

เข้าถึงได้ผ่าน แดชบอร์ด → ค่าใช้จ่าย

แท็บ	วัตถุประสงค์
งบประมาณ	กำหนดขีดจำกัดการใช้จ่ายต่อคีย์ API ด้วยงบประมาณรายวัน/รายสัปดาห์/รายเดือนและการติดตามแบบเรียลไทม์
ราคา	ดูและแก้ไขรายการการกำหนดราคาโมเดล — ต้นทุนต่อโทเค็นอินพุต/เอาท์พุต 1K ต่อผู้ให้บริการ

# API: Set a budget
curl -X POST http://localhost:20128/api/usage/budget \
  -H "Content-Type: application/json" \
  -d '{"keyId": "key-123", "limit": 50.00, "period": "monthly"}'

# API: Get current budget status
curl http://localhost:20128/api/usage/budget

การติดตามต้นทุน: ทุกคำขอจะบันทึกการใช้โทเค็นและคำนวณต้นทุนโดยใช้ตารางราคา ดูรายละเอียดใน แดชบอร์ด → การใช้งาน ตามผู้ให้บริการ รุ่น และคีย์ API

การถอดเสียง

OmniRoute รองรับการถอดเสียงผ่านปลายทางที่เข้ากันได้กับ OpenAI:

POST /v1/audio/transcriptions
Authorization: Bearer your-api-key
Content-Type: multipart/form-data

# Example with curl
curl -X POST http://localhost:20128/v1/audio/transcriptions \
  -H "Authorization: Bearer your-api-key" \
  -F "file=@audio.mp3" \
  -F "model=deepgram/nova-3"

ผู้ให้บริการที่มีอยู่: Deepgram (deepgram/), AssemblyAI (assemblyai/)

รูปแบบเสียงที่รองรับ: mp3, wav, m4a, flac, ogg, webm

กลยุทธ์การปรับสมดุลคอมโบ

กำหนดค่าการปรับสมดุลต่อคอมโบใน แดชบอร์ด → คอมโบ → สร้าง/แก้ไข → กลยุทธ์

กลยุทธ์	คำอธิบาย
โรบินตัวกลม	หมุนเวียนไปตามโมเดลต่างๆ ตามลำดับ
ลำดับความสำคัญ	ลองใช้โมเดลแรกเสมอ ถอยกลับเฉพาะข้อผิดพลาด
สุ่ม	เลือกโมเดลแบบสุ่มจากคอมโบสำหรับแต่ละคำขอ
ถ่วงน้ำหนัก	เส้นทางตามสัดส่วนตามน้ำหนักที่กำหนดต่อรุ่น
ใช้งานน้อยที่สุด	กำหนดเส้นทางไปยังโมเดลที่มีคำขอล่าสุดน้อยที่สุด (ใช้เมตริกผสม)
การเพิ่มประสิทธิภาพต้นทุน	เส้นทางไปยังรุ่นที่ถูกที่สุด (ใช้ตารางราคา)

ค่าเริ่มต้นคอมโบสากลสามารถตั้งค่าได้ใน แดชบอร์ด → การตั้งค่า → การกำหนดเส้นทาง → ค่าเริ่มต้นคอมโบ

แดชบอร์ดสุขภาพ

เข้าถึงได้ทาง Dashboard → Health ภาพรวมความสมบูรณ์ของระบบเรียลไทม์พร้อมการ์ด 6 ใบ:

บัตร	มันแสดงอะไร
สถานะระบบ	สถานะการออนไลน์ เวอร์ชัน การใช้หน่วยความจำ ไดเร็กทอรีข้อมูล
สุขภาพของผู้ให้บริการ	สถานะเซอร์กิตเบรกเกอร์ต่อผู้ให้บริการ (ปิด/เปิด/เปิดครึ่ง)
จำกัดอัตรา	คูลดาวน์จำกัดอัตราที่ใช้งานอยู่ต่อบัญชีพร้อมเวลาที่เหลืออยู่
การล็อกที่ใช้งานอยู่	ผู้ให้บริการถูกบล็อกชั่วคราวโดยนโยบายการล็อค
แคชลายเซ็น	สถิติแคชการขจัดข้อมูลซ้ำซ้อน (คีย์ที่ใช้งานอยู่ อัตราการเข้าถึง)
การวัดระยะไกลแบบหน่วงเวลา	การรวมเวลาแฝง p50/p95/p99 ต่อผู้ให้บริการ

เคล็ดลับสำหรับมือโปร: หน้าสุขภาพจะรีเฟรชอัตโนมัติทุกๆ 10 วินาที ใช้การ์ดเซอร์กิตเบรกเกอร์เพื่อระบุว่าผู้ให้บริการรายใดกำลังประสบปัญหา

FilesExpand file tree

USER_GUIDE.md

Latest commit

History

USER_GUIDE.md

File metadata and controls

คู่มือการใช้งาน

สารบัญ

💰 ราคาโดยสรุป

🎯 กรณีการใช้งาน

กรณีที่ 1: "ฉันสมัครสมาชิก Claude Pro"

กรณีที่ 2: "ฉันต้องการต้นทุนเป็นศูนย์"

กรณีที่ 3: "ฉันต้องการการเข้ารหัสตลอด 24 ชั่วโมงทุกวัน ไม่มีการหยุดชะงัก"

กรณีที่ 4: "ฉันต้องการ AI ฟรีใน OpenClaw"

📖 การตั้งค่าผู้ให้บริการ

🔐 ผู้ให้บริการสมัครสมาชิก

รหัสคลอด (Pro/Max)

OpenAI Codex (พลัส/โปร)

Gemini CLI (ฟรี 180K/เดือน!)

นักบิน GitHub

💰 ผู้ให้บริการราคาถูก

GLM-4.7 (รีเซ็ตรายวัน, $0.6/1M)

MiniMax M2.1 (รีเซ็ต 5 ชม., $0.20/1M)

Kimi K2 ($9/เดือน)

🆓 ผู้ให้บริการฟรี

iFlow (ฟรี 8 รุ่น)

Qwen (ฟรี 3 รุ่น)

คิโระ (โคลด ฟรี)

🎨 คอมโบ

ตัวอย่างที่ 1: เพิ่มการสมัครสมาชิกให้สูงสุด → การสำรองข้อมูลราคาถูก

ตัวอย่างที่ 2: ฟรีเท่านั้น (ไม่มีค่าใช้จ่าย)

สมบูรณ์ บูรณาการ CLI

เคอร์เซอร์ IDE

รหัสคลอด

Codex CLI

โอเพ่นคลอว์

ไคลน์ / ดำเนินการต่อ / RooCode

🚀 การปรับใช้

การปรับใช้ VPS

นักเทียบท่า

ตัวแปรสภาพแวดล้อม

📊 รุ่นที่มีจำหน่าย

🧩 คุณสมบัติขั้นสูง

โมเดลที่กำหนดเอง

เส้นทางของผู้ให้บริการเฉพาะ

การกำหนดค่าพร็อกซีเครือข่าย

โมเดลแคตตาล็อก API

คลาวด์ซิงค์

LLM Gateway Intelligence (ระยะที่ 9)

สนามเด็กเล่นนักแปล

กลยุทธ์การกำหนดเส้นทาง

นามแฝงโมเดลไวด์การ์ด

โซ่สำรอง

ความยืดหยุ่นและเซอร์กิตเบรกเกอร์

ส่งออก / นำเข้าฐานข้อมูล

แดชบอร์ดการตั้งค่า

ต้นทุนและการจัดการงบประมาณ

การถอดเสียง

กลยุทธ์การปรับสมดุลคอมโบ

แดชบอร์ดสุขภาพ