用户指南

有关配置提供程序、创建组合、集成 CLI 工具和部署 OmniRoute 的完整指南。

💰 定价一览

等级	供应商	成本	配额重置	最适合
💳 订阅	克劳德代码（专业版）	$20/月	5 小时+ 每周	已经订阅
	Codex（增强版/专业版）	$20-200/月	5 小时+ 每周	OpenAI 用户
	双子座 CLI	免费	180K/月 + 1K/天	每个人！
	GitHub 副驾驶	$10-19/月	每月	GitHub 用户
🔑 API 密钥	深度搜索	按使用付费	无	廉价推理
	格罗克	按使用付费	无	超快速推理
	xAI (Grok)	按使用付费	无	Grok 4 推理
	米斯特拉尔	按使用付费	无	欧盟主办的模型
	困惑	按使用付费	无	搜索增强
	一起人工智能	按使用付费	无	开源模型
	烟花人工智能	按使用付费	无	快速通量图像
	大脑	按使用付费	无	晶圆级速度
	连贯	按使用付费	无	命令 R+ RAG
	NVIDIA NIM	按使用付费	无	企业典范
💰便宜	GLM-4.7	0.6 美元/100 万美元	每日上午 10 点	预算备份
	迷你最大M2.1	0.2 美元/100 万美元	5小时滚动	最便宜的选择
	基米K2	每月 9 美元的公寓	10M 代币/月	可预测的成本
🆓 免费	iFlow	0 美元	无限	8 款免费
	奎文	0 美元	无限	3 款免费
	基罗	0 美元	无限	克劳德自由

💡专业提示： 从 Gemini CLI（180K 免费/月）+ iFlow（无限免费）组合开始 = 0 美元成本！

🎯 使用案例

案例 1：“我订阅了 Claude Pro”

问题： 未使用的配额过期，繁重编码期间的速率限制

Combo: "maximize-claude"
  1. cc/claude-opus-4-6        (use subscription fully)
  2. glm/glm-4.7               (cheap backup when quota out)
  3. if/kimi-k2-thinking       (free emergency fallback)

Monthly cost: $20 (subscription) + ~$5 (backup) = $25 total
vs. $20 + hitting limits = frustration

案例 2：“我想要零成本”

问题： 无力订阅，需要可靠的人工智能编码

Combo: "free-forever"
  1. gc/gemini-3-flash         (180K free/month)
  2. if/kimi-k2-thinking       (unlimited free)
  3. qw/qwen3-coder-plus       (unlimited free)

Monthly cost: $0
Quality: Production-ready models

案例 3：“我需要 24/7 不间断编码”

问题： 截止日期，无法承受停机时间

Combo: "always-on"
  1. cc/claude-opus-4-6        (best quality)
  2. cx/gpt-5.2-codex          (second subscription)
  3. glm/glm-4.7               (cheap, resets daily)
  4. minimax/MiniMax-M2.1      (cheapest, 5h reset)
  5. if/kimi-k2-thinking       (free unlimited)

Result: 5 layers of fallback = zero downtime
Monthly cost: $20-200 (subscriptions) + $10-20 (backup)

案例 4：“我想要 OpenClaw 中的免费 AI”

问题： 需要在消息应用程序中使用人工智能助手，完全免费

Combo: "openclaw-free"
  1. if/glm-4.7                (unlimited free)
  2. if/minimax-m2.1           (unlimited free)
  3. if/kimi-k2-thinking       (unlimited free)

Monthly cost: $0
Access via: WhatsApp, Telegram, Slack, Discord, iMessage, Signal...

📖 提供商设置

🔐 订阅提供商

克劳德代码（Pro/Max）

Dashboard → Providers → Connect Claude Code
→ OAuth login → Auto token refresh
→ 5-hour + weekly quota tracking

Models:
  cc/claude-opus-4-6
  cc/claude-sonnet-4-5-20250929
  cc/claude-haiku-4-5-20251001

专业提示： 使用 Opus 来完成复杂的任务，使用 Sonnet 来提高速度。 OmniRoute 跟踪每个模型的配额！

OpenAI Codex（增强版/专业版）

Dashboard → Providers → Connect Codex
→ OAuth login (port 1455)
→ 5-hour + weekly reset

Models:
  cx/gpt-5.2-codex
  cx/gpt-5.1-codex-max

Gemini CLI（免费 180K/月！）

Dashboard → Providers → Connect Gemini CLI
→ Google OAuth
→ 180K completions/month + 1K/day

Models:
  gc/gemini-3-flash-preview
  gc/gemini-2.5-pro

最超值： 巨大的免费套餐！在付费等级之前使用此功能。

GitHub 副驾驶

Dashboard → Providers → Connect GitHub
→ OAuth via GitHub
→ Monthly reset (1st of month)

Models:
  gh/gpt-5
  gh/claude-4.5-sonnet
  gh/gemini-3-pro

💰 廉价提供商

GLM-4.7（每日重置，0.6 美元/100 万美元）

注册：Zhipu AI
从 Coding Plan 获取 API 密钥
控制面板 → 添加 API 密钥：提供商：glm，API 密钥：your-key

使用： glm/glm-4.7 — 专业提示： Coding Plan 以 1/7 的成本提供 3× 配额！每天上午 10:00 重置。

MiniMax M2.1（5 小时重置，0.20 美元/100 万美元）

使用： minimax/MiniMax-M2.1 — 专业提示： 长上下文（1M 令牌）的最便宜选择！

Kimi K2（每月 9 美元）

1.订阅：Moonshot AI 2.获取API密钥→仪表板→添加API密钥

使用： kimi/kimi-latest — 专业提示： 固定 9 美元/月 1000 万个代币 = 0.90 美元/100 万个有效成本！

🆓 免费提供商

iFlow（8 个免费模型）

Dashboard → Connect iFlow → OAuth login → Unlimited usage

Models: if/kimi-k2-thinking, if/qwen3-coder-plus, if/glm-4.7, if/minimax-m2, if/deepseek-r1

Qwen（3 个免费模型）

Dashboard → Connect Qwen → Device code auth → Unlimited usage

Models: qw/qwen3-coder-plus, qw/qwen3-coder-flash

Kiro（克劳德·自由）

Dashboard → Connect Kiro → AWS Builder ID or Google/GitHub → Unlimited

Models: kr/claude-sonnet-4.5, kr/claude-haiku-4.5

🎨 组合

示例 1：最大化订阅 → 廉价备份

Dashboard → Combos → Create New

Name: premium-coding
Models:
  1. cc/claude-opus-4-6 (Subscription primary)
  2. glm/glm-4.7 (Cheap backup, $0.6/1M)
  3. minimax/MiniMax-M2.1 (Cheapest fallback, $0.20/1M)

Use in CLI: premium-coding

示例 2：仅免费（零成本）

Name: free-combo
Models:
  1. gc/gemini-3-flash-preview (180K free/month)
  2. if/kimi-k2-thinking (unlimited)
  3. qw/qwen3-coder-plus (unlimited)

Cost: $0 forever!

🔧 CLI 集成

光标 IDE

Settings → Models → Advanced:
  OpenAI API Base URL: http://localhost:20128/v1
  OpenAI API Key: [from omniroute dashboard]
  Model: cc/claude-opus-4-6

克劳德·代码

编辑 ~/.claude/config.json：

{
  "anthropic_api_base": "http://localhost:20128/v1",
  "anthropic_api_key": "your-omniroute-api-key"
}

Codex CLI

export OPENAI_BASE_URL="http://localhost:20128"
export OPENAI_API_KEY="your-omniroute-api-key"
codex "your prompt"

开爪

编辑 ~/.openclaw/openclaw.json：

{
  "agents": {
    "defaults": {
      "model": { "primary": "omniroute/if/glm-4.7" }
    }
  },
  "models": {
    "providers": {
      "omniroute": {
        "baseUrl": "http://localhost:20128/v1",
        "apiKey": "your-omniroute-api-key",
        "api": "openai-completions",
        "models": [{ "id": "if/glm-4.7", "name": "glm-4.7" }]
      }
    }
  }
}

或使用仪表板： CLI 工具 → OpenClaw → 自动配置

克莱恩 / 继续 / RooCode

Provider: OpenAI Compatible
Base URL: http://localhost:20128/v1
API Key: [from dashboard]
Model: cc/claude-opus-4-6

🚀 部署

VPS 部署

git clone https://github.com/diegosouzapw/OmniRoute.git
cd OmniRoute && npm install && npm run build

export JWT_SECRET="your-secure-secret-change-this"
export INITIAL_PASSWORD="your-password"
export DATA_DIR="/var/lib/omniroute"
export PORT="20128"
export HOSTNAME="0.0.0.0"
export NODE_ENV="production"
export NEXT_PUBLIC_BASE_URL="http://localhost:20128"
export API_KEY_SECRET="endpoint-proxy-api-key-secret"

npm run start
# Or: pm2 start npm --name omniroute -- start

码头工人

# Build image (default = runner-cli with codex/claude/droid preinstalled)
docker build -t omniroute:cli .

# Portable mode (recommended)
docker run -d --name omniroute -p 20128:20128 --env-file ./.env -v omniroute-data:/app/data omniroute:cli

对于使用 CLI 二进制文件的主机集成模式，请参阅主文档中的 Docker 部分。

环境变量

变量	默认	描述
`JWT_SECRET`	`omniroute-default-secret-change-me`	JWT 签名秘密（生产变更）
`INITIAL_PASSWORD`	`123456`	首次登录密码
`DATA_DIR`	`~/.omniroute`	数据目录（数据库、使用情况、日志）
`PORT`	框架默认	服务端口（示例中为 `20128`）
`HOSTNAME`	框架默认	绑定主机（Docker 默认为 `0.0.0.0`）
`NODE_ENV`	运行时默认	设置 `production` 进行部署
`BASE_URL`	`http://localhost:20128`	服务器端内部基本 URL
`CLOUD_URL`	`https://omniroute.dev`	云同步端点基本 URL
`API_KEY_SECRET`	`endpoint-proxy-api-key-secret`	生成的 API 密钥的 HMAC 秘密
`REQUIRE_API_KEY`	`false`	在 `/v1/*` 上强制执行 Bearer API 密钥
`ENABLE_REQUEST_LOGS`	`false`	启用请求/响应日志
`AUTH_COOKIE_SECURE`	`false`	强制 `Secure` auth cookie（在 HTTPS 反向代理后面）

有关完整环境变量参考，请参阅 README。

📊 可用型号

查看所有可用型号

克劳德代码 (cc/) — Pro/Max：cc/claude-opus-4-6、cc/claude-sonnet-4-5-20250929、cc/claude-haiku-4-5-20251001

法典 (cx/) — 增强版/专业版：cx/gpt-5.2-codex、cx/gpt-5.1-codex-max

Gemini CLI (gc/) — 免费：gc/gemini-3-flash-preview、gc/gemini-2.5-pro

GitHub Copilot (gh/)：gh/gpt-5、gh/claude-4.5-sonnet

GLM (glm/) — 0.6 美元/100 万美元：glm/glm-4.7

MiniMax (minimax/) — 0.2 美元/100 万美元：minimax/MiniMax-M2.1

iFlow (if/) — 免费：if/kimi-k2-thinking、if/qwen3-coder-plus、if/deepseek-r1

Qwen (qw/) — 免费：qw/qwen3-coder-plus、qw/qwen3-coder-flash

Kiro (kr/) — 免费：kr/claude-sonnet-4.5、kr/claude-haiku-4.5

DeepSeek (ds/)：ds/deepseek-chat、ds/deepseek-reasoner

Groq (groq/)：groq/llama-3.3-70b-versatile、groq/llama-4-maverick-17b-128e-instruct

xAI (xai/)：xai/grok-4、xai/grok-4-0709-fast-reasoning、xai/grok-code-mini

米斯特拉尔 (mistral/)：mistral/mistral-large-2501、mistral/codestral-2501

困惑 (pplx/)：pplx/sonar-pro、pplx/sonar

一起人工智能 (together/)：together/meta-llama/Llama-3.3-70B-Instruct-Turbo

烟花人工智能 (fireworks/)：fireworks/accounts/fireworks/models/deepseek-v3p1

Cerebras (cerebras/)：cerebras/llama-3.3-70b

一致 (cohere/)：cohere/command-r-plus-08-2024

NVIDIA NIM (nvidia/)：nvidia/nvidia/llama-3.3-70b-instruct

🧩 高级功能

定制模型

将任何模型 ID 添加到任何提供商，无需等待应用程序更新：

# Via API
curl -X POST http://localhost:20128/api/provider-models \
  -H "Content-Type: application/json" \
  -d '{"provider": "openai", "modelId": "gpt-4.5-preview", "modelName": "GPT-4.5 Preview"}'

# List: curl http://localhost:20128/api/provider-models?provider=openai
# Remove: curl -X DELETE "http://localhost:20128/api/provider-models?provider=openai&model=gpt-4.5-preview"

或者使用仪表板：提供商 → [提供商] → 自定义模型。

专用提供商路线

通过模型验证将请求直接路由到特定提供者：

POST http://localhost:20128/v1/providers/openai/chat/completions
POST http://localhost:20128/v1/providers/openai/embeddings
POST http://localhost:20128/v1/providers/fireworks/images/generations

如果缺少提供商前缀，则会自动添加。不匹配的模型返回 400。

网络代理配置

# Set global proxy
curl -X PUT http://localhost:20128/api/settings/proxy \
  -d '{"global": {"type":"http","host":"proxy.example.com","port":"8080"}}'

# Per-provider proxy
curl -X PUT http://localhost:20128/api/settings/proxy \
  -d '{"providers": {"openai": {"type":"socks5","host":"proxy.example.com","port":"1080"}}}'

# Test proxy
curl -X POST http://localhost:20128/api/settings/proxy/test \
  -d '{"proxy":{"type":"socks5","host":"proxy.example.com","port":"1080"}}'

**优先级：**特定于键→特定于组合→特定于提供者→全局→环境。

模型目录 API

curl http://localhost:20128/api/models/catalog

返回按类型（chat、embedding、image）提供者分组的模型。

云同步

跨设备同步提供商、组合和设置
自动后台同步，带超时+快速失败
在生产中更喜欢服务器端 BASE_URL/CLOUD_URL

LLM Gateway Intelligence（第 9 阶段）

语义缓存 — 自动缓存非流式传输、温度=0 响应（使用 X-OmniRoute-No-Cache: true 绕过）
请求幂等性 — 通过 Idempotency-Key 或 X-Request-Id 标头在 5 秒内删除重复请求
进度跟踪 — 通过 X-OmniRoute-Progress: true 标头选择加入 SSE event: progress 事件

翻译游乐场

通过仪表板 → 翻译器访问。调试并可视化 OmniRoute 如何在提供者之间转换 API 请求。

模式	目的
游乐场	选择源/目标格式，粘贴请求，然后立即查看翻译的输出
聊天测试仪	通过代理发送实时聊天消息并检查完整的请求/响应周期
测试台	跨多种格式组合运行批量测试以验证翻译的正确性
实时监控	当请求流经代理时观看实时翻译

使用案例：

调试特定客户端/提供商组合失败的原因
验证思维标签、工具调用和系统提示是否正确翻译
比较 OpenAI、Claude、Gemini 和 Responses API 格式之间的格式差异

路由策略

通过仪表板→设置→路由进行配置。

战略	描述
先填写	按优先级顺序使用帐户 — 主帐户处理所有请求，直到不可用为止
循环赛	循环浏览所有帐户，并具有可配置的粘性限制（默认：每个帐户 3 次调用）
P2C（两种选择的力量）	随机选择 2 个账户并选择更健康的账户 — 平衡负荷与健康意识
随机	使用 Fisher-Yates shuffle 为每个请求随机选择一个帐户
最少使用	路由到具有最早 `lastUsedAt` 时间戳的帐户，均匀分配流量
成本优化	路由至具有最低优先级值的帐户，针对成本最低的提供商进行优化

通配符模型别名

创建通配符模式来重新映射模型名称：

Pattern: claude-sonnet-*     →  Target: cc/claude-sonnet-4-5-20250929
Pattern: gpt-*               →  Target: gh/gpt-5.1-codex

通配符支持 *（任何字符）和 ?（单个字符）。

后备链

定义适用于所有请求的全局后备链：

Chain: production-fallback
  1. cc/claude-opus-4-6
  2. gh/gpt-5.1-codex
  3. glm/glm-4.7

弹性和断路器

通过仪表板→设置→弹性进行配置。

OmniRoute 通过四个组件实现提供商级弹性：

提供商配置文件 — 每个提供商的配置：
- 失败阈值（打开前有多少次失败）
- 冷却时间
- 速率限制检测灵敏度
- 指数退避参数
可编辑的速率限制 — 可在仪表板中配置的系统级默认值：
- 每分钟请求数 (RPM) — 每个帐户每分钟最大请求数
- 请求之间的最小时间 — 请求之间的最小间隔（以毫秒为单位）
- 最大并发请求 — 每个帐户的最大并发请求数
- 点击编辑进行修改，然后点击保存或取消。价值通过弹性 API 得以保留。
断路器 — 跟踪每个提供商的故障并在达到阈值时自动打开电路：
- CLOSED（健康）— 请求正常流动
- OPEN — 提供商在多次失败后被暂时阻止
- HALF_OPEN — 测试提供商是否已恢复
策略和锁定标识符 — 显示断路器状态和具有强制解锁功能的锁定标识符。
速率限制自动检测 — 监控 429 和 Retry-After 标头，以主动避免达到提供商速率限制。

专业提示： 当提供商从中断中恢复时，使用 全部重置 按钮可以清除所有断路器和冷却时间。

数据库导出/导入

在仪表板→设置→系统和存储中管理数据库备份。

行动	描述
导出数据库	将当前 SQLite 数据库下载为 `.sqlite` 文件
全部导出 (.tar.gz)	下载完整的备份存档，包括：数据库、设置、组合、提供商连接（无凭据）、API 密钥元数据
导入数据库	上传 `.sqlite` 文件以替换当前数据库。自动创建导入前备份

# API: Export database
curl -o backup.sqlite http://localhost:20128/api/db-backups/export

# API: Export all (full archive)
curl -o backup.tar.gz http://localhost:20128/api/db-backups/exportAll

# API: Import database
curl -X POST http://localhost:20128/api/db-backups/import \
  -F "file=@backup.sqlite"

导入验证： 验证导入文件的完整性（SQLite 编译指示检查）、所需表（provider_connections、provider_nodes、combos、api_keys）和大小（最大 100MB）。