Skip to content

Latest commit

 

History

History
698 lines (486 loc) · 42 KB

File metadata and controls

698 lines (486 loc) · 42 KB

Руководство пользователя

🌐 Languages: 🇺🇸 English | 🇧🇷 Português (Brasil) | 🇪🇸 Español | 🇫🇷 Français | 🇮🇹 Italiano | 🇷🇺 Русский | 🇨🇳 中文 (简体) | 🇩🇪 Deutsch | 🇮🇳 हिन्दी | 🇹🇭 ไทย | 🇺🇦 Українська | 🇸🇦 العربية | 🇯🇵 日本語 | 🇻🇳 Tiếng Việt | 🇧🇬 Български | 🇩🇰 Dansk | 🇫🇮 Suomi | 🇮🇱 עברית | 🇭🇺 Magyar | 🇮🇩 Bahasa Indonesia | 🇰🇷 한국어 | 🇲🇾 Bahasa Melayu | 🇳🇱 Nederlands | 🇳🇴 Norsk | 🇵🇹 Português (Portugal) | 🇷🇴 Română | 🇵🇱 Polski | 🇸🇰 Slovenčina | 🇸🇪 Svenska | 🇵🇭 Filipino

Полное руководство по настройке поставщиков, созданию комбинаций, интеграции инструментов CLI и развертыванию OmniRoute.


Содержание


💰 Краткий обзор цен

Уровень Провайдер Стоимость Сброс квоты Лучшее для
💳 ПОДПИСКА Клод Код (Про) 20 долларов США в месяц 5 часов + еженедельно Уже подписан
Кодекс (Плюс/Про) 20–200 долларов в месяц 5 часов + еженедельно Пользователи OpenAI
Близнецы CLI БЕСПЛАТНО 180 тыс./мес + 1 тыс./день Каждый!
Второй пилот GitHub 10–19 долларов в месяц Ежемесячно Пользователи GitHub
🔑 КЛЮЧ API ДипСик Плата за использование Нет Дешевое рассуждение
Грок Плата за использование Нет Сверхбыстрый вывод
xAI (Грок) Плата за использование Нет рассуждения Грока 4
Мистраль Плата за использование Нет Модели, размещенные в ЕС
Растерянность Плата за использование Нет Расширенный поиск
Вместе ИИ Плата за использование Нет Модели с открытым исходным кодом
Фейерверк ИИ Плата за использование Нет Изображения Fast FLUX
Церебра Плата за использование Нет Скорость пластинчатого масштаба
Согласовано Плата за использование Нет Команда R+ ТРЯПКА
NVIDIA НИМ Плата за использование Нет Модели предприятия
💰 ДЕШЕВО ГЛМ-4.7 0,6 долл. США/1 млн Ежедневно в 10:00 Резервное копирование бюджета
МиниМакс М2.1 0,2 долл. США/1 млн 5-часовой прокат Самый дешевый вариант
Кими К2 9 долларов в месяц за квартиру 10 миллионов токенов в месяц Предсказуемая стоимость
🆓 БЕСПЛАТНО iFlow $0 Неограниченный 8 моделей бесплатно
Квен $0 Неограниченный 3 модели бесплатно
Киро $0 Неограниченный Клод бесплатно

💡Совет для профессионалов: Начните с комбинации Gemini CLI (180 000 бесплатно в месяц) + iFlow (бесплатно без ограничений) = стоимость 0 долларов США!


🎯 Варианты использования

Случай 1: «У меня подписка Claude Pro»

Проблема: Срок действия квоты истекает, если она не используется, ограничения скорости во время интенсивного кодирования.

Combo: "maximize-claude"
  1. cc/claude-opus-4-6        (use subscription fully)
  2. glm/glm-4.7               (cheap backup when quota out)
  3. if/kimi-k2-thinking       (free emergency fallback)

Monthly cost: $20 (subscription) + ~$5 (backup) = $25 total
vs. $20 + hitting limits = frustration

Случай 2: «Я хочу нулевую стоимость»

Проблема: Не могу позволить себе подписку, нужно надежное кодирование с использованием искусственного интеллекта.

Combo: "free-forever"
  1. gc/gemini-3-flash         (180K free/month)
  2. if/kimi-k2-thinking       (unlimited free)
  3. qw/qwen3-coder-plus       (unlimited free)

Monthly cost: $0
Quality: Production-ready models

Случай 3: «Мне нужно кодирование 24/7, без перерывов»

Проблема: сроки, невозможность простоя

Combo: "always-on"
  1. cc/claude-opus-4-6        (best quality)
  2. cx/gpt-5.2-codex          (second subscription)
  3. glm/glm-4.7               (cheap, resets daily)
  4. minimax/MiniMax-M2.1      (cheapest, 5h reset)
  5. if/kimi-k2-thinking       (free unlimited)

Result: 5 layers of fallback = zero downtime
Monthly cost: $20-200 (subscriptions) + $10-20 (backup)

Случай 4: «Мне нужен БЕСПЛАТНЫЙ ИИ в OpenClaw»

Проблема: Нужен ИИ-помощник в приложениях для обмена сообщениями, совершенно бесплатно.

Combo: "openclaw-free"
  1. if/glm-4.7                (unlimited free)
  2. if/minimax-m2.1           (unlimited free)
  3. if/kimi-k2-thinking       (unlimited free)

Monthly cost: $0
Access via: WhatsApp, Telegram, Slack, Discord, iMessage, Signal...

📖 Настройка провайдера

🔐 Поставщики подписки

Клод Код (Про/Макс)

Dashboard → Providers → Connect Claude Code
→ OAuth login → Auto token refresh
→ 5-hour + weekly quota tracking

Models:
  cc/claude-opus-4-6
  cc/claude-sonnet-4-5-20250929
  cc/claude-haiku-4-5-20251001

Совет для профессионалов. Используйте Opus для сложных задач и Sonnet для скорости. OmniRoute отслеживает квоту на каждую модель!

Кодекс OpenAI (Плюс/Про)

Dashboard → Providers → Connect Codex
→ OAuth login (port 1455)
→ 5-hour + weekly reset

Models:
  cx/gpt-5.2-codex
  cx/gpt-5.1-codex-max

Gemini CLI (180 000 БЕСПЛАТНО в месяц!)

Dashboard → Providers → Connect Gemini CLI
→ Google OAuth
→ 180K completions/month + 1K/day

Models:
  gc/gemini-3-flash-preview
  gc/gemini-2.5-pro

Лучшая цена: Огромный уровень бесплатного пользования! Используйте это перед платными уровнями.

Второй пилот GitHub

Dashboard → Providers → Connect GitHub
→ OAuth via GitHub
→ Monthly reset (1st of month)

Models:
  gh/gpt-5
  gh/claude-4.5-sonnet
  gh/gemini-3-pro

💰 Дешевые провайдеры

GLM-4.7 (ежедневный сброс, $0,6/1 миллион)

  1. Зарегистрируйтесь: Zhipu AI
  2. Получите ключ API из плана кодирования.
  3. Панель управления → Добавить ключ API: Поставщик: glm, Ключ API: your-key.

Используйте: glm/glm-4.7Совет для профессионалов: План кодирования предлагает 3-кратную квоту за 1/7 стоимости! Сброс ежедневно в 10:00.

MiniMax M2.1 (5 часов сброса, 0,20 доллара США/1 миллион долларов США)

  1. Зарегистрируйтесь: MiniMax
  2. Получите ключ API → Панель управления → Добавить ключ API.

Используйте: minimax/MiniMax-M2.1Совет для профессионалов: Самый дешевый вариант для длинного контекста (1 млн токенов)!

Кими К2 (фиксированная цена 9 долларов в месяц)

  1. Подпишитесь: Moonshot AI
  2. Получите ключ API → Панель управления → Добавить ключ API.

Используйте: kimi/kimi-latestСовет для профессионалов: Фиксированная 9 долларов США в месяц за 10 миллионов токенов = эффективная стоимость 0,90 долларов США/1 миллион долларов США!

🆓 БЕСПЛАТНЫЕ провайдеры

iFlow (8 БЕСПЛАТНЫХ моделей)

Dashboard → Connect iFlow → OAuth login → Unlimited usage

Models: if/kimi-k2-thinking, if/qwen3-coder-plus, if/glm-4.7, if/minimax-m2, if/deepseek-r1

Квен (3 БЕСПЛАТНЫЕ модели)

Dashboard → Connect Qwen → Device code auth → Unlimited usage

Models: qw/qwen3-coder-plus, qw/qwen3-coder-flash

Киро (Клод ФРИ)

Dashboard → Connect Kiro → AWS Builder ID or Google/GitHub → Unlimited

Models: kr/claude-sonnet-4.5, kr/claude-haiku-4.5

🎨 Комбо

Пример 1: увеличить подписку → дешевое резервное копирование

Dashboard → Combos → Create New

Name: premium-coding
Models:
  1. cc/claude-opus-4-6 (Subscription primary)
  2. glm/glm-4.7 (Cheap backup, $0.6/1M)
  3. minimax/MiniMax-M2.1 (Cheapest fallback, $0.20/1M)

Use in CLI: premium-coding

Пример 2: только бесплатно (нулевая стоимость)

Name: free-combo
Models:
  1. gc/gemini-3-flash-preview (180K free/month)
  2. if/kimi-k2-thinking (unlimited)
  3. qw/qwen3-coder-plus (unlimited)

Cost: $0 forever!

🔧 Интеграция CLI

Курсор IDE

Settings → Models → Advanced:
  OpenAI API Base URL: http://localhost:20128/v1
  OpenAI API Key: [from omniroute dashboard]
  Model: cc/claude-opus-4-6

Клод Код

Отредактируйте ~/.claude/config.json:

{
  "anthropic_api_base": "http://localhost:20128/v1",
  "anthropic_api_key": "your-omniroute-api-key"
}

Интерфейс командной строки Кодекса

export OPENAI_BASE_URL="http://localhost:20128"
export OPENAI_API_KEY="your-omniroute-api-key"
codex "your prompt"

OpenClaw

Отредактируйте ~/.openclaw/openclaw.json:

{
  "agents": {
    "defaults": {
      "model": { "primary": "omniroute/if/glm-4.7" }
    }
  },
  "models": {
    "providers": {
      "omniroute": {
        "baseUrl": "http://localhost:20128/v1",
        "apiKey": "your-omniroute-api-key",
        "api": "openai-completions",
        "models": [{ "id": "if/glm-4.7", "name": "glm-4.7" }]
      }
    }
  }
}

Или используйте панель инструментов: Инструменты CLI → OpenClaw → Автонастройка.

Клайн / Продолжить / RooCode

Provider: OpenAI Compatible
Base URL: http://localhost:20128/v1
API Key: [from dashboard]
Model: cc/claude-opus-4-6

🚀 Развертывание

Развертывание VPS

git clone https://github.com/diegosouzapw/OmniRoute.git
cd OmniRoute && npm install && npm run build

export JWT_SECRET="your-secure-secret-change-this"
export INITIAL_PASSWORD="your-password"
export DATA_DIR="/var/lib/omniroute"
export PORT="20128"
export HOSTNAME="0.0.0.0"
export NODE_ENV="production"
export NEXT_PUBLIC_BASE_URL="http://localhost:20128"
export API_KEY_SECRET="endpoint-proxy-api-key-secret"

npm run start
# Or: pm2 start npm --name omniroute -- start

Докер

# Build image (default = runner-cli with codex/claude/droid preinstalled)
docker build -t omniroute:cli .

# Portable mode (recommended)
docker run -d --name omniroute -p 20128:20128 --env-file ./.env -v omniroute-data:/app/data omniroute:cli

Для режима интеграции с хостом с двоичными файлами CLI см. раздел Docker в основной документации.

Переменные среды

Переменная По умолчанию Описание
JWT_SECRET omniroute-default-secret-change-me Секрет подписания JWT (изменение в производстве)
INITIAL_PASSWORD 123456 Первый пароль для входа
DATA_DIR ~/.omniroute Каталог данных (база данных, использование, журналы)
PORT структура по умолчанию Сервисный порт (20128 в примерах)
HOSTNAME структура по умолчанию Привязать хост (по умолчанию в Docker используется 0.0.0.0)
NODE_ENV по умолчанию во время выполнения Установите production для развертывания
BASE_URL http://localhost:20128 Внутренний базовый URL-адрес на стороне сервера
CLOUD_URL https://omniroute.dev Базовый URL-адрес конечной точки облачной синхронизации
API_KEY_SECRET endpoint-proxy-api-key-secret Секрет HMAC для сгенерированных ключей API
REQUIRE_API_KEY false Принудительно использовать ключ API носителя на /v1/*
ENABLE_REQUEST_LOGS false Включает журналы запросов/ответов
AUTH_COOKIE_SECURE false Принудительно использовать файл cookie аутентификации Secure (за обратным прокси-сервером HTTPS)

Полную ссылку на переменную среды см. в README.


📊 Доступные модели

Просмотреть все доступные модели

Код Клауда (cc/) — Pro/Max: cc/claude-opus-4-6, cc/claude-sonnet-4-5-20250929, cc/claude-haiku-4-5-20251001

Кодекс (cx/) — Plus/Pro: cx/gpt-5.2-codex, cx/gpt-5.1-codex-max

Gemini CLI (gc/) — БЕСПЛАТНО: gc/gemini-3-flash-preview, gc/gemini-2.5-pro

Второй пилот GitHub (gh/): gh/gpt-5, gh/claude-4.5-sonnet

GLM (glm/) — 0,6 долларов США/1 миллион долларов США: glm/glm-4.7

MiniMax (minimax/) — 0,2 доллара США/1 миллион долларов: minimax/MiniMax-M2.1

iFlow (if/) — БЕСПЛАТНО: if/kimi-k2-thinking, if/qwen3-coder-plus, if/deepseek-r1

Квен (qw/) — БЕСПЛАТНО: qw/qwen3-coder-plus, qw/qwen3-coder-flash

Киро (kr/) — БЕСПЛАТНО: kr/claude-sonnet-4.5, kr/claude-haiku-4.5

DeepSeek (ds/): ds/deepseek-chat, ds/deepseek-reasoner

Грок (groq/): groq/llama-3.3-70b-versatile, groq/llama-4-maverick-17b-128e-instruct

xAI (xai/): xai/grok-4, xai/grok-4-0709-fast-reasoning, xai/grok-code-mini

Мистраль (mistral/): mistral/mistral-large-2501, mistral/codestral-2501

Недоумение (pplx/): pplx/sonar-pro, pplx/sonar

Вместе ИИ (together/): together/meta-llama/Llama-3.3-70B-Instruct-Turbo

ИИ фейерверков (fireworks/): fireworks/accounts/fireworks/models/deepseek-v3p1

Церебра (cerebras/): cerebras/llama-3.3-70b

Согласовано (cohere/): cohere/command-r-plus-08-2024

NVIDIA NIM (nvidia/): nvidia/nvidia/llama-3.3-70b-instruct


🧩 Расширенные функции

Пользовательские модели

Добавьте любой идентификатор модели к любому поставщику, не дожидаясь обновления приложения:

# Via API
curl -X POST http://localhost:20128/api/provider-models \
  -H "Content-Type: application/json" \
  -d '{"provider": "openai", "modelId": "gpt-4.5-preview", "modelName": "GPT-4.5 Preview"}'

# List: curl http://localhost:20128/api/provider-models?provider=openai
# Remove: curl -X DELETE "http://localhost:20128/api/provider-models?provider=openai&model=gpt-4.5-preview"

Или используйте панель управления: Поставщики → [Поставщик] → Пользовательские модели.

Маршруты выделенного провайдера

Направляйте запросы непосредственно к конкретному поставщику с проверкой модели:

POST http://localhost:20128/v1/providers/openai/chat/completions
POST http://localhost:20128/v1/providers/openai/embeddings
POST http://localhost:20128/v1/providers/fireworks/images/generations

Префикс провайдера добавляется автоматически, если он отсутствует. Несовпадающие модели возвращают 400.

Конфигурация сетевого прокси

# Set global proxy
curl -X PUT http://localhost:20128/api/settings/proxy \
  -d '{"global": {"type":"http","host":"proxy.example.com","port":"8080"}}'

# Per-provider proxy
curl -X PUT http://localhost:20128/api/settings/proxy \
  -d '{"providers": {"openai": {"type":"socks5","host":"proxy.example.com","port":"1080"}}}'

# Test proxy
curl -X POST http://localhost:20128/api/settings/proxy/test \
  -d '{"proxy":{"type":"socks5","host":"proxy.example.com","port":"1080"}}'

Приоритет: Зависит от ключа → Зависит от комбинации → Зависит от поставщика → Глобальный → Среда.

API каталога моделей

curl http://localhost:20128/api/models/catalog

Возвращает модели, сгруппированные по поставщикам с типами (chat, embedding, image).

Облачная синхронизация

  • Синхронизация поставщиков, комбинаций и настроек между устройствами.
  • Автоматическая фоновая синхронизация с таймаутом + отказоустойчивость
  • Предпочитайте серверную часть BASE_URL/CLOUD_URL в рабочей среде.

LLM Gateway Intelligence (этап 9)

  • Семантический кеш — автоматически кэширует непоточные ответы с температурой = 0 (обход с помощью X-OmniRoute-No-Cache: true)
  • Идемпотентность запросов — дедупликация запросов в течение 5 секунд через заголовок Idempotency-Key или X-Request-Id.
  • Отслеживание прогресса — включите события SSE event: progress через заголовок X-OmniRoute-Progress: true.

Игровая площадка переводчика

Доступ через Личный кабинет → Переводчик. Отладка и визуализация того, как OmniRoute преобразует запросы API между поставщиками.

Режим Цель
Детская площадка Выберите исходный/целевой формат, вставьте запрос и мгновенно просмотрите переведенный результат
Тестер чата Отправляйте сообщения в чате через прокси и проверяйте полный цикл запросов/ответов
Испытательный стенд Запустите пакетные тесты для нескольких комбинаций форматов, чтобы проверить правильность перевода
Живой монитор Наблюдайте за переводами в реальном времени, пока запросы проходят через прокси

Случаи использования:

  • Отладка причины сбоя конкретной комбинации клиента/провайдера.
  • Убедитесь, что теги мышления, вызовы инструментов и системные подсказки переводятся правильно.
  • Сравните различия форматов между форматами API OpenAI, Claude, Gemini и Responses.

Стратегии маршрутизации

Настройте через Панель управления → Настройки → Маршрутизация.

Стратегия Описание
Сначала заполните Использует учетные записи в порядке приоритета — основная учетная запись обрабатывает все запросы, пока они не станут недоступны
Круговая система Циклически перебирает все учетные записи с настраиваемым фиксированным лимитом (по умолчанию: 3 вызова на учетную запись)
P2C (Сила двух вариантов) Выбирает 2 случайных аккаунта и направляется к более здоровому — балансирует нагрузку с осознанием здоровья
Случайный Случайным образом выбирает учетную запись для каждого запроса, используя перемешивание Фишера-Йейтса
Наименее используемый Маршруты к аккаунту с самой старой меткой времени lastUsedAt, трафик распределяется равномерно
Оптимизирована стоимость Маршруты к учетной записи с наименьшим значением приоритета, оптимизация для поставщиков с наименьшими затратами

Псевдонимы модели с подстановочными знаками

Создайте шаблоны подстановочных знаков для переназначения имен моделей:

Pattern: claude-sonnet-*     →  Target: cc/claude-sonnet-4-5-20250929
Pattern: gpt-*               →  Target: gh/gpt-5.1-codex

Подстановочные знаки поддерживают * (любые символы) и ? (один символ).

Резервные цепочки

Определите глобальные резервные цепочки, которые применяются ко всем запросам:

Chain: production-fallback
  1. cc/claude-opus-4-6
  2. gh/gpt-5.1-codex
  3. glm/glm-4.7

Устойчивость и автоматические выключатели

Настройте через Панель управления → Настройки → Устойчивость.

OmniRoute реализует устойчивость на уровне поставщика с помощью четырех компонентов:

  1. Профили поставщиков — конфигурация каждого поставщика для:

    • Порог отказа (сколько отказов до открытия)
    • Продолжительность перезарядки
    • Чувствительность определения ограничения скорости
    • Параметры экспоненциальной отсрочки
  2. Редактируемые ограничения скорости — настройки по умолчанию на уровне системы, которые можно настроить на панели управления:

    • Запросов в минуту (RPM) — максимальное количество запросов в минуту на аккаунт.
    • Min Time Between Requests — Минимальный промежуток в миллисекундах между запросами.
    • Максимальное количество одновременных запросов — максимальное количество одновременных запросов на одну учетную запись. – Нажмите Изменить, чтобы изменить, затем Сохранить или Отменить. Значения сохраняются через API устойчивости.
  3. Прерыватель цепи — отслеживает сбои каждого провайдера и автоматически размыкает цепь при достижении порогового значения:

    • ЗАКРЫТО (Исправно) — запросы выполняются нормально.
    • OPEN — Провайдер временно заблокирован после повторных сбоев.
    • HALF_OPEN — Проверка восстановления провайдера
  4. Политики и заблокированные идентификаторы — отображает состояние автоматического выключателя и заблокированные идентификаторы с возможностью принудительной разблокировки.

  5. Автоматическое определение ограничения скорости — отслеживает заголовки 429 и Retry-After, чтобы заранее избежать превышения ограничений скорости провайдера.

Совет для профессионалов. Используйте кнопку Сбросить все, чтобы сбросить все автоматические выключатели и время восстановления, когда поставщик услуг восстанавливается после сбоя.


Экспорт/импорт базы данных

Управляйте резервными копиями базы данных в Панель управления → Настройки → Система и хранилище.

Действие Описание
Экспорт базы данных Загружает текущую базу данных SQLite в виде файла .sqlite
Экспортировать все (.tar.gz) Загружает полный архив резервных копий, включая: базу данных, настройки, комбинации, подключения к провайдерам (без учетных данных), метаданные ключей API
Импорт базы данных Загрузите файл .sqlite, чтобы заменить текущую базу данных. Резервная копия перед импортом создается автоматически
# API: Export database
curl -o backup.sqlite http://localhost:20128/api/db-backups/export

# API: Export all (full archive)
curl -o backup.tar.gz http://localhost:20128/api/db-backups/exportAll

# API: Import database
curl -X POST http://localhost:20128/api/db-backups/import \
  -F "file=@backup.sqlite"

Проверка импорта. Импортируемый файл проверяется на целостность (проверка прагмы SQLite), необходимые таблицы (provider_connections, provider_nodes, combos, api_keys) и размер (максимум 100 МБ).

Примеры использования:

  • Миграция OmniRoute между компьютерами
  • Создание внешних резервных копий для аварийного восстановления.
  • Делитесь конфигурациями между членами команды (экспортировать все → поделиться архивом)

Панель настроек

Страница настроек разделена на 5 вкладок для удобной навигации:

Вкладка Содержание
Безопасность Настройки логина/пароля, контроль доступа по IP, аутентификация API для /models и блокировка провайдера
Маршрутизация Глобальная стратегия маршрутизации (6 вариантов), псевдонимы моделей с подстановочными знаками, резервные цепочки, комбинированные значения по умолчанию
Устойчивость Профили провайдеров, редактируемые ограничения скорости, статус автоматического выключателя, политики и заблокированные идентификаторы
ИИ Обдумывание конфигурации бюджета, глобальная системная инъекция подсказок, статистика кэша подсказок
Расширенный Глобальная конфигурация прокси (HTTP/SOCKS5)

Управление затратами и бюджетом

Доступ через Личный кабинет → Расходы.

Вкладка Цель
Бюджет Установите лимиты расходов на ключ API с ежедневными/еженедельными/месячными бюджетами и отслеживанием в реальном времени
Цены Просмотр и редактирование записей цен модели — стоимость за 1 тыс. токенов ввода/вывода на одного поставщика
# API: Set a budget
curl -X POST http://localhost:20128/api/usage/budget \
  -H "Content-Type: application/json" \
  -d '{"keyId": "key-123", "limit": 50.00, "period": "monthly"}'

# API: Get current budget status
curl http://localhost:20128/api/usage/budget

Отслеживание затрат. Каждый запрос регистрирует использование токенов и рассчитывает стоимость с использованием таблицы цен. Просмотрите разбивку в Панель управления → Использование по поставщикам, моделям и ключам API.


Аудио транскрипция

OmniRoute поддерживает транскрипцию звука через конечную точку, совместимую с OpenAI:

POST /v1/audio/transcriptions
Authorization: Bearer your-api-key
Content-Type: multipart/form-data

# Example with curl
curl -X POST http://localhost:20128/v1/audio/transcriptions \
  -H "Authorization: Bearer your-api-key" \
  -F "file=@audio.mp3" \
  -F "model=deepgram/nova-3"

Доступные поставщики: Deepgram (deepgram/), AssemblyAI (assemblyai/).

Поддерживаемые аудиоформаты: mp3, wav, m4a, flac, ogg, webm.


Стратегии балансировки комбо

Настройте балансировку для каждой комбинации в Панель управления → Комбинации → Создать/Редактировать → Стратегия.

Стратегия Описание
Круговой Последовательное переключение моделей
Приоритет Всегда пробует первую модель; возвращается только в случае ошибки
Случайный Выбирает случайную модель из комбинации для каждого запроса
Взвешенный Маршруты пропорциональны на основе назначенных весов для каждой модели
Наименее используемый Маршруты к модели с наименьшим количеством недавних запросов (использует комбинированные метрики)
Оптимизированная стоимость Маршруты к самой дешевой доступной модели (используется таблица цен)

Глобальные настройки комбо по умолчанию можно установить в Панель управления → Настройки → Маршрутизация → Параметры комбо по умолчанию.


Панель управления здоровьем

Доступ через Панель управления → Здоровье. Обзор состояния системы в реальном времени с 6 картами:

Карта Что это показывает
Состояние системы Время работы, версия, использование памяти, каталог данных
Здоровье поставщика услуг Состояние автоматического выключателя каждого поставщика (Закрыто/Открыто/Полуоткрыто)
Ограничения ставок Время восстановления активного лимита скорости на аккаунт с оставшимся временем
Активные блокировки Провайдеры временно заблокированы политикой блокировки
Кэш подписей Статистика кэша дедупликации (активные ключи, частота попаданий)
Телеметрия с задержкой Агрегация задержек p50/p95/p99 для каждого провайдера

Совет для профессионалов. Страница «Здоровье» автоматически обновляется каждые 10 секунд. Используйте карту автоматического выключателя, чтобы определить, у каких поставщиков возникли проблемы.