Skip to content

Latest commit

 

History

History
698 lines (486 loc) · 39.9 KB

File metadata and controls

698 lines (486 loc) · 39.9 KB

Керівництво користувача

🌐 Languages: 🇺🇸 English | 🇧🇷 Português (Brasil) | 🇪🇸 Español | 🇫🇷 Français | 🇮🇹 Italiano | 🇷🇺 Русский | 🇨🇳 中文 (简体) | 🇩🇪 Deutsch | 🇮🇳 हिन्दी | 🇹🇭 ไทย | 🇺🇦 Українська | 🇸🇦 العربية | 🇯🇵 日本語 | 🇻🇳 Tiếng Việt | 🇧🇬 Български | 🇩🇰 Dansk | 🇫🇮 Suomi | 🇮🇱 עברית | 🇭🇺 Magyar | 🇮🇩 Bahasa Indonesia | 🇰🇷 한국어 | 🇲🇾 Bahasa Melayu | 🇳🇱 Nederlands | 🇳🇴 Norsk | 🇵🇹 Português (Portugal) | 🇷🇴 Română | 🇵🇱 Polski | 🇸🇰 Slovenčina | 🇸🇪 Svenska | 🇵🇭 Filipino

Повний посібник із налаштування постачальників, створення комбінацій, інтеграції інструментів CLI та розгортання OmniRoute.


Зміст


💰 Короткий огляд цін

Рівень Постачальник Вартість Скидання квоти Найкраще для
💳 ПІДПИСКА Клод Код (Pro) 20 доларів США на місяць 5 годин + щотижня Вже підписані
Codex (Plus/Pro) $20-200/міс 5 годин + щотижня Користувачі OpenAI
Gemini CLI БЕЗКОШТОВНО 180 тис./місяць + 1 тис./день всі!
Копілот GitHub $10-19/міс Щомісяця Користувачі GitHub
🔑 КЛЮЧ API DeepSeek Оплата за використання Жодного Дешеві міркування
Groq Оплата за використання Жодного Надшвидкий висновок
xAI (Грок) Оплата за використання Жодного Грок 4 міркування
Містраль Оплата за використання Жодного Моделі, розміщені в ЄС
Розгубленість Оплата за використання Жодного Search-augmented
Разом AI Оплата за використання Жодного Моделі з відкритим кодом
Феєрверк AI Оплата за використання Жодного Швидкі зображення FLUX
Головний мозок Оплата за використання Жодного Швидкість вафельної шкали
Cohere Оплата за використання Жодного Команда R+ RAG
NVIDIA NIM Оплата за використання Жодного Моделі підприємства
💰 ДЕШЕВО GLM-4.7 $0,6/1 млн Щодня о 10 ранку Резервне копіювання бюджету
MiniMax M2.1 $0,2/1 млн 5-годинний роликовий Найдешевший варіант
Кімі К2 9 $/міс квартира 10 млн токенів/міс Передбачувана вартість
🆓 БЕЗКОШТОВНО iFlow $0 Необмежений 8 моделей безкоштовно
Квен $0 Необмежений 3 моделі безкоштовно
Кіро $0 Необмежений Клод безкоштовно

💡 Порада професіонала: Почніть із Gemini CLI (180 тис. безкоштовно/місяць) + iFlow (необмежено безкоштовно) = 0 доларів США!


🎯 Випадки використання

Випадок 1: «У мене є підписка на Claude Pro»

Проблема: Квота закінчується невикористаною, обмеження швидкості під час інтенсивного кодування

Combo: "maximize-claude"
  1. cc/claude-opus-4-6        (use subscription fully)
  2. glm/glm-4.7               (cheap backup when quota out)
  3. if/kimi-k2-thinking       (free emergency fallback)

Monthly cost: $20 (subscription) + ~$5 (backup) = $25 total
vs. $20 + hitting limits = frustration

Випадок 2: "Я хочу нульову вартість"

Проблема: не можу дозволити собі підписку, потрібне надійне кодування ШІ

Combo: "free-forever"
  1. gc/gemini-3-flash         (180K free/month)
  2. if/kimi-k2-thinking       (unlimited free)
  3. qw/qwen3-coder-plus       (unlimited free)

Monthly cost: $0
Quality: Production-ready models

Випадок 3: «Мені потрібне кодування 24/7, без перерв»

Проблема: Дедлайни, не можу дозволити собі простою

Combo: "always-on"
  1. cc/claude-opus-4-6        (best quality)
  2. cx/gpt-5.2-codex          (second subscription)
  3. glm/glm-4.7               (cheap, resets daily)
  4. minimax/MiniMax-M2.1      (cheapest, 5h reset)
  5. if/kimi-k2-thinking       (free unlimited)

Result: 5 layers of fallback = zero downtime
Monthly cost: $20-200 (subscriptions) + $10-20 (backup)

Випадок 4: «Я хочу БЕЗКОШТОВНОГО ШІ в OpenClaw»

Проблема: потрібен помічник штучного інтелекту в програмах для обміну повідомленнями, повністю безкоштовний

Combo: "openclaw-free"
  1. if/glm-4.7                (unlimited free)
  2. if/minimax-m2.1           (unlimited free)
  3. if/kimi-k2-thinking       (unlimited free)

Monthly cost: $0
Access via: WhatsApp, Telegram, Slack, Discord, iMessage, Signal...

📖 Налаштування постачальника

🔐 Постачальники підписки

Claude Code (Pro/Max)

Dashboard → Providers → Connect Claude Code
→ OAuth login → Auto token refresh
→ 5-hour + weekly quota tracking

Models:
  cc/claude-opus-4-6
  cc/claude-sonnet-4-5-20250929
  cc/claude-haiku-4-5-20251001

Професійна порада: використовуйте Opus для складних завдань, Sonnet для швидкості. OmniRoute відстежує квоту на модель!

OpenAI Codex (Plus/Pro)

Dashboard → Providers → Connect Codex
→ OAuth login (port 1455)
→ 5-hour + weekly reset

Models:
  cx/gpt-5.2-codex
  cx/gpt-5.1-codex-max

Gemini CLI (БЕЗКОШТОВНО 180K/місяць!)

Dashboard → Providers → Connect Gemini CLI
→ Google OAuth
→ 180K completions/month + 1K/day

Models:
  gc/gemini-3-flash-preview
  gc/gemini-2.5-pro

Найкраще: Величезний безкоштовний рівень! Використовуйте це перед платними рівнями.

Копілот GitHub

Dashboard → Providers → Connect GitHub
→ OAuth via GitHub
→ Monthly reset (1st of month)

Models:
  gh/gpt-5
  gh/claude-4.5-sonnet
  gh/gemini-3-pro

💰 Дешеві постачальники

GLM-4.7 (щоденне скидання, $0,6/1 млн)

  1. Зареєструйтеся: Zhipu AI
  2. Отримайте ключ API від Coding Plan
  3. Інформаційна панель → Додати ключ API: Постачальник: glm, ключ API: your-key

Використання: glm/glm-4.7Порада професіонала: План кодування пропонує 3× квоту за 1/7 вартості! Скидання щодня о 10:00.

MiniMax M2.1 (5 годин скидання, $0,20/1 млн)

  1. Зареєструйтеся: MiniMax
  2. Отримати ключ API → Інформаційна панель → Додати ключ API

Використовуйте: minimax/MiniMax-M2.1Порада: Найдешевший варіант для довгого контексту (1 млн токенів)!

Kimi K2 ($9/місяць)

  1. Підпишіться: Moonshot AI
  2. Отримати ключ API → Інформаційна панель → Додати ключ API

Використання: kimi/kimi-latestПорада професіонала: Фіксовані 9 доларів США на місяць за 10 мільйонів токенів = 0,90 доларів США за 1 млн. ефективних витрат!

🆓 БЕЗКОШТОВНІ постачальники

iFlow (8 БЕЗКОШТОВНИХ моделей)

Dashboard → Connect iFlow → OAuth login → Unlimited usage

Models: if/kimi-k2-thinking, if/qwen3-coder-plus, if/glm-4.7, if/minimax-m2, if/deepseek-r1

Qwen (3 БЕЗКОШТОВНІ моделі)

Dashboard → Connect Qwen → Device code auth → Unlimited usage

Models: qw/qwen3-coder-plus, qw/qwen3-coder-flash

Кіро (Клод БЕЗКОШТОВНО)

Dashboard → Connect Kiro → AWS Builder ID or Google/GitHub → Unlimited

Models: kr/claude-sonnet-4.5, kr/claude-haiku-4.5

🎨 Комбо

Приклад 1: максимізація підписки → дешеве резервне копіювання

Dashboard → Combos → Create New

Name: premium-coding
Models:
  1. cc/claude-opus-4-6 (Subscription primary)
  2. glm/glm-4.7 (Cheap backup, $0.6/1M)
  3. minimax/MiniMax-M2.1 (Cheapest fallback, $0.20/1M)

Use in CLI: premium-coding

Приклад 2: лише безкоштовно (нульова вартість)

Name: free-combo
Models:
  1. gc/gemini-3-flash-preview (180K free/month)
  2. if/kimi-k2-thinking (unlimited)
  3. qw/qwen3-coder-plus (unlimited)

Cost: $0 forever!

🔧 Інтеграція CLI

Курсор IDE

Settings → Models → Advanced:
  OpenAI API Base URL: http://localhost:20128/v1
  OpenAI API Key: [from omniroute dashboard]
  Model: cc/claude-opus-4-6

Клод Код

Редагувати ~/.claude/config.json:

{
  "anthropic_api_base": "http://localhost:20128/v1",
  "anthropic_api_key": "your-omniroute-api-key"
}

Codex CLI

export OPENAI_BASE_URL="http://localhost:20128"
export OPENAI_API_KEY="your-omniroute-api-key"
codex "your prompt"

OpenClaw

Редагувати ~/.openclaw/openclaw.json:

{
  "agents": {
    "defaults": {
      "model": { "primary": "omniroute/if/glm-4.7" }
    }
  },
  "models": {
    "providers": {
      "omniroute": {
        "baseUrl": "http://localhost:20128/v1",
        "apiKey": "your-omniroute-api-key",
        "api": "openai-completions",
        "models": [{ "id": "if/glm-4.7", "name": "glm-4.7" }]
      }
    }
  }
}

Або скористайтеся інформаційною панеллю: Інструменти CLI → OpenClaw → Auto-config

Cline / Продовжити / RooCode

Provider: OpenAI Compatible
Base URL: http://localhost:20128/v1
API Key: [from dashboard]
Model: cc/claude-opus-4-6

🚀 Розгортання

Розгортання VPS

git clone https://github.com/diegosouzapw/OmniRoute.git
cd OmniRoute && npm install && npm run build

export JWT_SECRET="your-secure-secret-change-this"
export INITIAL_PASSWORD="your-password"
export DATA_DIR="/var/lib/omniroute"
export PORT="20128"
export HOSTNAME="0.0.0.0"
export NODE_ENV="production"
export NEXT_PUBLIC_BASE_URL="http://localhost:20128"
export API_KEY_SECRET="endpoint-proxy-api-key-secret"

npm run start
# Or: pm2 start npm --name omniroute -- start

Докер

# Build image (default = runner-cli with codex/claude/droid preinstalled)
docker build -t omniroute:cli .

# Portable mode (recommended)
docker run -d --name omniroute -p 20128:20128 --env-file ./.env -v omniroute-data:/app/data omniroute:cli

Для інтегрованого режиму з двійковими файлами CLI дивіться розділ Docker в основних документах.

Змінні середовища

Змінна За замовчуванням Опис
JWT_SECRET omniroute-default-secret-change-me Секрет підпису JWT (зміни у виробництві)
INITIAL_PASSWORD 123456 Перший пароль для входу
DATA_DIR ~/.omniroute Каталог даних (база даних, використання, журнали)
PORT рамка за замовчуванням Сервісний порт (20128 у прикладах)
HOSTNAME рамка за замовчуванням Прив’язати хост (Docker за замовчуванням 0.0.0.0)
NODE_ENV виконання за замовчуванням Установіть production для розгортання
BASE_URL http://localhost:20128 Внутрішня базова URL-адреса на стороні сервера
CLOUD_URL https://omniroute.dev Базова URL-адреса кінцевої точки хмарної синхронізації
API_KEY_SECRET endpoint-proxy-api-key-secret Секрет HMAC для згенерованих ключів API
REQUIRE_API_KEY false Примусово застосувати ключ API носія на /v1/*
ENABLE_REQUEST_LOGS false Вмикає журнали запитів/відповідей
AUTH_COOKIE_SECURE false Примусово Secure cookie автентифікації (за зворотним проксі HTTPS)

Повну довідку про змінні середовища див. у README.


📊 Доступні моделі

Переглянути всі доступні моделі

Claude Code (cc/) — Pro/Max: cc/claude-opus-4-6, cc/claude-sonnet-4-5-20250929, cc/claude-haiku-4-5-20251001

Codex (cx/) — Plus/Pro: cx/gpt-5.2-codex, cx/gpt-5.1-codex-max

Gemini CLI (gc/) — БЕЗКОШТОВНО: gc/gemini-3-flash-preview, gc/gemini-2.5-pro

Копілот GitHub (gh/): gh/gpt-5, gh/claude-4.5-sonnet

GLM (glm/) — $0,6/1 млн.: glm/glm-4.7

MiniMax (minimax/) — $0,2/1 млн.: minimax/MiniMax-M2.1

iFlow (if/) — БЕЗКОШТОВНО: if/kimi-k2-thinking, if/qwen3-coder-plus, if/deepseek-r1

Qwen (qw/) — БЕЗКОШТОВНО: qw/qwen3-coder-plus, qw/qwen3-coder-flash

Kiro (kr/) — БЕЗКОШТОВНО: kr/claude-sonnet-4.5, kr/claude-haiku-4.5

DeepSeek (ds/): ds/deepseek-chat, ds/deepseek-reasoner

Groq (groq/): groq/llama-3.3-70b-versatile, groq/llama-4-maverick-17b-128e-instruct

xAI (xai/): xai/grok-4, xai/grok-4-0709-fast-reasoning, xai/grok-code-mini

Містраль (mistral/): mistral/mistral-large-2501, mistral/codestral-2501

Нерозуміння (pplx/): pplx/sonar-pro, pplx/sonar

Разом AI (together/): together/meta-llama/Llama-3.3-70B-Instruct-Turbo

Fireworks AI (fireworks/): fireworks/accounts/fireworks/models/deepseek-v3p1

Cerebras (cerebras/): cerebras/llama-3.3-70b

Cohere (cohere/): cohere/command-r-plus-08-2024

NVIDIA NIM (nvidia/): nvidia/nvidia/llama-3.3-70b-instruct


🧩 Розширені функції

Спеціальні моделі

Додайте будь-який ідентифікатор моделі до будь-якого постачальника, не чекаючи оновлення програми:

# Via API
curl -X POST http://localhost:20128/api/provider-models \
  -H "Content-Type: application/json" \
  -d '{"provider": "openai", "modelId": "gpt-4.5-preview", "modelName": "GPT-4.5 Preview"}'

# List: curl http://localhost:20128/api/provider-models?provider=openai
# Remove: curl -X DELETE "http://localhost:20128/api/provider-models?provider=openai&model=gpt-4.5-preview"

Або скористайтеся інформаційною панеллю: Постачальники → [Постачальник] → Спеціальні моделі.

Виділені маршрути постачальників

Направляйте запити безпосередньо до конкретного постачальника з перевіркою моделі:

POST http://localhost:20128/v1/providers/openai/chat/completions
POST http://localhost:20128/v1/providers/openai/embeddings
POST http://localhost:20128/v1/providers/fireworks/images/generations

Префікс провайдера додається автоматично, якщо його немає. Невідповідні моделі повертають 400.

Конфігурація мережевого проксі

# Set global proxy
curl -X PUT http://localhost:20128/api/settings/proxy \
  -d '{"global": {"type":"http","host":"proxy.example.com","port":"8080"}}'

# Per-provider proxy
curl -X PUT http://localhost:20128/api/settings/proxy \
  -d '{"providers": {"openai": {"type":"socks5","host":"proxy.example.com","port":"1080"}}}'

# Test proxy
curl -X POST http://localhost:20128/api/settings/proxy/test \
  -d '{"proxy":{"type":"socks5","host":"proxy.example.com","port":"1080"}}'

Пріоритет: Специфічний ключ → Специфічний комбінований → Специфічний постачальник → Глобальний → Середовище.

API каталогу моделей

curl http://localhost:20128/api/models/catalog

Повертає моделі, згруповані за постачальниками з типами (chat, embedding, image).

Хмарна синхронізація

  • Синхронізація постачальників, комбінацій і налаштувань на всіх пристроях
  • Автоматична фонова синхронізація з тайм-аутом + швидка відмова
  • Віддавайте перевагу серверним BASE_URL/CLOUD_URL у виробництві

LLM Gateway Intelligence (Phase 9)

  • Семантичний кеш — автоматично кешує непотокові відповіді, температура=0 (обхід за допомогою X-OmniRoute-No-Cache: true)
  • Request Idempotency — Дедуплікує запити протягом 5 секунд через заголовок Idempotency-Key або X-Request-Id
  • Відстеження прогресу — підключення до SSE event: progress через заголовок X-OmniRoute-Progress: true

Ігровий майданчик для перекладачів

Доступ через Інформаційна панель → Перекладач. Налагодьте та візуалізуйте, як OmniRoute перекладає запити API між постачальниками.

Режим Призначення
Дитячий майданчик Виберіть вихідний/цільовий формати, вставте запит і миттєво перегляньте перекладений результат
Тестувальник чату Надсилайте повідомлення чату через проксі та перевіряйте повний цикл запитів/відповідей
Випробувальний стенд Виконайте пакетні тести для кількох комбінацій форматів, щоб перевірити правильність перекладу
Живий монітор Переглядайте переклади в реальному часі, коли запити проходять через проксі

Приклади використання:

  • Налагодження причин невдачі певної комбінації клієнт/постачальник
  • Переконайтеся, що теги мислення, виклики інструментів і системні підказки перекладаються правильно
  • Порівняйте відмінності форматів між форматами OpenAI, Claude, Gemini та Responses API

Стратегії маршрутизації

Налаштувати через Інформаційна панель → Налаштування → Маршрутизація.

Стратегія Опис
Спочатку заповніть Використовує облікові записи в пріоритетному порядку — основний обліковий запис обробляє всі запити, поки не стане доступним
Кругова система Переглядає всі облікові записи з настроюваним лімітом (за замовчуванням: 3 виклики на обліковий запис)
P2C (Power of Two Choices) Вибирає 2 випадкові облікові записи та направляє до більш здорового — балансує навантаження з усвідомленням здоров’я
Випадкове Випадково вибирає обліковий запис для кожного запиту за допомогою перемішування Фішера-Єйтса
Найменш використовуваний Маршрути до облікового запису з найстарішою міткою часу lastUsedAt, рівномірно розподіляючи трафік
Оптимізація вартості Маршрути до облікового запису з найнижчим значенням пріоритету, оптимізуючи для найнижчих постачальників

Псевдоніми моделі підстановки

Створіть шаблони символів підстановки, щоб змінити назви моделей:

Pattern: claude-sonnet-*     →  Target: cc/claude-sonnet-4-5-20250929
Pattern: gpt-*               →  Target: gh/gpt-5.1-codex

Символи підстановки підтримують * (будь-які символи) і ? (один символ).

Резервні ланцюги

Визначте глобальні резервні ланцюжки, які застосовуються до всіх запитів:

Chain: production-fallback
  1. cc/claude-opus-4-6
  2. gh/gpt-5.1-codex
  3. glm/glm-4.7

Стійкість і автоматичні вимикачі

Налаштуйте за допомогою Інформаційна панель → Налаштування → Стійкість.

OmniRoute реалізує стійкість на рівні постачальника за допомогою чотирьох компонентів:

  1. Профілі постачальників — конфігурація кожного постачальника для:

    • Поріг відмови (кількість відмов до відкриття)
    • Тривалість відновлення
    • Чутливість визначення межі швидкості
    • Експоненціальні параметри відставання
  2. Обмеження швидкості, які можна редагувати — параметри системного рівня, які можна налаштувати на інформаційній панелі:

    • Запитів за хвилину (RPM) — максимальна кількість запитів за хвилину на обліковий запис
    • Мінімальний час між запитами — мінімальний проміжок у мілісекундах між запитами
    • Max Concurrent Requests — максимальна кількість одночасних запитів на обліковий запис
    • Натисніть Редагувати, щоб змінити, потім Зберегти або Скасувати. Значення зберігаються через API стійкості.
  3. Circuit Breaker — відстежує збої кожного постачальника та автоматично розмикає ланцюг, коли досягається порогове значення:

    • ЗАКРИТО (справний) — запити надходять нормально
    • OPEN — Провайдер тимчасово заблоковано після повторних збоїв
    • HALF_OPEN — Перевірка, якщо провайдер відновився
  4. Політики та заблоковані ідентифікатори — показує статус автоматичного вимикача та заблоковані ідентифікатори з можливістю примусового розблокування.

  5. Автовизначення ліміту швидкості — відстежує заголовки 429 та Retry-After, щоб завчасно уникнути перевищення лімітів швидкості постачальника.

Порада: Використовуйте кнопку Скинути все, щоб очистити всі автоматичні вимикачі та часи відновлення, коли постачальник відновиться після збою.


Експорт/імпорт бази даних

Керуйте резервними копіями бази даних у Інформаційна панель → Налаштування → Система та сховище.

Дія Опис
Експорт бази даних Завантажує поточну базу даних SQLite як файл .sqlite
Експортувати все (.tar.gz) Завантажує повний резервний архів, включаючи: базу даних, налаштування, комбінації, з’єднання провайдера (без облікових даних), метадані ключа API
Імпорт бази даних Завантажте файл .sqlite, щоб замінити поточну базу даних. Автоматично створюється резервна копія перед імпортом
# API: Export database
curl -o backup.sqlite http://localhost:20128/api/db-backups/export

# API: Export all (full archive)
curl -o backup.tar.gz http://localhost:20128/api/db-backups/exportAll

# API: Import database
curl -X POST http://localhost:20128/api/db-backups/import \
  -F "file=@backup.sqlite"

Перевірка імпорту: Імпортований файл перевіряється на цілісність (перевірка прагми SQLite), необхідні таблиці (provider_connections, provider_nodes, combos, api_keys) і розмір (макс. 100 МБ).

Випадки використання:

  • Перенесення OmniRoute між машинами
  • Створення зовнішніх резервних копій для аварійного відновлення
  • Спільний доступ до конфігурацій між членами команди (експортувати все → надати доступ до архіву)

Інформаційна панель налаштувань

Для зручності навігації сторінка налаштувань складається з 5 вкладок:

Вкладка Зміст
Безпека Налаштування логіна/пароля, контроль IP-доступу, авторизація API для /models та блокування постачальника
Маршрутизація Глобальна стратегія маршрутизації (6 варіантів), псевдоніми моделей із підстановкою, резервні ланцюжки, комбіновані параметри за замовчуванням
Стійкість Профілі постачальників, обмеження швидкості, які можна редагувати, статус автоматичного вимикача, політики та заблоковані ідентифікатори
AI Продумана конфігурація бюджету, впровадження глобальної системної підказки, швидка статистика кешу
Розширений Глобальна конфігурація проксі (HTTP/SOCKS5)

Управління витратами та бюджетом

Доступ через Інформаційна панель → Витрати.

Вкладка Призначення
Бюджет Встановіть ліміти витрат на ключ API за допомогою щоденних/тижневих/місячних бюджетів і відстеження в реальному часі
Ціни Перегляд і редагування записів моделі ціноутворення — вартість 1 тис. токенів вводу/виводу на постачальника
# API: Set a budget
curl -X POST http://localhost:20128/api/usage/budget \
  -H "Content-Type: application/json" \
  -d '{"keyId": "key-123", "limit": 50.00, "period": "monthly"}'

# API: Get current budget status
curl http://localhost:20128/api/usage/budget

Відстеження вартості: кожен запит реєструє використання токенів і розраховує вартість за допомогою таблиці цін. Перегляньте розбивку в Інформаційна панель → Використання за постачальником, моделлю та ключем API.


Транскрипція аудіо

OmniRoute підтримує транскрипцію аудіо через кінцеву точку, сумісну з OpenAI:

POST /v1/audio/transcriptions
Authorization: Bearer your-api-key
Content-Type: multipart/form-data

# Example with curl
curl -X POST http://localhost:20128/v1/audio/transcriptions \
  -H "Authorization: Bearer your-api-key" \
  -F "file=@audio.mp3" \
  -F "model=deepgram/nova-3"

Доступні постачальники: Deepgram (deepgram/), AssemblyAI (assemblyai/).

Підтримувані аудіоформати: mp3, wav, m4a, flac, ogg, webm.


Комбіновані стратегії балансування

Налаштуйте балансування за комбо в Інформаційна панель → Комбо → Створити/Редагувати → Стратегія.

Стратегія Опис
Кругова система Обертає моделі послідовно
Пріоритет Завжди пробує першу модель; повертається лише в разі помилки
Випадкове Вибирає випадкову модель із комбо для кожного запиту
Зважений Маршрути пропорційно на основі призначеної ваги для моделі
Найменш використовуваний Маршрути до моделі з найменшою кількістю останніх запитів (використовує комбіновані показники)
Оптимізовано за витратами Маршрути до найдешевшої доступної моделі (використовується таблиця цін)

Глобальні стандартні параметри комбінованих маршрутів можна встановити в Інформаційна панель → Налаштування → Маршрутизація → Стандартні параметри комбінованих маршрутів.


Інформаційна панель здоров'я

Доступ через Інформаційна панель → Здоров’я. Огляд стану системи в реальному часі з 6 картками:

Картка Що це показує
Стан системи Час роботи, версія, використання пам’яті, каталог даних
Здоров’я постачальника Стан автоматичного вимикача для кожного постачальника (замкнуто/розімкнуто/напіврозімкнуто)
Обмеження швидкості Обмеження активної швидкості перезарядки на обліковий запис із часом, що залишився
Активні блокування Провайдери, тимчасово заблоковані політикою блокування
Кеш підпису Статистика кешу дедуплікації (активні ключі, частота звернень)
Телеметрія затримки Агрегація затримок p50/p95/p99 для кожного провайдера

Професійна порада. Сторінка «Здоров’я» автоматично оновлюється кожні 10 секунд. Використовуйте картку автоматичного вимикача, щоб визначити, які постачальники мають проблеми.