Skip to content

Latest commit

 

History

History
698 lines (486 loc) · 31 KB

File metadata and controls

698 lines (486 loc) · 31 KB

Guide de l'utilisateur

🌐 Languages: 🇺🇸 English | 🇧🇷 Português (Brasil) | 🇪🇸 Español | 🇫🇷 Français | 🇮🇹 Italiano | 🇷🇺 Русский | 🇨🇳 中文 (简体) | 🇩🇪 Deutsch | 🇮🇳 हिन्दी | 🇹🇭 ไทย | 🇺🇦 Українська | 🇸🇦 العربية | 🇯🇵 日本語 | 🇻🇳 Tiếng Việt | 🇧🇬 Български | 🇩🇰 Dansk | 🇫🇮 Suomi | 🇮🇱 עברית | 🇭🇺 Magyar | 🇮🇩 Bahasa Indonesia | 🇰🇷 한국어 | 🇲🇾 Bahasa Melayu | 🇳🇱 Nederlands | 🇳🇴 Norsk | 🇵🇹 Português (Portugal) | 🇷🇴 Română | 🇵🇱 Polski | 🇸🇰 Slovenčina | 🇸🇪 Svenska | 🇵🇭 Filipino

Guide complet pour configurer les fournisseurs, créer des combos, intégrer des outils CLI et déployer OmniRoute.


Table des matières


💰 Aperçu des prix

Niveau Fournisseur Coût Réinitialisation des quotas Idéal pour
💳 ABONNEMENT Claude Code (Pro) 20 $/mois 5h + hebdomadaire Déjà abonné
Codex (Plus/Pro) 20-200 $/mois 5h + hebdomadaire Utilisateurs d'OpenAI
CLI Gémeaux GRATUIT 180K/mois + 1K/jour Tout le monde!
Copilote GitHub 10-19 $/mois Mensuel Utilisateurs GitHub
🔑 CLÉ API Recherche profonde Paiement à l'utilisation Aucun Raisonnement bon marché
Groq Paiement à l'utilisation Aucun Inférence ultra-rapide
xAI (Grok) Paiement à l'utilisation Aucun Raisonnement Grok 4
Mistral Paiement à l'utilisation Aucun Modèles hébergés dans l'UE
Perplexité Paiement à l'utilisation Aucun Recherche augmentée
Ensemble IA Paiement à l'utilisation Aucun Modèles open source
IA de feux d'artifice Paiement à l'utilisation Aucun Images FLUX rapides
Cérébraux Paiement à l'utilisation Aucun Vitesse à l'échelle d'une tranche
Cohérer Paiement à l'utilisation Aucun Commande R+ RAG
NIM NVIDIA Paiement à l'utilisation Aucun Modèles d'entreprise
💰 BON MARCHÉ GLM-4.7 0,6 $/1 M Tous les jours 10h Sauvegarde budgétaire
MiniMax M2.1 0,2 $/1 M 5 heures roulantes Option la moins chère
Kimi K2 9 $/mois plat 10 millions de jetons/mois Coût prévisible
🆓 GRATUIT iFlow 0 $ Illimité 8 modèles gratuits
Qwen 0 $ Illimité 3 modèles gratuits
Kiro 0 $ Illimité Claude gratuit

💡 Conseil de pro : Commencez avec Gemini CLI (180 000 gratuits/mois) + combo iFlow (gratuit et illimité) = 0 $ de coût !


🎯 Cas d'utilisation

Cas 1 : "J'ai un abonnement Claude Pro"

Problème : Le quota expire sans être utilisé, limites de débit lors d'un codage intensif

Combo: "maximize-claude"
  1. cc/claude-opus-4-6        (use subscription fully)
  2. glm/glm-4.7               (cheap backup when quota out)
  3. if/kimi-k2-thinking       (free emergency fallback)

Monthly cost: $20 (subscription) + ~$5 (backup) = $25 total
vs. $20 + hitting limits = frustration

Cas 2 : "Je veux un coût nul"

Problème : Je ne peux pas payer les abonnements, j'ai besoin d'un codage IA fiable

Combo: "free-forever"
  1. gc/gemini-3-flash         (180K free/month)
  2. if/kimi-k2-thinking       (unlimited free)
  3. qw/qwen3-coder-plus       (unlimited free)

Monthly cost: $0
Quality: Production-ready models

Cas 3 : "J'ai besoin de coder 24h/24 et 7j/7, sans interruption"

Problème : Délais, je ne peux pas me permettre de temps d'arrêt

Combo: "always-on"
  1. cc/claude-opus-4-6        (best quality)
  2. cx/gpt-5.2-codex          (second subscription)
  3. glm/glm-4.7               (cheap, resets daily)
  4. minimax/MiniMax-M2.1      (cheapest, 5h reset)
  5. if/kimi-k2-thinking       (free unlimited)

Result: 5 layers of fallback = zero downtime
Monthly cost: $20-200 (subscriptions) + $10-20 (backup)

Cas 4 : "Je veux une IA GRATUITE dans OpenClaw"

Problème : Besoin d'un assistant IA dans les applications de messagerie, entièrement gratuit

Combo: "openclaw-free"
  1. if/glm-4.7                (unlimited free)
  2. if/minimax-m2.1           (unlimited free)
  3. if/kimi-k2-thinking       (unlimited free)

Monthly cost: $0
Access via: WhatsApp, Telegram, Slack, Discord, iMessage, Signal...

📖 Configuration du fournisseur

🔐 Fournisseurs d'abonnements

Claude Code (Pro/Max)

Dashboard → Providers → Connect Claude Code
→ OAuth login → Auto token refresh
→ 5-hour + weekly quota tracking

Models:
  cc/claude-opus-4-6
  cc/claude-sonnet-4-5-20250929
  cc/claude-haiku-4-5-20251001

Conseil de pro : Utilisez Opus pour les tâches complexes, Sonnet pour la rapidité. OmniRoute suit le quota par modèle !

Codex OpenAI (Plus/Pro)

Dashboard → Providers → Connect Codex
→ OAuth login (port 1455)
→ 5-hour + weekly reset

Models:
  cx/gpt-5.2-codex
  cx/gpt-5.1-codex-max

Gemini CLI (180 000 GRATUITS/mois !)

Dashboard → Providers → Connect Gemini CLI
→ Google OAuth
→ 180K completions/month + 1K/day

Models:
  gc/gemini-3-flash-preview
  gc/gemini-2.5-pro

Meilleur rapport qualité-prix : Énorme niveau gratuit ! Utilisez-le avant les niveaux payants.

Copilote GitHub

Dashboard → Providers → Connect GitHub
→ OAuth via GitHub
→ Monthly reset (1st of month)

Models:
  gh/gpt-5
  gh/claude-4.5-sonnet
  gh/gemini-3-pro

💰 Fournisseurs bon marché

GLM-4.7 (réinitialisation quotidienne, 0,6 $/1 million)

  1. Inscrivez-vous : Zhipu AI
  2. Obtenez la clé API du plan de codage
  3. Tableau de bord → Ajouter une clé API : Fournisseur : glm, Clé API : your-key

Utilisez : glm/glm-4.7Conseil de pro : Le plan de codage offre un quota de 3 × à un coût de 1/7 ! Réinitialisation quotidienne à 10h00.

MiniMax M2.1 (réinitialisation de 5 h, 0,20 $/1 M)

  1. Inscrivez-vous : MiniMax
  2. Obtenir la clé API → Tableau de bord → Ajouter une clé API

Utilisez : minimax/MiniMax-M2.1Conseil de pro : Option la moins chère pour un contexte long (1 million de jetons) !

Kimi K2 (9$/mois fixe)

  1. Abonnez-vous : Moonshot AI
  2. Obtenir la clé API → Tableau de bord → Ajouter une clé API

Utilisez : kimi/kimi-latestConseil de pro : Fixe 9 $/mois pour 10 millions de jetons = 0,90 $/1 million de coût effectif !

🆓 Fournisseurs GRATUITS

iFlow (8 modèles GRATUITS)

Dashboard → Connect iFlow → OAuth login → Unlimited usage

Models: if/kimi-k2-thinking, if/qwen3-coder-plus, if/glm-4.7, if/minimax-m2, if/deepseek-r1

Qwen (3 modèles GRATUITS)

Dashboard → Connect Qwen → Device code auth → Unlimited usage

Models: qw/qwen3-coder-plus, qw/qwen3-coder-flash

Kiro (Claude GRATUIT)

Dashboard → Connect Kiro → AWS Builder ID or Google/GitHub → Unlimited

Models: kr/claude-sonnet-4.5, kr/claude-haiku-4.5

🎨Combinaisons

Exemple 1 : Maximiser l'abonnement → Sauvegarde bon marché

Dashboard → Combos → Create New

Name: premium-coding
Models:
  1. cc/claude-opus-4-6 (Subscription primary)
  2. glm/glm-4.7 (Cheap backup, $0.6/1M)
  3. minimax/MiniMax-M2.1 (Cheapest fallback, $0.20/1M)

Use in CLI: premium-coding

Exemple 2 : Gratuit uniquement (sans coût)

Name: free-combo
Models:
  1. gc/gemini-3-flash-preview (180K free/month)
  2. if/kimi-k2-thinking (unlimited)
  3. qw/qwen3-coder-plus (unlimited)

Cost: $0 forever!

🔧 Intégration CLI

IDE de curseur

Settings → Models → Advanced:
  OpenAI API Base URL: http://localhost:20128/v1
  OpenAI API Key: [from omniroute dashboard]
  Model: cc/claude-opus-4-6

###Claude Code

Modifier ~/.claude/config.json :

{
  "anthropic_api_base": "http://localhost:20128/v1",
  "anthropic_api_key": "your-omniroute-api-key"
}

CLI du Codex

export OPENAI_BASE_URL="http://localhost:20128"
export OPENAI_API_KEY="your-omniroute-api-key"
codex "your prompt"

OpenClaw

Modifier ~/.openclaw/openclaw.json :

{
  "agents": {
    "defaults": {
      "model": { "primary": "omniroute/if/glm-4.7" }
    }
  },
  "models": {
    "providers": {
      "omniroute": {
        "baseUrl": "http://localhost:20128/v1",
        "apiKey": "your-omniroute-api-key",
        "api": "openai-completions",
        "models": [{ "id": "if/glm-4.7", "name": "glm-4.7" }]
      }
    }
  }
}

Ou utilisez le tableau de bord : Outils CLI → OpenClaw → Configuration automatique

Cline / Continuer / RooCode

Provider: OpenAI Compatible
Base URL: http://localhost:20128/v1
API Key: [from dashboard]
Model: cc/claude-opus-4-6

🚀 Déploiement

Déploiement VPS

git clone https://github.com/diegosouzapw/OmniRoute.git
cd OmniRoute && npm install && npm run build

export JWT_SECRET="your-secure-secret-change-this"
export INITIAL_PASSWORD="your-password"
export DATA_DIR="/var/lib/omniroute"
export PORT="20128"
export HOSTNAME="0.0.0.0"
export NODE_ENV="production"
export NEXT_PUBLIC_BASE_URL="http://localhost:20128"
export API_KEY_SECRET="endpoint-proxy-api-key-secret"

npm run start
# Or: pm2 start npm --name omniroute -- start

Docker

# Build image (default = runner-cli with codex/claude/droid preinstalled)
docker build -t omniroute:cli .

# Portable mode (recommended)
docker run -d --name omniroute -p 20128:20128 --env-file ./.env -v omniroute-data:/app/data omniroute:cli

Pour le mode intégré à l'hôte avec les binaires CLI, consultez la section Docker dans la documentation principale.

Variables d'environnement

Variables Par défaut Descriptif
JWT_SECRET omniroute-default-secret-change-me Secret de signature JWT (changement de production)
INITIAL_PASSWORD 123456 Mot de passe de première connexion
DATA_DIR ~/.omniroute Répertoire de données (base de données, utilisation, journaux)
PORT cadre par défaut Port de service (20128 dans les exemples)
HOSTNAME cadre par défaut Lier l'hôte (Docker par défaut est 0.0.0.0)
NODE_ENV valeur par défaut d'exécution Définissez production pour le déploiement
BASE_URL http://localhost:20128 URL de base interne côté serveur
CLOUD_URL https://omniroute.dev URL de base du point de terminaison de synchronisation cloud
API_KEY_SECRET endpoint-proxy-api-key-secret Secret HMAC pour les clés API générées
REQUIRE_API_KEY false Appliquer la clé API Bearer sur /v1/*
ENABLE_REQUEST_LOGS false Active les journaux de requêtes/réponses
AUTH_COOKIE_SECURE false Forcer le cookie d'authentification Secure (derrière le proxy inverse HTTPS)

Pour la référence complète des variables d'environnement, consultez le README.


📊 Modèles disponibles

Voir tous les modèles disponibles

Code Claude (cc/) — Pro/Max : cc/claude-opus-4-6, cc/claude-sonnet-4-5-20250929, cc/claude-haiku-4-5-20251001

Codex (cx/) — Plus/Pro : cx/gpt-5.2-codex, cx/gpt-5.1-codex-max

Gemini CLI (gc/) — GRATUIT : gc/gemini-3-flash-preview, gc/gemini-2.5-pro

Copilote GitHub (gh/) : gh/gpt-5, gh/claude-4.5-sonnet

GLM (glm/) — 0,6 $/1 million : glm/glm-4.7

MiniMax (minimax/) — 0,2 $/1 million : minimax/MiniMax-M2.1

iFlow (if/) — GRATUIT : if/kimi-k2-thinking, if/qwen3-coder-plus, if/deepseek-r1

Qwen (qw/) — GRATUIT : qw/qwen3-coder-plus, qw/qwen3-coder-flash

Kiro (kr/) — GRATUIT : kr/claude-sonnet-4.5, kr/claude-haiku-4.5

Recherche profonde (ds/) : ds/deepseek-chat, ds/deepseek-reasoner

Groq (groq/) : groq/llama-3.3-70b-versatile, groq/llama-4-maverick-17b-128e-instruct

xAI (xai/) : xai/grok-4, xai/grok-4-0709-fast-reasoning, xai/grok-code-mini

Mistral (mistral/) : mistral/mistral-large-2501, mistral/codestral-2501

Perplexité (pplx/) : pplx/sonar-pro, pplx/sonar

Ensemble IA (together/) : together/meta-llama/Llama-3.3-70B-Instruct-Turbo

IA de feux d'artifice (fireworks/) : fireworks/accounts/fireworks/models/deepseek-v3p1

Cérébras (cerebras/) : cerebras/llama-3.3-70b

Cohérer (cohere/) : cohere/command-r-plus-08-2024

NIM NVIDIA (nvidia/) : nvidia/nvidia/llama-3.3-70b-instruct


🧩 Fonctionnalités avancées

Modèles personnalisés

Ajoutez n'importe quel ID de modèle à n'importe quel fournisseur sans attendre une mise à jour de l'application :

# Via API
curl -X POST http://localhost:20128/api/provider-models \
  -H "Content-Type: application/json" \
  -d '{"provider": "openai", "modelId": "gpt-4.5-preview", "modelName": "GPT-4.5 Preview"}'

# List: curl http://localhost:20128/api/provider-models?provider=openai
# Remove: curl -X DELETE "http://localhost:20128/api/provider-models?provider=openai&model=gpt-4.5-preview"

Ou utilisez le tableau de bord : Fournisseurs → [Fournisseur] → Modèles personnalisés.

Itinéraires de fournisseurs dédiés

Acheminez les demandes directement vers un fournisseur spécifique avec validation du modèle :

POST http://localhost:20128/v1/providers/openai/chat/completions
POST http://localhost:20128/v1/providers/openai/embeddings
POST http://localhost:20128/v1/providers/fireworks/images/generations

Le préfixe du fournisseur est ajouté automatiquement s'il est manquant. Les modèles incompatibles renvoient 400.

Configuration du proxy réseau

# Set global proxy
curl -X PUT http://localhost:20128/api/settings/proxy \
  -d '{"global": {"type":"http","host":"proxy.example.com","port":"8080"}}'

# Per-provider proxy
curl -X PUT http://localhost:20128/api/settings/proxy \
  -d '{"providers": {"openai": {"type":"socks5","host":"proxy.example.com","port":"1080"}}}'

# Test proxy
curl -X POST http://localhost:20128/api/settings/proxy/test \
  -d '{"proxy":{"type":"socks5","host":"proxy.example.com","port":"1080"}}'

Précédence : Spécifique à la clé → Spécifique au combo → Spécifique au fournisseur → Global → Environnement.

API du catalogue de modèles

curl http://localhost:20128/api/models/catalog

Renvoie les modèles regroupés par fournisseur avec des types (chat, embedding, image).

Synchronisation avec le cloud

  • Synchronisez les fournisseurs, les combos et les paramètres sur tous les appareils
  • Synchronisation automatique en arrière-plan avec délai d'attente + échec rapide
  • Préférer le côté serveur BASE_URL/CLOUD_URL en production

LLM Gateway Intelligence (Phase 9)

  • Cache sémantique — Met en cache automatiquement les réponses hors streaming, température = 0 (contourner avec X-OmniRoute-No-Cache: true)
  • Demande d'idempotence — Déduplique les requêtes dans les 5 secondes via l'en-tête Idempotency-Key ou X-Request-Id
  • Suivi des progrès – Événements SSE event: progress opt-in via l'en-tête X-OmniRoute-Progress: true

Aire de jeux des traducteurs

Accès via Tableau de bord → Traducteur. Déboguez et visualisez comment OmniRoute traduit les requêtes API entre les fournisseurs.

Mode Objectif
Aire de jeux Sélectionnez les formats source/cible, collez une requête et voyez instantanément le résultat traduit
Testeur de chat Envoyez des messages de chat en direct via le proxy et inspectez le cycle complet de demande/réponse
Banc d'essai Exécutez des tests par lots sur plusieurs combinaisons de formats pour vérifier l'exactitude de la traduction
Moniteur en direct Regardez les traductions en temps réel à mesure que les demandes transitent par le proxy

Cas d'utilisation :

  • Déboguer pourquoi une combinaison client/fournisseur spécifique échoue
  • Vérifiez que les balises de réflexion, les appels d'outils et les invites système se traduisent correctement
  • Comparez les différences de format entre les formats API OpenAI, Claude, Gemini et Responses

Stratégies de routage

Configurez via Tableau de bord → Paramètres → Routage.

Stratégie Descriptif
Remplir en premier Utilise les comptes par ordre de priorité : le compte principal gère toutes les demandes jusqu'à ce qu'il soit indisponible
Tournoi à la ronde Parcourt tous les comptes avec une limite persistante configurable (par défaut : 3 appels par compte)
P2C (Puissance de deux choix) Sélectionne 2 comptes aléatoires et oriente vers le compte le plus sain – équilibre la charge avec la conscience de la santé
Aléatoire Sélectionne au hasard un compte pour chaque demande à l'aide de Fisher-Yates shuffle
Le moins utilisé Routes vers le compte avec l'horodatage lastUsedAt le plus ancien, répartissant le trafic de manière uniforme
Coût optimisé Itinéraires vers le compte avec la valeur de priorité la plus faible, optimisation pour les fournisseurs les moins chers

Alias de modèles génériques

Créez des modèles génériques pour remapper les noms de modèles :

Pattern: claude-sonnet-*     →  Target: cc/claude-sonnet-4-5-20250929
Pattern: gpt-*               →  Target: gh/gpt-5.1-codex

Les caractères génériques prennent en charge * (n'importe quel caractère) et ? (un seul caractère).

Chaînes de secours

Définissez des chaînes de secours globales qui s'appliquent à toutes les requêtes :

Chain: production-fallback
  1. cc/claude-opus-4-6
  2. gh/gpt-5.1-codex
  3. glm/glm-4.7

Résilience et disjoncteurs

Configurez via Tableau de bord → Paramètres → Résilience.

OmniRoute met en œuvre la résilience au niveau du fournisseur avec quatre composants :

  1. Profils de fournisseur — Configuration par fournisseur pour :

    • Seuil de défaillance (combien de défaillances avant ouverture)
    • Durée du temps de recharge
    • Sensibilité de détection de limite de débit
    • Paramètres d'intervalle exponentiel
  2. Limites de débit modifiables — Paramètres par défaut au niveau du système configurables dans le tableau de bord :

    • Requêtes par minute (RPM) — Nombre maximal de requêtes par minute et par compte
    • Min Time Between Requests — Écart minimum en millisecondes entre les requêtes
    • Max Concurrent Requests — Nombre maximal de requêtes simultanées par compte
    • Cliquez sur Modifier pour modifier, puis sur Enregistrer ou Annuler. Les valeurs persistent via l'API de résilience.
  3. Disjoncteur — Suit les pannes par fournisseur et ouvre automatiquement le circuit lorsqu'un seuil est atteint :

    • FERMÉ (sain) — Les demandes circulent normalement
    • OPEN — Le fournisseur est temporairement bloqué après des échecs répétés
    • HALF_OPEN — Test si le fournisseur a récupéré
  4. Politiques et identifiants verrouillés — Affiche l'état du disjoncteur et les identifiants verrouillés avec capacité de déverrouillage forcé.

  5. Détection automatique des limites de débit — Surveille les en-têtes 429 et Retry-After pour éviter de manière proactive d'atteindre les limites de débit du fournisseur.

Conseil de pro : Utilisez le bouton Réinitialiser tout pour effacer tous les disjoncteurs et les temps de recharge lorsqu'un fournisseur se remet d'une panne.


Exportation/Importation de base de données

Gérez les sauvegardes de base de données dans Tableau de bord → Paramètres → Système et stockage.

Actions Descriptif
Exporter la base de données Télécharge la base de données SQLite actuelle sous forme de fichier .sqlite
Exporter tout (.tar.gz) Télécharge une archive de sauvegarde complète comprenant : base de données, paramètres, combos, connexions du fournisseur (pas d'informations d'identification), métadonnées de la clé API
Importer la base de données Téléchargez un fichier .sqlite pour remplacer la base de données actuelle. Une sauvegarde de pré-importation est automatiquement créée
# API: Export database
curl -o backup.sqlite http://localhost:20128/api/db-backups/export

# API: Export all (full archive)
curl -o backup.tar.gz http://localhost:20128/api/db-backups/exportAll

# API: Import database
curl -X POST http://localhost:20128/api/db-backups/import \
  -F "file=@backup.sqlite"

Validation de l'importation : Le fichier importé est validé pour son intégrité (vérification pragma SQLite), les tables requises (provider_connections, provider_nodes, combos, api_keys) et sa taille (max 100 Mo).

Cas d'utilisation :

  • Migrer OmniRoute entre machines
  • Créer des sauvegardes externes pour la reprise après sinistre
  • Partager les configurations entre les membres de l'équipe (exporter tout → partager l'archive)

Tableau de bord des paramètres

La page des paramètres est organisée en 5 onglets pour une navigation facile :

Onglet Contenu
Sécurité Paramètres de connexion/mot de passe, contrôle d'accès IP, authentification API pour /models et blocage du fournisseur
Routage Stratégie de routage globale (6 options), alias de modèle générique, chaînes de secours, valeurs par défaut combinées
Résilience Profils de fournisseurs, limites de débit modifiables, état du disjoncteur, politiques et identifiants verrouillés
IA Configuration du budget de réflexion, injection d'invite du système global, statistiques de cache d'invite
Avancé Configuration globale du proxy (HTTP/SOCKS5)

Gestion des coûts et du budget

Accès via Tableau de bord → Coûts.

Onglet Objectif
Budget Fixez des limites de dépenses par clé API avec des budgets quotidiens/hebdomadaires/mensuels et un suivi en temps réel
Tarif Afficher et modifier les entrées de tarification du modèle — coût par 1 000 jetons d'entrée/sortie par fournisseur
# API: Set a budget
curl -X POST http://localhost:20128/api/usage/budget \
  -H "Content-Type: application/json" \
  -d '{"keyId": "key-123", "limit": 50.00, "period": "monthly"}'

# API: Get current budget status
curl http://localhost:20128/api/usage/budget

Suivi des coûts : Chaque demande enregistre l'utilisation du jeton et calcule le coût à l'aide du tableau de tarification. Affichez les répartitions dans Tableau de bord → Utilisation par fournisseur, modèle et clé API.


Transcription audio

OmniRoute prend en charge la transcription audio via le point de terminaison compatible OpenAI :

POST /v1/audio/transcriptions
Authorization: Bearer your-api-key
Content-Type: multipart/form-data

# Example with curl
curl -X POST http://localhost:20128/v1/audio/transcriptions \
  -H "Authorization: Bearer your-api-key" \
  -F "file=@audio.mp3" \
  -F "model=deepgram/nova-3"

Fournisseurs disponibles : Deepgram (deepgram/), AssemblyAI (assemblyai/).

Formats audio pris en charge : mp3, wav, m4a, flac, ogg, webm.


Stratégies d'équilibrage des combos

Configurez l'équilibrage par combo dans Tableau de bord → Combos → Créer/Modifier → Stratégie.

Stratégie Descriptif
Robin à la ronde Tourne à travers les modèles de manière séquentielle
Priorité Essaie toujours le premier modèle ; se rabat uniquement sur l'erreur
Aléatoire Sélectionne un modèle aléatoire dans le combo pour chaque demande
Pondéré Itinéraires proportionnellement basés sur les poids attribués par modèle
Les moins utilisés Itinéraires vers le modèle avec le moins de requêtes récentes (utilise des métriques combinées)
Coût optimisé Itinéraires vers le modèle disponible le moins cher (utilise le tableau de prix)

Les valeurs par défaut des combos globaux peuvent être définies dans Tableau de bord → Paramètres → Routage → Paramètres par défaut des combos.


Tableau de bord de santé

Accès via Tableau de bord → Santé. Aperçu de l'état du système en temps réel avec 6 cartes :

Carte Ce que cela montre
État du système Disponibilité, version, utilisation de la mémoire, répertoire de données
Santé du fournisseur État du disjoncteur par fournisseur (Fermé/Ouvert/Semi-ouvert)
Limites de taux Temps de recharge de la limite de débit actif par compte avec temps restant
Verrouillages actifs Fournisseurs temporairement bloqués par la politique de verrouillage
Cache de signatures Statistiques du cache de déduplication (clés actives, taux de réussite)
Télémétrie de latence Agrégation de latence p50/p95/p99 par fournisseur

Conseil de pro : La page Santé s'actualise automatiquement toutes les 10 secondes. Utilisez la carte disjoncteur pour identifier les fournisseurs qui rencontrent des problèmes.