Guide de l'utilisateur

Guide complet pour configurer les fournisseurs, créer des combos, intégrer des outils CLI et déployer OmniRoute.

Table des matières

Pricing at a Glance
Use Cases
Provider Setup
CLI Integration
Deployment
Available Models
Advanced Features

💰 Aperçu des prix

Niveau	Fournisseur	Coût	Réinitialisation des quotas	Idéal pour
💳 ABONNEMENT	Claude Code (Pro)	20 $/mois	5h + hebdomadaire	Déjà abonné
	Codex (Plus/Pro)	20-200 $/mois	5h + hebdomadaire	Utilisateurs d'OpenAI
	CLI Gémeaux	GRATUIT	180K/mois + 1K/jour	Tout le monde!
	Copilote GitHub	10-19 $/mois	Mensuel	Utilisateurs GitHub
🔑 CLÉ API	Recherche profonde	Paiement à l'utilisation	Aucun	Raisonnement bon marché
	Groq	Paiement à l'utilisation	Aucun	Inférence ultra-rapide
	xAI (Grok)	Paiement à l'utilisation	Aucun	Raisonnement Grok 4
	Mistral	Paiement à l'utilisation	Aucun	Modèles hébergés dans l'UE
	Perplexité	Paiement à l'utilisation	Aucun	Recherche augmentée
	Ensemble IA	Paiement à l'utilisation	Aucun	Modèles open source
	IA de feux d'artifice	Paiement à l'utilisation	Aucun	Images FLUX rapides
	Cérébraux	Paiement à l'utilisation	Aucun	Vitesse à l'échelle d'une tranche
	Cohérer	Paiement à l'utilisation	Aucun	Commande R+ RAG
	NIM NVIDIA	Paiement à l'utilisation	Aucun	Modèles d'entreprise
💰 BON MARCHÉ	GLM-4.7	0,6 $/1 M	Tous les jours 10h	Sauvegarde budgétaire
	MiniMax M2.1	0,2 $/1 M	5 heures roulantes	Option la moins chère
	Kimi K2	9 $/mois plat	10 millions de jetons/mois	Coût prévisible
🆓 GRATUIT	iFlow	0 $	Illimité	8 modèles gratuits
	Qwen	0 $	Illimité	3 modèles gratuits
	Kiro	0 $	Illimité	Claude gratuit

💡 Conseil de pro : Commencez avec Gemini CLI (180 000 gratuits/mois) + combo iFlow (gratuit et illimité) = 0 $ de coût !

🎯 Cas d'utilisation

Cas 1 : "J'ai un abonnement Claude Pro"

Problème : Le quota expire sans être utilisé, limites de débit lors d'un codage intensif

Combo: "maximize-claude"
  1. cc/claude-opus-4-6        (use subscription fully)
  2. glm/glm-4.7               (cheap backup when quota out)
  3. if/kimi-k2-thinking       (free emergency fallback)

Monthly cost: $20 (subscription) + ~$5 (backup) = $25 total
vs. $20 + hitting limits = frustration

Cas 2 : "Je veux un coût nul"

Problème : Je ne peux pas payer les abonnements, j'ai besoin d'un codage IA fiable

Combo: "free-forever"
  1. gc/gemini-3-flash         (180K free/month)
  2. if/kimi-k2-thinking       (unlimited free)
  3. qw/qwen3-coder-plus       (unlimited free)

Monthly cost: $0
Quality: Production-ready models

Cas 3 : "J'ai besoin de coder 24h/24 et 7j/7, sans interruption"

Problème : Délais, je ne peux pas me permettre de temps d'arrêt

Combo: "always-on"
  1. cc/claude-opus-4-6        (best quality)
  2. cx/gpt-5.2-codex          (second subscription)
  3. glm/glm-4.7               (cheap, resets daily)
  4. minimax/MiniMax-M2.1      (cheapest, 5h reset)
  5. if/kimi-k2-thinking       (free unlimited)

Result: 5 layers of fallback = zero downtime
Monthly cost: $20-200 (subscriptions) + $10-20 (backup)

Cas 4 : "Je veux une IA GRATUITE dans OpenClaw"

Problème : Besoin d'un assistant IA dans les applications de messagerie, entièrement gratuit

Combo: "openclaw-free"
  1. if/glm-4.7                (unlimited free)
  2. if/minimax-m2.1           (unlimited free)
  3. if/kimi-k2-thinking       (unlimited free)

Monthly cost: $0
Access via: WhatsApp, Telegram, Slack, Discord, iMessage, Signal...

📖 Configuration du fournisseur

🔐 Fournisseurs d'abonnements

Claude Code (Pro/Max)

Dashboard → Providers → Connect Claude Code
→ OAuth login → Auto token refresh
→ 5-hour + weekly quota tracking

Models:
  cc/claude-opus-4-6
  cc/claude-sonnet-4-5-20250929
  cc/claude-haiku-4-5-20251001

Conseil de pro : Utilisez Opus pour les tâches complexes, Sonnet pour la rapidité. OmniRoute suit le quota par modèle !

Codex OpenAI (Plus/Pro)

Dashboard → Providers → Connect Codex
→ OAuth login (port 1455)
→ 5-hour + weekly reset

Models:
  cx/gpt-5.2-codex
  cx/gpt-5.1-codex-max

Gemini CLI (180 000 GRATUITS/mois !)

Dashboard → Providers → Connect Gemini CLI
→ Google OAuth
→ 180K completions/month + 1K/day

Models:
  gc/gemini-3-flash-preview
  gc/gemini-2.5-pro

Meilleur rapport qualité-prix : Énorme niveau gratuit ! Utilisez-le avant les niveaux payants.

Copilote GitHub

Dashboard → Providers → Connect GitHub
→ OAuth via GitHub
→ Monthly reset (1st of month)

Models:
  gh/gpt-5
  gh/claude-4.5-sonnet
  gh/gemini-3-pro

💰 Fournisseurs bon marché

GLM-4.7 (réinitialisation quotidienne, 0,6 $/1 million)

Inscrivez-vous : Zhipu AI
Obtenez la clé API du plan de codage
Tableau de bord → Ajouter une clé API : Fournisseur : glm, Clé API : your-key

Utilisez : glm/glm-4.7 — Conseil de pro : Le plan de codage offre un quota de 3 × à un coût de 1/7 ! Réinitialisation quotidienne à 10h00.

MiniMax M2.1 (réinitialisation de 5 h, 0,20 $/1 M)

Inscrivez-vous : MiniMax
Obtenir la clé API → Tableau de bord → Ajouter une clé API

Utilisez : minimax/MiniMax-M2.1 — Conseil de pro : Option la moins chère pour un contexte long (1 million de jetons) !

Kimi K2 (9$/mois fixe)

Abonnez-vous : Moonshot AI
Obtenir la clé API → Tableau de bord → Ajouter une clé API

Utilisez : kimi/kimi-latest — Conseil de pro : Fixe 9 $/mois pour 10 millions de jetons = 0,90 $/1 million de coût effectif !

🆓 Fournisseurs GRATUITS

iFlow (8 modèles GRATUITS)

Dashboard → Connect iFlow → OAuth login → Unlimited usage

Models: if/kimi-k2-thinking, if/qwen3-coder-plus, if/glm-4.7, if/minimax-m2, if/deepseek-r1

Qwen (3 modèles GRATUITS)

Dashboard → Connect Qwen → Device code auth → Unlimited usage

Models: qw/qwen3-coder-plus, qw/qwen3-coder-flash

Kiro (Claude GRATUIT)

Dashboard → Connect Kiro → AWS Builder ID or Google/GitHub → Unlimited

Models: kr/claude-sonnet-4.5, kr/claude-haiku-4.5

🎨Combinaisons

Exemple 1 : Maximiser l'abonnement → Sauvegarde bon marché

Dashboard → Combos → Create New

Name: premium-coding
Models:
  1. cc/claude-opus-4-6 (Subscription primary)
  2. glm/glm-4.7 (Cheap backup, $0.6/1M)
  3. minimax/MiniMax-M2.1 (Cheapest fallback, $0.20/1M)

Use in CLI: premium-coding

Exemple 2 : Gratuit uniquement (sans coût)

Name: free-combo
Models:
  1. gc/gemini-3-flash-preview (180K free/month)
  2. if/kimi-k2-thinking (unlimited)
  3. qw/qwen3-coder-plus (unlimited)

Cost: $0 forever!

🔧 Intégration CLI

IDE de curseur

Settings → Models → Advanced:
  OpenAI API Base URL: http://localhost:20128/v1
  OpenAI API Key: [from omniroute dashboard]
  Model: cc/claude-opus-4-6

###Claude Code

Modifier ~/.claude/config.json :

{
  "anthropic_api_base": "http://localhost:20128/v1",
  "anthropic_api_key": "your-omniroute-api-key"
}

CLI du Codex

export OPENAI_BASE_URL="http://localhost:20128"
export OPENAI_API_KEY="your-omniroute-api-key"
codex "your prompt"

OpenClaw

Modifier ~/.openclaw/openclaw.json :

{
  "agents": {
    "defaults": {
      "model": { "primary": "omniroute/if/glm-4.7" }
    }
  },
  "models": {
    "providers": {
      "omniroute": {
        "baseUrl": "http://localhost:20128/v1",
        "apiKey": "your-omniroute-api-key",
        "api": "openai-completions",
        "models": [{ "id": "if/glm-4.7", "name": "glm-4.7" }]
      }
    }
  }
}

Ou utilisez le tableau de bord : Outils CLI → OpenClaw → Configuration automatique

Cline / Continuer / RooCode

Provider: OpenAI Compatible
Base URL: http://localhost:20128/v1
API Key: [from dashboard]
Model: cc/claude-opus-4-6

🚀 Déploiement

Déploiement VPS

git clone https://github.com/diegosouzapw/OmniRoute.git
cd OmniRoute && npm install && npm run build

export JWT_SECRET="your-secure-secret-change-this"
export INITIAL_PASSWORD="your-password"
export DATA_DIR="/var/lib/omniroute"
export PORT="20128"
export HOSTNAME="0.0.0.0"
export NODE_ENV="production"
export NEXT_PUBLIC_BASE_URL="http://localhost:20128"
export API_KEY_SECRET="endpoint-proxy-api-key-secret"

npm run start
# Or: pm2 start npm --name omniroute -- start

Docker

# Build image (default = runner-cli with codex/claude/droid preinstalled)
docker build -t omniroute:cli .

# Portable mode (recommended)
docker run -d --name omniroute -p 20128:20128 --env-file ./.env -v omniroute-data:/app/data omniroute:cli

Pour le mode intégré à l'hôte avec les binaires CLI, consultez la section Docker dans la documentation principale.

Variables d'environnement

Variables	Par défaut	Descriptif
`JWT_SECRET`	`omniroute-default-secret-change-me`	Secret de signature JWT (changement de production)
`INITIAL_PASSWORD`	`123456`	Mot de passe de première connexion
`DATA_DIR`	`~/.omniroute`	Répertoire de données (base de données, utilisation, journaux)
`PORT`	cadre par défaut	Port de service (`20128` dans les exemples)
`HOSTNAME`	cadre par défaut	Lier l'hôte (Docker par défaut est `0.0.0.0`)
`NODE_ENV`	valeur par défaut d'exécution	Définissez `production` pour le déploiement
`BASE_URL`	`http://localhost:20128`	URL de base interne côté serveur
`CLOUD_URL`	`https://omniroute.dev`	URL de base du point de terminaison de synchronisation cloud
`API_KEY_SECRET`	`endpoint-proxy-api-key-secret`	Secret HMAC pour les clés API générées
`REQUIRE_API_KEY`	`false`	Appliquer la clé API Bearer sur `/v1/*`
`ENABLE_REQUEST_LOGS`	`false`	Active les journaux de requêtes/réponses
`AUTH_COOKIE_SECURE`	`false`	Forcer le cookie d'authentification `Secure` (derrière le proxy inverse HTTPS)

Pour la référence complète des variables d'environnement, consultez le README.

📊 Modèles disponibles

Voir tous les modèles disponibles

Code Claude (cc/) — Pro/Max : cc/claude-opus-4-6, cc/claude-sonnet-4-5-20250929, cc/claude-haiku-4-5-20251001

Codex (cx/) — Plus/Pro : cx/gpt-5.2-codex, cx/gpt-5.1-codex-max

Gemini CLI (gc/) — GRATUIT : gc/gemini-3-flash-preview, gc/gemini-2.5-pro

Copilote GitHub (gh/) : gh/gpt-5, gh/claude-4.5-sonnet

GLM (glm/) — 0,6 $/1 million : glm/glm-4.7

MiniMax (minimax/) — 0,2 $/1 million : minimax/MiniMax-M2.1

iFlow (if/) — GRATUIT : if/kimi-k2-thinking, if/qwen3-coder-plus, if/deepseek-r1

Qwen (qw/) — GRATUIT : qw/qwen3-coder-plus, qw/qwen3-coder-flash

Kiro (kr/) — GRATUIT : kr/claude-sonnet-4.5, kr/claude-haiku-4.5

Recherche profonde (ds/) : ds/deepseek-chat, ds/deepseek-reasoner

Groq (groq/) : groq/llama-3.3-70b-versatile, groq/llama-4-maverick-17b-128e-instruct

xAI (xai/) : xai/grok-4, xai/grok-4-0709-fast-reasoning, xai/grok-code-mini

Mistral (mistral/) : mistral/mistral-large-2501, mistral/codestral-2501

Perplexité (pplx/) : pplx/sonar-pro, pplx/sonar

Ensemble IA (together/) : together/meta-llama/Llama-3.3-70B-Instruct-Turbo

IA de feux d'artifice (fireworks/) : fireworks/accounts/fireworks/models/deepseek-v3p1

Cérébras (cerebras/) : cerebras/llama-3.3-70b

Cohérer (cohere/) : cohere/command-r-plus-08-2024

NIM NVIDIA (nvidia/) : nvidia/nvidia/llama-3.3-70b-instruct

🧩 Fonctionnalités avancées

Modèles personnalisés

Ajoutez n'importe quel ID de modèle à n'importe quel fournisseur sans attendre une mise à jour de l'application :

# Via API
curl -X POST http://localhost:20128/api/provider-models \
  -H "Content-Type: application/json" \
  -d '{"provider": "openai", "modelId": "gpt-4.5-preview", "modelName": "GPT-4.5 Preview"}'

# List: curl http://localhost:20128/api/provider-models?provider=openai
# Remove: curl -X DELETE "http://localhost:20128/api/provider-models?provider=openai&model=gpt-4.5-preview"

Ou utilisez le tableau de bord : Fournisseurs → [Fournisseur] → Modèles personnalisés.

Itinéraires de fournisseurs dédiés

Acheminez les demandes directement vers un fournisseur spécifique avec validation du modèle :

POST http://localhost:20128/v1/providers/openai/chat/completions
POST http://localhost:20128/v1/providers/openai/embeddings
POST http://localhost:20128/v1/providers/fireworks/images/generations

Le préfixe du fournisseur est ajouté automatiquement s'il est manquant. Les modèles incompatibles renvoient 400.

Configuration du proxy réseau

# Set global proxy
curl -X PUT http://localhost:20128/api/settings/proxy \
  -d '{"global": {"type":"http","host":"proxy.example.com","port":"8080"}}'

# Per-provider proxy
curl -X PUT http://localhost:20128/api/settings/proxy \
  -d '{"providers": {"openai": {"type":"socks5","host":"proxy.example.com","port":"1080"}}}'

# Test proxy
curl -X POST http://localhost:20128/api/settings/proxy/test \
  -d '{"proxy":{"type":"socks5","host":"proxy.example.com","port":"1080"}}'

Précédence : Spécifique à la clé → Spécifique au combo → Spécifique au fournisseur → Global → Environnement.

API du catalogue de modèles

curl http://localhost:20128/api/models/catalog

Renvoie les modèles regroupés par fournisseur avec des types (chat, embedding, image).

Synchronisation avec le cloud

Synchronisez les fournisseurs, les combos et les paramètres sur tous les appareils
Synchronisation automatique en arrière-plan avec délai d'attente + échec rapide
Préférer le côté serveur BASE_URL/CLOUD_URL en production

LLM Gateway Intelligence (Phase 9)

Cache sémantique — Met en cache automatiquement les réponses hors streaming, température = 0 (contourner avec X-OmniRoute-No-Cache: true)
Demande d'idempotence — Déduplique les requêtes dans les 5 secondes via l'en-tête Idempotency-Key ou X-Request-Id
Suivi des progrès – Événements SSE event: progress opt-in via l'en-tête X-OmniRoute-Progress: true

Aire de jeux des traducteurs

Accès via Tableau de bord → Traducteur. Déboguez et visualisez comment OmniRoute traduit les requêtes API entre les fournisseurs.

Mode	Objectif
Aire de jeux	Sélectionnez les formats source/cible, collez une requête et voyez instantanément le résultat traduit
Testeur de chat	Envoyez des messages de chat en direct via le proxy et inspectez le cycle complet de demande/réponse
Banc d'essai	Exécutez des tests par lots sur plusieurs combinaisons de formats pour vérifier l'exactitude de la traduction
Moniteur en direct	Regardez les traductions en temps réel à mesure que les demandes transitent par le proxy

Cas d'utilisation :

Déboguer pourquoi une combinaison client/fournisseur spécifique échoue
Vérifiez que les balises de réflexion, les appels d'outils et les invites système se traduisent correctement
Comparez les différences de format entre les formats API OpenAI, Claude, Gemini et Responses

Stratégies de routage

Configurez via Tableau de bord → Paramètres → Routage.

Stratégie	Descriptif
Remplir en premier	Utilise les comptes par ordre de priorité : le compte principal gère toutes les demandes jusqu'à ce qu'il soit indisponible
Tournoi à la ronde	Parcourt tous les comptes avec une limite persistante configurable (par défaut : 3 appels par compte)
P2C (Puissance de deux choix)	Sélectionne 2 comptes aléatoires et oriente vers le compte le plus sain – équilibre la charge avec la conscience de la santé
Aléatoire	Sélectionne au hasard un compte pour chaque demande à l'aide de Fisher-Yates shuffle
Le moins utilisé	Routes vers le compte avec l'horodatage `lastUsedAt` le plus ancien, répartissant le trafic de manière uniforme
Coût optimisé	Itinéraires vers le compte avec la valeur de priorité la plus faible, optimisation pour les fournisseurs les moins chers

Alias de modèles génériques

Créez des modèles génériques pour remapper les noms de modèles :

Pattern: claude-sonnet-*     →  Target: cc/claude-sonnet-4-5-20250929
Pattern: gpt-*               →  Target: gh/gpt-5.1-codex

Les caractères génériques prennent en charge * (n'importe quel caractère) et ? (un seul caractère).

Chaînes de secours

Définissez des chaînes de secours globales qui s'appliquent à toutes les requêtes :

Chain: production-fallback
  1. cc/claude-opus-4-6
  2. gh/gpt-5.1-codex
  3. glm/glm-4.7

Résilience et disjoncteurs

Configurez via Tableau de bord → Paramètres → Résilience.

OmniRoute met en œuvre la résilience au niveau du fournisseur avec quatre composants :

Profils de fournisseur — Configuration par fournisseur pour :
- Seuil de défaillance (combien de défaillances avant ouverture)
- Durée du temps de recharge
- Sensibilité de détection de limite de débit
- Paramètres d'intervalle exponentiel
Limites de débit modifiables — Paramètres par défaut au niveau du système configurables dans le tableau de bord :
- Requêtes par minute (RPM) — Nombre maximal de requêtes par minute et par compte
- Min Time Between Requests — Écart minimum en millisecondes entre les requêtes
- Max Concurrent Requests — Nombre maximal de requêtes simultanées par compte
- Cliquez sur Modifier pour modifier, puis sur Enregistrer ou Annuler. Les valeurs persistent via l'API de résilience.
Disjoncteur — Suit les pannes par fournisseur et ouvre automatiquement le circuit lorsqu'un seuil est atteint :
- FERMÉ (sain) — Les demandes circulent normalement
- OPEN — Le fournisseur est temporairement bloqué après des échecs répétés
- HALF_OPEN — Test si le fournisseur a récupéré
Politiques et identifiants verrouillés — Affiche l'état du disjoncteur et les identifiants verrouillés avec capacité de déverrouillage forcé.
Détection automatique des limites de débit — Surveille les en-têtes 429 et Retry-After pour éviter de manière proactive d'atteindre les limites de débit du fournisseur.

Conseil de pro : Utilisez le bouton Réinitialiser tout pour effacer tous les disjoncteurs et les temps de recharge lorsqu'un fournisseur se remet d'une panne.

Exportation/Importation de base de données

Gérez les sauvegardes de base de données dans Tableau de bord → Paramètres → Système et stockage.

Actions	Descriptif
Exporter la base de données	Télécharge la base de données SQLite actuelle sous forme de fichier `.sqlite`
Exporter tout (.tar.gz)	Télécharge une archive de sauvegarde complète comprenant : base de données, paramètres, combos, connexions du fournisseur (pas d'informations d'identification), métadonnées de la clé API
Importer la base de données	Téléchargez un fichier `.sqlite` pour remplacer la base de données actuelle. Une sauvegarde de pré-importation est automatiquement créée

# API: Export database
curl -o backup.sqlite http://localhost:20128/api/db-backups/export

# API: Export all (full archive)
curl -o backup.tar.gz http://localhost:20128/api/db-backups/exportAll

# API: Import database
curl -X POST http://localhost:20128/api/db-backups/import \
  -F "file=@backup.sqlite"

Validation de l'importation : Le fichier importé est validé pour son intégrité (vérification pragma SQLite), les tables requises (provider_connections, provider_nodes, combos, api_keys) et sa taille (max 100 Mo).

Cas d'utilisation :

Migrer OmniRoute entre machines
Créer des sauvegardes externes pour la reprise après sinistre
Partager les configurations entre les membres de l'équipe (exporter tout → partager l'archive)

Tableau de bord des paramètres

La page des paramètres est organisée en 5 onglets pour une navigation facile :

Onglet	Contenu
Sécurité	Paramètres de connexion/mot de passe, contrôle d'accès IP, authentification API pour `/models` et blocage du fournisseur
Routage	Stratégie de routage globale (6 options), alias de modèle générique, chaînes de secours, valeurs par défaut combinées
Résilience	Profils de fournisseurs, limites de débit modifiables, état du disjoncteur, politiques et identifiants verrouillés
IA	Configuration du budget de réflexion, injection d'invite du système global, statistiques de cache d'invite
Avancé	Configuration globale du proxy (HTTP/SOCKS5)

Gestion des coûts et du budget

Accès via Tableau de bord → Coûts.

Onglet	Objectif
Budget	Fixez des limites de dépenses par clé API avec des budgets quotidiens/hebdomadaires/mensuels et un suivi en temps réel
Tarif	Afficher et modifier les entrées de tarification du modèle — coût par 1 000 jetons d'entrée/sortie par fournisseur

# API: Set a budget
curl -X POST http://localhost:20128/api/usage/budget \
  -H "Content-Type: application/json" \
  -d '{"keyId": "key-123", "limit": 50.00, "period": "monthly"}'

# API: Get current budget status
curl http://localhost:20128/api/usage/budget

Suivi des coûts : Chaque demande enregistre l'utilisation du jeton et calcule le coût à l'aide du tableau de tarification. Affichez les répartitions dans Tableau de bord → Utilisation par fournisseur, modèle et clé API.

Transcription audio

OmniRoute prend en charge la transcription audio via le point de terminaison compatible OpenAI :

POST /v1/audio/transcriptions
Authorization: Bearer your-api-key
Content-Type: multipart/form-data

# Example with curl
curl -X POST http://localhost:20128/v1/audio/transcriptions \
  -H "Authorization: Bearer your-api-key" \
  -F "file=@audio.mp3" \
  -F "model=deepgram/nova-3"

Fournisseurs disponibles : Deepgram (deepgram/), AssemblyAI (assemblyai/).

Formats audio pris en charge : mp3, wav, m4a, flac, ogg, webm.

Stratégies d'équilibrage des combos

Configurez l'équilibrage par combo dans Tableau de bord → Combos → Créer/Modifier → Stratégie.

Stratégie	Descriptif
Robin à la ronde	Tourne à travers les modèles de manière séquentielle
Priorité	Essaie toujours le premier modèle ; se rabat uniquement sur l'erreur
Aléatoire	Sélectionne un modèle aléatoire dans le combo pour chaque demande
Pondéré	Itinéraires proportionnellement basés sur les poids attribués par modèle
Les moins utilisés	Itinéraires vers le modèle avec le moins de requêtes récentes (utilise des métriques combinées)
Coût optimisé	Itinéraires vers le modèle disponible le moins cher (utilise le tableau de prix)

Les valeurs par défaut des combos globaux peuvent être définies dans Tableau de bord → Paramètres → Routage → Paramètres par défaut des combos.

Tableau de bord de santé

Accès via Tableau de bord → Santé. Aperçu de l'état du système en temps réel avec 6 cartes :

Carte	Ce que cela montre
État du système	Disponibilité, version, utilisation de la mémoire, répertoire de données
Santé du fournisseur	État du disjoncteur par fournisseur (Fermé/Ouvert/Semi-ouvert)
Limites de taux	Temps de recharge de la limite de débit actif par compte avec temps restant
Verrouillages actifs	Fournisseurs temporairement bloqués par la politique de verrouillage
Cache de signatures	Statistiques du cache de déduplication (clés actives, taux de réussite)
Télémétrie de latence	Agrégation de latence p50/p95/p99 par fournisseur

Conseil de pro : La page Santé s'actualise automatiquement toutes les 10 secondes. Utilisez la carte disjoncteur pour identifier les fournisseurs qui rencontrent des problèmes.

FilesExpand file tree

USER_GUIDE.md

Latest commit

History

USER_GUIDE.md

File metadata and controls

Guide de l'utilisateur

Table des matières

💰 Aperçu des prix

🎯 Cas d'utilisation

Cas 1 : "J'ai un abonnement Claude Pro"

Cas 2 : "Je veux un coût nul"

Cas 3 : "J'ai besoin de coder 24h/24 et 7j/7, sans interruption"

Cas 4 : "Je veux une IA GRATUITE dans OpenClaw"

📖 Configuration du fournisseur

🔐 Fournisseurs d'abonnements

Claude Code (Pro/Max)

Codex OpenAI (Plus/Pro)

Gemini CLI (180 000 GRATUITS/mois !)

Copilote GitHub

💰 Fournisseurs bon marché

GLM-4.7 (réinitialisation quotidienne, 0,6 $/1 million)

MiniMax M2.1 (réinitialisation de 5 h, 0,20 $/1 M)

Kimi K2 (9$/mois fixe)

🆓 Fournisseurs GRATUITS

iFlow (8 modèles GRATUITS)

Qwen (3 modèles GRATUITS)

Kiro (Claude GRATUIT)

🎨Combinaisons

Exemple 1 : Maximiser l'abonnement → Sauvegarde bon marché

Exemple 2 : Gratuit uniquement (sans coût)

🔧 Intégration CLI

IDE de curseur

CLI du Codex

OpenClaw

Cline / Continuer / RooCode

🚀 Déploiement

Déploiement VPS

Docker

Variables d'environnement

📊 Modèles disponibles

🧩 Fonctionnalités avancées

Modèles personnalisés

Itinéraires de fournisseurs dédiés

Configuration du proxy réseau

API du catalogue de modèles

Synchronisation avec le cloud

LLM Gateway Intelligence (Phase 9)

Aire de jeux des traducteurs

Stratégies de routage

Alias de modèles génériques

Chaînes de secours

Résilience et disjoncteurs

Exportation/Importation de base de données

Tableau de bord des paramètres

Gestion des coûts et du budget

Transcription audio

Stratégies d'équilibrage des combos

Tableau de bord de santé