Guía del usuario

Guía completa para configurar proveedores, crear combos, integrar herramientas CLI e implementar OmniRoute.

Tabla de contenidos

Pricing at a Glance
Use Cases
Provider Setup
CLI Integration
Deployment
Available Models
Advanced Features

💰 Precios de un vistazo

Nivel	Proveedor	Costo	Restablecer cuota	Mejor para
💳 SUSCRIPCIÓN	Código Claude (Pro)	$20/mes	5h + weekly	Ya suscrito
	Códice (Plus/Pro)	$20-200/mes	5h + semanales	Usuarios de OpenAI
	Géminis CLI	GRATIS	180K/mes + 1K/día	¡Todos!
	Copiloto de GitHub	$10-19/mes	Mensual	Usuarios de GitHub
🔑 CLAVE API	Búsqueda profunda	Pago por uso	Ninguno	Razonamiento barato
	Groq	Pago por uso	Ninguno	Inferencia ultrarrápida
	xAI (Grok)	Pago por uso	Ninguno	Grok 4 razonamiento
	Mistral	Pago por uso	Ninguno	Modelos alojados en la UE
	Perplejidad	Pago por uso	Ninguno	Búsqueda aumentada
	Juntos IA	Pago por uso	Ninguno	Modelos de código abierto
	Fuegos artificiales AI	Pago por uso	Ninguno	Imágenes de flujo rápido
	Cerebras	Pago por uso	None	Velocidad a escala de oblea
	Coherir	Pago por uso	Ninguno	Comando R+ TRAPO
	NIM de NVIDIA	Pago por uso	Ninguno	Modelos empresariales
💰 BARATO	GLM-4.7	0,6 dólares/1 millón	Todos los días a las 10 a. m.	Respaldo presupuestario
	MiniMax M2.1	0,2 dólares/1 millón	5 horas rodantes	Opción más barata
	Kimi K2	$9/mes fijo	10 millones de tokens/mes	Costo predecible
🆓 GRATIS	iFlujo	$0	Ilimitado	8 modelos gratis
	Qwen	$0	Ilimitado	3 modelos gratis
	kiro	$0	Ilimitado	Claudio libre

💡 Consejo profesional: Comience con el combo Gemini CLI (180 000 gratis/mes) + iFlow (ilimitado y gratis) = ¡Costo de $0!

🎯 Casos de uso

Caso 1: "Tengo una suscripción a Claude Pro"

Problema: La cuota vence sin usarse, la tasa se limita durante la codificación intensa

Combo: "maximize-claude"
  1. cc/claude-opus-4-6        (use subscription fully)
  2. glm/glm-4.7               (cheap backup when quota out)
  3. if/kimi-k2-thinking       (free emergency fallback)

Monthly cost: $20 (subscription) + ~$5 (backup) = $25 total
vs. $20 + hitting limits = frustration

Caso 2: "Quiero coste cero"

Problema: No puedo permitirme suscripciones, necesito codificación de IA confiable

Combo: "free-forever"
  1. gc/gemini-3-flash         (180K free/month)
  2. if/kimi-k2-thinking       (unlimited free)
  3. qw/qwen3-coder-plus       (unlimited free)

Monthly cost: $0
Quality: Production-ready models

Caso 3: "Necesito codificación 24 horas al día, 7 días a la semana, sin interrupciones"

Problema: Plazos, no puedo permitirme el tiempo de inactividad

Combo: "always-on"
  1. cc/claude-opus-4-6        (best quality)
  2. cx/gpt-5.2-codex          (second subscription)
  3. glm/glm-4.7               (cheap, resets daily)
  4. minimax/MiniMax-M2.1      (cheapest, 5h reset)
  5. if/kimi-k2-thinking       (free unlimited)

Result: 5 layers of fallback = zero downtime
Monthly cost: $20-200 (subscriptions) + $10-20 (backup)

Caso 4: "Quiero IA GRATIS en OpenClaw"

Problema: Necesita asistente de IA en aplicaciones de mensajería, completamente gratis

Combo: "openclaw-free"
  1. if/glm-4.7                (unlimited free)
  2. if/minimax-m2.1           (unlimited free)
  3. if/kimi-k2-thinking       (unlimited free)

Monthly cost: $0
Access via: WhatsApp, Telegram, Slack, Discord, iMessage, Signal...

📖 Configuración del proveedor

🔐 Proveedores de suscripción

Código Claude (Pro/Max)

Dashboard → Providers → Connect Claude Code
→ OAuth login → Auto token refresh
→ 5-hour + weekly quota tracking

Models:
  cc/claude-opus-4-6
  cc/claude-sonnet-4-5-20250929
  cc/claude-haiku-4-5-20251001

Consejo profesional: Utilice Opus para tareas complejas y Sonnet para mayor velocidad. ¡OmniRoute realiza un seguimiento de la cuota por modelo!

Códice OpenAI (Plus/Pro)

Dashboard → Providers → Connect Codex
→ OAuth login (port 1455)
→ 5-hour + weekly reset

Models:
  cx/gpt-5.2-codex
  cx/gpt-5.1-codex-max

Gemini CLI (¡180K GRATIS/mes!)

Dashboard → Providers → Connect Gemini CLI
→ Google OAuth
→ 180K completions/month + 1K/day

Models:
  gc/gemini-3-flash-preview
  gc/gemini-2.5-pro

Mejor valor: ¡Enorme nivel gratuito! Utilice esto antes de los niveles pagos.

Copiloto de GitHub

Dashboard → Providers → Connect GitHub
→ OAuth via GitHub
→ Monthly reset (1st of month)

Models:
  gh/gpt-5
  gh/claude-4.5-sonnet
  gh/gemini-3-pro

💰 Proveedores baratos

GLM-4.7 (Restablecimiento diario, $0,6/1 millón)

Regístrate: Zhipu AI
Obtenga la clave API del plan de codificación
Panel de control → Agregar clave API: Proveedor: glm, Clave API: your-key

Uso: glm/glm-4.7 — Consejo profesional: ¡El plan de codificación ofrece 3 × cuota a 1/7 de costo! Reiniciar diariamente a las 10:00 a.m.

MiniMax M2.1 (reinicio de 5 h, $0,20/1 millón)

Regístrate: MiniMax
Obtener clave API → Panel → Agregar clave API

Uso: minimax/MiniMax-M2.1 — Consejo profesional: ¡La opción más barata para contexto largo (1 millón de tokens)!

Kimi K2 ($9/mes fijo)

Suscríbete: Moonshot AI
Obtener clave API → Panel → Agregar clave API

Uso: kimi/kimi-latest — Consejo profesional: ¡Fijo $9/mes por 10 millones de tokens = $0,90/1 millón de costo efectivo!

🆓 Proveedores GRATIS

iFlow (8 modelos GRATIS)

Dashboard → Connect iFlow → OAuth login → Unlimited usage

Models: if/kimi-k2-thinking, if/qwen3-coder-plus, if/glm-4.7, if/minimax-m2, if/deepseek-r1

Qwen (3 modelos GRATIS)

Dashboard → Connect Qwen → Device code auth → Unlimited usage

Models: qw/qwen3-coder-plus, qw/qwen3-coder-flash

Kiro (Claude GRATIS)

Dashboard → Connect Kiro → AWS Builder ID or Google/GitHub → Unlimited

Models: kr/claude-sonnet-4.5, kr/claude-haiku-4.5

🎨Combinaciones

Ejemplo 1: Maximizar la suscripción → Copia de seguridad económica

Dashboard → Combos → Create New

Name: premium-coding
Models:
  1. cc/claude-opus-4-6 (Subscription primary)
  2. glm/glm-4.7 (Cheap backup, $0.6/1M)
  3. minimax/MiniMax-M2.1 (Cheapest fallback, $0.20/1M)

Use in CLI: premium-coding

Ejemplo 2: Solo gratuito (coste cero)

Name: free-combo
Models:
  1. gc/gemini-3-flash-preview (180K free/month)
  2. if/kimi-k2-thinking (unlimited)
  3. qw/qwen3-coder-plus (unlimited)

Cost: $0 forever!

🔧 Integración CLI

Cursor IDE

Settings → Models → Advanced:
  OpenAI API Base URL: http://localhost:20128/v1
  OpenAI API Key: [from omniroute dashboard]
  Model: cc/claude-opus-4-6

Código Claude

Editar ~/.claude/config.json:

{
  "anthropic_api_base": "http://localhost:20128/v1",
  "anthropic_api_key": "your-omniroute-api-key"
}

CLI del Códice

export OPENAI_BASE_URL="http://localhost:20128"
export OPENAI_API_KEY="your-omniroute-api-key"
codex "your prompt"

Garra Abierta

Editar ~/.openclaw/openclaw.json:

{
  "agents": {
    "defaults": {
      "model": { "primary": "omniroute/if/glm-4.7" }
    }
  },
  "models": {
    "providers": {
      "omniroute": {
        "baseUrl": "http://localhost:20128/v1",
        "apiKey": "your-omniroute-api-key",
        "api": "openai-completions",
        "models": [{ "id": "if/glm-4.7", "name": "glm-4.7" }]
      }
    }
  }
}

O use el Panel: Herramientas CLI → OpenClaw → Configuración automática

Cline / Continuar / RooCode

Provider: OpenAI Compatible
Base URL: http://localhost:20128/v1
API Key: [from dashboard]
Model: cc/claude-opus-4-6

🚀 Implementación

Implementación de VPS

git clone https://github.com/diegosouzapw/OmniRoute.git
cd OmniRoute && npm install && npm run build

export JWT_SECRET="your-secure-secret-change-this"
export INITIAL_PASSWORD="your-password"
export DATA_DIR="/var/lib/omniroute"
export PORT="20128"
export HOSTNAME="0.0.0.0"
export NODE_ENV="production"
export NEXT_PUBLIC_BASE_URL="http://localhost:20128"
export API_KEY_SECRET="endpoint-proxy-api-key-secret"

npm run start
# Or: pm2 start npm --name omniroute -- start

acoplador

# Build image (default = runner-cli with codex/claude/droid preinstalled)
docker build -t omniroute:cli .

# Portable mode (recommended)
docker run -d --name omniroute -p 20128:20128 --env-file ./.env -v omniroute-data:/app/data omniroute:cli

Para el modo integrado en el host con binarios CLI, consulte la sección Docker en los documentos principales.

Variables de entorno

Variables	Predeterminado	Descripción
`JWT_SECRET`	`omniroute-default-secret-change-me`	Secreto de firma de JWT (cambio en producción)
`INITIAL_PASSWORD`	`123456`	Primera contraseña de inicio de sesión
`DATA_DIR`	`~/.omniroute`	Directorio de datos (db, uso, registros)
`PORT`	marco predeterminado	Puerto de servicio (`20128` en ejemplos)
`HOSTNAME`	marco predeterminado	Vincular host (Docker por defecto es `0.0.0.0`)
`NODE_ENV`	valor predeterminado de tiempo de ejecución	Establecer `production` para implementación
`BASE_URL`	`http://localhost:20128`	URL base interna del lado del servidor
`CLOUD_URL`	`https://omniroute.dev`	URL base del punto final de sincronización en la nube
`API_KEY_SECRET`	`endpoint-proxy-api-key-secret`	Secreto HMAC para claves API generadas
`REQUIRE_API_KEY`	`false`	Aplicar la clave API de portador en `/v1/*`
`ENABLE_REQUEST_LOGS`	`false`	Habilita registros de solicitud/respuesta
`AUTH_COOKIE_SECURE`	`false`	Forzar cookie de autenticación `Secure` (detrás del proxy inverso HTTPS)

Para obtener la referencia completa de las variables de entorno, consulte README.

📊 Modelos disponibles

Ver todos los modelos disponibles

Código Claude (cc/) — Pro/Max: cc/claude-opus-4-6, cc/claude-sonnet-4-5-20250929, cc/claude-haiku-4-5-20251001

Códice (cx/) — Plus/Pro: cx/gpt-5.2-codex, cx/gpt-5.1-codex-max

Gemini CLI (gc/) — GRATIS: gc/gemini-3-flash-preview, gc/gemini-2.5-pro

Copilot de GitHub (gh/): gh/gpt-5, gh/claude-4.5-sonnet

GLM (glm/) — 0,6 $/1 millón: glm/glm-4.7

MiniMax (minimax/) — $0,2/1 millón: minimax/MiniMax-M2.1

iFlow (if/) — GRATIS: if/kimi-k2-thinking, if/qwen3-coder-plus, if/deepseek-r1

Qwen (qw/) — GRATIS: qw/qwen3-coder-plus, qw/qwen3-coder-flash

Kiro (kr/) — GRATIS: kr/claude-sonnet-4.5, kr/claude-haiku-4.5

** Búsqueda profunda (ds/) **: ds/deepseek-chat, ds/deepseek-reasoner

Groq (groq/): groq/llama-3.3-70b-versatile, groq/llama-4-maverick-17b-128e-instruct

xAI (xai/): xai/grok-4, xai/grok-4-0709-fast-reasoning, xai/grok-code-mini

Mistral (mistral/): mistral/mistral-large-2501, mistral/codestral-2501

Perplejidad (pplx/): pplx/sonar-pro, pplx/sonar

Juntos AI (together/): together/meta-llama/Llama-3.3-70B-Instruct-Turbo

Fuegos artificiales AI (fireworks/): fireworks/accounts/fireworks/models/deepseek-v3p1

Cerebras (cerebras/): cerebras/llama-3.3-70b

Coherir (cohere/): cohere/command-r-plus-08-2024

NVIDIA NIM (nvidia/): nvidia/nvidia/llama-3.3-70b-instruct

🧩 Funciones avanzadas

Modelos personalizados

Agregue cualquier ID de modelo a cualquier proveedor sin esperar una actualización de la aplicación:

# Via API
curl -X POST http://localhost:20128/api/provider-models \
  -H "Content-Type: application/json" \
  -d '{"provider": "openai", "modelId": "gpt-4.5-preview", "modelName": "GPT-4.5 Preview"}'

# List: curl http://localhost:20128/api/provider-models?provider=openai
# Remove: curl -X DELETE "http://localhost:20128/api/provider-models?provider=openai&model=gpt-4.5-preview"

O utilice el Panel de control: Proveedores → [Proveedor] → Modelos personalizados.

Rutas de proveedores dedicadas

Enrutar solicitudes directamente a un proveedor específico con validación de modelo:

POST http://localhost:20128/v1/providers/openai/chat/completions
POST http://localhost:20128/v1/providers/openai/embeddings
POST http://localhost:20128/v1/providers/fireworks/images/generations

El prefijo del proveedor se agrega automáticamente si falta. Los modelos no coincidentes devuelven 400.

Configuración del proxy de red

# Set global proxy
curl -X PUT http://localhost:20128/api/settings/proxy \
  -d '{"global": {"type":"http","host":"proxy.example.com","port":"8080"}}'

# Per-provider proxy
curl -X PUT http://localhost:20128/api/settings/proxy \
  -d '{"providers": {"openai": {"type":"socks5","host":"proxy.example.com","port":"1080"}}}'

# Test proxy
curl -X POST http://localhost:20128/api/settings/proxy/test \
  -d '{"proxy":{"type":"socks5","host":"proxy.example.com","port":"1080"}}'

Precedencia: Específico de clave → Específico de combo → Específico de proveedor → Global → Entorno.

API del catálogo de modelos

curl http://localhost:20128/api/models/catalog

Devuelve modelos agrupados por proveedor con tipos (chat, embedding, image).

Sincronización en la nube

Sincronizar proveedores, combos y configuraciones entre dispositivos
Sincronización automática en segundo plano con tiempo de espera + falla rápida
Prefiere BASE_URL/CLOUD_URL del lado del servidor en producción

LLM Gateway Intelligence (Fase 9)

Caché semántica: cachés automáticos sin transmisión, temperatura = 0 respuestas (omitir con X-OmniRoute-No-Cache: true)
Idempotencia de solicitud: deduplica solicitudes en 5 segundos a través del encabezado Idempotency-Key o X-Request-Id
Seguimiento del progreso: suscripción a eventos SSE event: progress a través del encabezado X-OmniRoute-Progress: true

Patio de juegos del traductor

Acceda a través de Panel → Traductor. Depure y visualice cómo OmniRoute traduce las solicitudes de API entre proveedores.

Modo	Propósito
Parque infantil	Seleccione formatos de origen/destino, pegue una solicitud y vea el resultado traducido al instante
Probador de chat	Envíe mensajes de chat en vivo a través del proxy e inspeccione el ciclo completo de solicitud/respuesta
Banco de pruebas	Ejecute pruebas por lotes en múltiples combinaciones de formatos para verificar la corrección de la traducción
Monitorización en vivo	Vea traducciones en tiempo real a medida que las solicitudes fluyen a través del proxy

Casos de uso:

Depurar por qué falla una combinación específica de cliente/proveedor
Verificar que las etiquetas de pensamiento, las llamadas a herramientas y las indicaciones del sistema se traduzcan correctamente
Compare las diferencias de formato entre los formatos OpenAI, Claude, Gemini y Responses API

Estrategias de enrutamiento

Configure a través de Panel → Configuración → Enrutamiento.

Estrategia	Descripción
Llene primero	Utiliza cuentas en orden de prioridad: la cuenta principal maneja todas las solicitudes hasta que no esté disponible
Round Robin	Recorre todas las cuentas con un límite fijo configurable (predeterminado: 3 llamadas por cuenta)
P2C (Poder de dos opciones)	Elige 2 cuentas al azar y ruta hacia la más saludable: los saldos se cargan con conciencia de la salud
Aleatorio	Selecciona aleatoriamente una cuenta para cada solicitud mediante la reproducción aleatoria de Fisher-Yates
Menos usado	Rutas a la cuenta con la marca de tiempo `lastUsedAt` más antigua, distribuyendo el tráfico de manera uniforme
Costo optimizado	Rutas a la cuenta con el valor de prioridad más bajo, optimizando para proveedores de menor costo

Alias de modelo comodín

Cree patrones comodín para reasignar nombres de modelos:

Pattern: claude-sonnet-*     →  Target: cc/claude-sonnet-4-5-20250929
Pattern: gpt-*               →  Target: gh/gpt-5.1-codex

Los comodines admiten * (cualquier carácter) y ? (un solo carácter).

Cadenas de respaldo

Defina cadenas de respaldo globales que se apliquen a todas las solicitudes:

Chain: production-fallback
  1. cc/claude-opus-4-6
  2. gh/gpt-5.1-codex
  3. glm/glm-4.7

Resiliencia y disyuntores

Configure a través de Panel → Configuración → Resiliencia.

OmniRoute implementa resiliencia a nivel de proveedor con cuatro componentes:

Perfiles de proveedor: configuración por proveedor para:
- Umbral de fallas (cuántas fallas antes de abrir)
- Duración del tiempo de recuperación
- Sensibilidad de detección de límite de velocidad
- Parámetros de retroceso exponencial
Límites de tarifas editables: valores predeterminados a nivel del sistema configurables en el panel:
- Solicitudes por minuto (RPM): solicitudes máximas por minuto por cuenta
- Tiempo mínimo entre solicitudes: intervalo mínimo en milisegundos entre solicitudes
- Máximo de solicitudes simultáneas: máximo de solicitudes simultáneas por cuenta
- Haga clic en Editar para modificar y luego en Guardar o Cancelar. Los valores persisten a través de la API de resiliencia.
Disyuntor: realiza un seguimiento de las fallas por proveedor y abre automáticamente el circuito cuando se alcanza un umbral:
- CERRADO (En buen estado): las solicitudes fluyen normalmente
- ABIERTO: el proveedor está bloqueado temporalmente después de fallas repetidas
- HALF_OPEN — Probando si el proveedor se ha recuperado
Políticas e identificadores bloqueados: muestra el estado del disyuntor y los identificadores bloqueados con capacidad de desbloqueo forzado.
Detección automática de límite de tasa: monitorea los encabezados 429 y Retry-After para evitar de manera proactiva alcanzar los límites de tasa del proveedor.

Consejo profesional: Utilice el botón Restablecer todo para borrar todos los disyuntores y tiempos de reutilización cuando un proveedor se recupera de una interrupción.

Exportación/Importación de base de datos

Administre las copias de seguridad de la base de datos en Panel → Configuración → Sistema y almacenamiento.

Acción	Descripción
Exportar base de datos	Descarga la base de datos SQLite actual como un archivo `.sqlite`
Exportar todo (.tar.gz)	Descarga un archivo de copia de seguridad completo que incluye: base de datos, configuraciones, combinaciones, conexiones de proveedores (sin credenciales), metadatos de clave API
Importar base de datos	Cargue un archivo `.sqlite` para reemplazar la base de datos actual. Se crea automáticamente una copia de seguridad previa a la importación

# API: Export database
curl -o backup.sqlite http://localhost:20128/api/db-backups/export

# API: Export all (full archive)
curl -o backup.tar.gz http://localhost:20128/api/db-backups/exportAll

# API: Import database
curl -X POST http://localhost:20128/api/db-backups/import \
  -F "file=@backup.sqlite"

Validación de importación: Se valida la integridad del archivo importado (verificación de pragma de SQLite), las tablas requeridas (provider_connections, provider_nodes, combos, api_keys) y el tamaño (máximo 100 MB).

Casos de uso:

Migrar OmniRoute entre máquinas
Crear copias de seguridad externas para la recuperación de desastres.
Compartir configuraciones entre los miembros del equipo (exportar todo → compartir archivo)

Panel de configuración

La página de configuración está organizada en 5 pestañas para facilitar la navegación:

Pestaña	Contenidos
Seguridad	Configuración de inicio de sesión/contraseña, control de acceso IP, autenticación API para `/models` y bloqueo de proveedores
Enrutamiento	Estrategia de enrutamiento global (6 opciones), alias de modelos comodín, cadenas de respaldo, valores predeterminados combinados
Resiliencia	Perfiles de proveedores, límites de tarifas editables, estado de los disyuntores, políticas e identificadores bloqueados
IA	Pensando en la configuración del presupuesto, inyección de avisos del sistema global, estadísticas de caché de avisos
Avanzado	Configuración de proxy global (HTTP/SOCKS5)

Gestión de costes y presupuesto

Acceso a través de Panel → Costos.

Pestaña	Propósito
Presupuesto	Establezca límites de gasto por clave API con presupuestos diarios/semanales/mensuales y seguimiento en tiempo real
Precios	Ver y editar entradas de precios de modelos: costo por 1.000 tokens de entrada/salida por proveedor

# API: Set a budget
curl -X POST http://localhost:20128/api/usage/budget \
  -H "Content-Type: application/json" \
  -d '{"keyId": "key-123", "limit": 50.00, "period": "monthly"}'

# API: Get current budget status
curl http://localhost:20128/api/usage/budget

Seguimiento de costos: Cada solicitud registra el uso del token y calcula el costo utilizando la tabla de precios. Vea desgloses en Panel → Uso por proveedor, modelo y clave API.

Transcripción de audio

OmniRoute admite la transcripción de audio a través del punto final compatible con OpenAI:

POST /v1/audio/transcriptions
Authorization: Bearer your-api-key
Content-Type: multipart/form-data

# Example with curl
curl -X POST http://localhost:20128/v1/audio/transcriptions \
  -H "Authorization: Bearer your-api-key" \
  -F "file=@audio.mp3" \
  -F "model=deepgram/nova-3"

Proveedores disponibles: Deepgram (deepgram/), AssemblyAI (assemblyai/).

Formatos de audio admitidos: mp3, wav, m4a, flac, ogg, webm.

Estrategias de equilibrio combinadas

Configure el equilibrio por combo en Panel → Combos → Crear/Editar → Estrategia.

Estrategia	Descripción
Todos contra todos	Gira a través de modelos secuencialmente
Prioridad	Siempre prueba el primer modelo; retrocede sólo en caso de error
Aleatorio	Elige un modelo aleatorio del combo para cada solicitud
Ponderado	Rutas proporcionalmente en función de los pesos asignados por modelo
Menos usado	Rutas al modelo con la menor cantidad de solicitudes recientes (utiliza métricas combinadas)
Optimización de costos	Rutas al modelo más barato disponible (utiliza tabla de precios)

Los valores predeterminados combinados globales se pueden configurar en Panel → Configuración → Enrutamiento → Valores predeterminados combinados.

Panel de salud

Accede a través de Panel → Salud. Descripción general del estado del sistema en tiempo real con 6 tarjetas:

Tarjeta	Lo que muestra
Estado del sistema	Tiempo de actividad, versión, uso de memoria, directorio de datos
Salud del proveedor	Estado del disyuntor por proveedor (cerrado/abierto/medio abierto)
Límites de tarifas	Tiempos de reutilización del límite de tasa activa por cuenta con tiempo restante
Bloqueos activos	Proveedores bloqueados temporalmente por la política de bloqueo
Caché de firma	Estadísticas de caché de deduplicación (claves activas, tasa de aciertos)
Telemetría de latencia	Agregación de latencia p50/p95/p99 por proveedor

Consejo profesional: La página Salud se actualiza automáticamente cada 10 segundos. Utilice la tarjeta del disyuntor para identificar qué proveedores están experimentando problemas.

FilesExpand file tree

USER_GUIDE.md

Latest commit

History

USER_GUIDE.md

File metadata and controls

Guía del usuario

Tabla de contenidos

💰 Precios de un vistazo

🎯 Casos de uso

Caso 1: "Tengo una suscripción a Claude Pro"

Caso 2: "Quiero coste cero"

Caso 3: "Necesito codificación 24 horas al día, 7 días a la semana, sin interrupciones"

Caso 4: "Quiero IA GRATIS en OpenClaw"

📖 Configuración del proveedor

🔐 Proveedores de suscripción

Código Claude (Pro/Max)

Códice OpenAI (Plus/Pro)

Gemini CLI (¡180K GRATIS/mes!)

Copiloto de GitHub

💰 Proveedores baratos

GLM-4.7 (Restablecimiento diario, $0,6/1 millón)

MiniMax M2.1 (reinicio de 5 h, $0,20/1 millón)

Kimi K2 ($9/mes fijo)

🆓 Proveedores GRATIS

iFlow (8 modelos GRATIS)

Qwen (3 modelos GRATIS)

Kiro (Claude GRATIS)

🎨Combinaciones

Ejemplo 1: Maximizar la suscripción → Copia de seguridad económica

Ejemplo 2: Solo gratuito (coste cero)

🔧 Integración CLI

Cursor IDE

Código Claude

CLI del Códice

Garra Abierta

Cline / Continuar / RooCode

🚀 Implementación

Implementación de VPS

acoplador

Variables de entorno

📊 Modelos disponibles

🧩 Funciones avanzadas

Modelos personalizados

Rutas de proveedores dedicadas

Configuración del proxy de red

API del catálogo de modelos

Sincronización en la nube

LLM Gateway Intelligence (Fase 9)

Patio de juegos del traductor

Estrategias de enrutamiento

Alias de modelo comodín

Cadenas de respaldo

Resiliencia y disyuntores

Exportación/Importación de base de datos

Panel de configuración

Gestión de costes y presupuesto

Transcripción de audio

Estrategias de equilibrio combinadas

Panel de salud