Skip to content

Latest commit

 

History

History
517 lines (339 loc) · 41.3 KB

File metadata and controls

517 lines (339 loc) · 41.3 KB

उपयोगकर्ता गाइड

🌐 Languages: 🇺🇸 English | 🇧🇷 Português (Brasil) | 🇪🇸 Español | 🇫🇷 Français | 🇮🇹 Italiano | 🇷🇺 Русский | 🇨🇳 中文 (简体) | 🇩🇪 Deutsch | 🇮🇳 हिन्दी | 🇹🇭 ไทย | 🇺🇦 Українська | 🇸🇦 العربية | 🇯🇵 日本語 | 🇻🇳 Tiếng Việt | 🇧🇬 Български | 🇩🇰 Dansk | 🇫🇮 Suomi | 🇮🇱 עברית | 🇭🇺 Magyar | 🇮🇩 Bahasa Indonesia | 🇰🇷 한국어 | 🇲🇾 Bahasa Melayu | 🇳🇱 Nederlands | 🇳🇴 Norsk | 🇵🇹 Português (Portugal) | 🇷🇴 Română | 🇵🇱 Polski | 🇸🇰 Slovenčina | 🇸🇪 Svenska | 🇵🇭 Filipino

प्रदाताओं को कॉन्फ़िगर करने, कॉम्बो बनाने, सीएलआई टूल को एकीकृत करने और ओमनीरूट को तैनात करने के लिए संपूर्ण मार्गदर्शिका।


सामग्री तालिका


💰 मूल्य निर्धारण एक नज़र में

टियर प्रदाता लागत कोटा रीसेट के लिए सर्वश्रेष्ठ
💳 सदस्यता क्लाउड कोड (प्रो) $20/माह 5 घंटे + साप्ताहिक पहले ही सदस्यता ले ली है
कोडेक्स (प्लस/प्रो) $20-200/महीना 5 घंटे + साप्ताहिक OpenAI उपयोगकर्ता
जेमिनी सीएलआई मुफ़्त 180K/माह + 1K/दिन सब लोग!
गिटहब कोपायलट $10-19/माह मासिक GitHub उपयोगकर्ता
🔑एपीआई कुंजी डीपसीक प्रति उपयोग भुगतान करें कोई नहीं सस्ता तर्क
ग्रोक प्रति उपयोग भुगतान करें कोई नहीं अल्ट्रा-फास्ट अनुमान
एक्सएआई (ग्रोक) प्रति उपयोग भुगतान करें कोई नहीं ग्रोक 4 तर्क
मिस्ट्रल प्रति उपयोग भुगतान करें कोई नहीं ईयू द्वारा होस्ट किए गए मॉडल
उलझन प्रति उपयोग भुगतान करें कोई नहीं खोज-संवर्धित
एक साथ एआई प्रति उपयोग भुगतान करें कोई नहीं ओपन-सोर्स मॉडल
आतिशबाजी एआई प्रति उपयोग भुगतान करें कोई नहीं फास्ट फ्लक्स छवियां
सेरेब्रस प्रति उपयोग भुगतान करें कोई नहीं वेफर-स्केल गति
सहभागी प्रति उपयोग भुगतान करें कोई नहीं कमांड आर+आरएजी
एनवीडिया एनआईएम प्रति उपयोग भुगतान करें कोई नहीं एंटरप्राइज़ मॉडल
💰सस्ता जीएलएम-4.7 $0.6/1 मिलियन प्रतिदिन सुबह 10 बजे बजट बैकअप
मिनीमैक्स एम2.1 $0.2/1 मिलियन 5 घंटे की रोलिंग सबसे सस्ता विकल्प
किमी K2 $9/महीना फ्लैट 10एम टोकन/माह अनुमानित लागत
🆓 मुफ़्त आईफ्लो $0 असीमित 8 मॉडल निःशुल्क
क्वेन $0 असीमित 3 मॉडल मुफ़्त
किरो $0 असीमित क्लाउड मुक्त

💡 प्रो टिप: जेमिनी सीएलआई (180 हजार निःशुल्क/माह) + आईफ्लो (असीमित निःशुल्क) कॉम्बो = $0 लागत से शुरू करें!


🎯 उपयोग के मामले

केस 1: "मेरे पास क्लाउड प्रो सदस्यता है"

समस्या: भारी कोडिंग के दौरान कोटा अप्रयुक्त, दर सीमा समाप्त हो जाता है

Combo: "maximize-claude"
  1. cc/claude-opus-4-6        (use subscription fully)
  2. glm/glm-4.7               (cheap backup when quota out)
  3. if/kimi-k2-thinking       (free emergency fallback)

Monthly cost: $20 (subscription) + ~$5 (backup) = $25 total
vs. $20 + hitting limits = frustration

केस 2: "मुझे शून्य लागत चाहिए"

समस्या: सदस्यताएं वहन नहीं कर सकते, विश्वसनीय एआई कोडिंग की आवश्यकता है

केस 3: "मुझे 24/7 कोडिंग चाहिए, कोई रुकावट नहीं"

समस्या: समय सीमा, डाउनटाइम बर्दाश्त नहीं कर सकते

Combo: "always-on"
  1. cc/claude-opus-4-6        (best quality)
  2. cx/gpt-5.2-codex          (second subscription)
  3. glm/glm-4.7               (cheap, resets daily)
  4. minimax/MiniMax-M2.1      (cheapest, 5h reset)
  5. if/kimi-k2-thinking       (free unlimited)

Result: 5 layers of fallback = zero downtime
Monthly cost: $20-200 (subscriptions) + $10-20 (backup)

केस 4: "मुझे ओपनक्लॉ में मुफ़्त एआई चाहिए"

समस्या: मैसेजिंग ऐप्स में AI सहायक की आवश्यकता है, पूरी तरह से निःशुल्क

Combo: "openclaw-free"
  1. if/glm-4.7                (unlimited free)
  2. if/minimax-m2.1           (unlimited free)
  3. if/kimi-k2-thinking       (unlimited free)

Monthly cost: $0
Access via: WhatsApp, Telegram, Slack, Discord, iMessage, Signal...

📖 प्रदाता सेटअप

🔐 सदस्यता प्रदाता

क्लाउड कोड (प्रो/मैक्स)

Dashboard → Providers → Connect Claude Code
→ OAuth login → Auto token refresh
→ 5-hour + weekly quota tracking

Models:
  cc/claude-opus-4-6
  cc/claude-sonnet-4-5-20250929
  cc/claude-haiku-4-5-20251001

प्रो टिप: जटिल कार्यों के लिए ओपस और गति के लिए सॉनेट का उपयोग करें। ओमनीरूट प्रति मॉडल कोटा ट्रैक करता है!

ओपनएआई कोडेक्स (प्लस/प्रो)

जेमिनी सीएलआई (मुफ़्त 180K/माह!)

सर्वोत्तम मूल्य: विशाल निःशुल्क स्तर! सशुल्क स्तरों से पहले इसका उपयोग करें।

गिटहब कोपायलट

Dashboard → Providers → Connect GitHub
→ OAuth via GitHub
→ Monthly reset (1st of month)

Models:
  gh/gpt-5
  gh/claude-4.5-sonnet
  gh/gemini-3-pro

💰 सस्ते प्रदाता

GLM-4.7 (दैनिक रीसेट, $0.6/1 मिलियन)

  1. साइन अप करें: Zhipu AI
  2. कोडिंग योजना से एपीआई कुंजी प्राप्त करें
  3. डैशबोर्ड → एपीआई कुंजी जोड़ें: प्रदाता: glm, एपीआई कुंजी: your-key

उपयोग करें: glm/glm-4.7 - प्रो टिप: कोडिंग प्लान 1/7 लागत पर 3× कोटा प्रदान करता है! प्रतिदिन सुबह 10:00 बजे रीसेट करें।

मिनीमैक्स एम2.1 (5 घंटे रीसेट, $0.20/1 मिलियन)

  1. साइन अप करें: MiniMax
  2. एपीआई कुंजी प्राप्त करें → डैशबोर्ड → एपीआई कुंजी जोड़ें

उपयोग करें: minimax/MiniMax-M2.1 - प्रो टिप: लंबे संदर्भ के लिए सबसे सस्ता विकल्प (1M टोकन)!

किमी K2 ($9/माह फ्लैट)

  1. सदस्यता लें: Moonshot AI
  2. एपीआई कुंजी प्राप्त करें → डैशबोर्ड → एपीआई कुंजी जोड़ें

उपयोग करें: kimi/kimi-latest - प्रो टिप: 10M टोकन के लिए निश्चित $9/माह = $0.90/1M प्रभावी लागत!

🆓 निःशुल्क प्रदाता

आईफ्लो (8 मुफ़्त मॉडल)

क्वेन (3 मुफ़्त मॉडल)

Dashboard → Connect Qwen → Device code auth → Unlimited usage

Models: qw/qwen3-coder-plus, qw/qwen3-coder-flash

किरो (क्लाउड फ्री)

Dashboard → Connect Kiro → AWS Builder ID or Google/GitHub → Unlimited

Models: kr/claude-sonnet-4.5, kr/claude-haiku-4.5

🎨कॉम्बोज़

उदाहरण 1: सदस्यता अधिकतम करें → सस्ता बैकअप

उदाहरण 2: केवल निःशुल्क (शून्य लागत)


🔧 सीएलआई एकीकरण

कर्सर आईडीई

क्लाउड कोड

संपादित करें ~/.claude/config.json:

कोडेक्स सीएलआई

ओपनक्लॉ

संपादित करें ~/.openclaw/openclaw.json:

या डैशबोर्ड का उपयोग करें: सीएलआई टूल्स → ओपनक्लॉ → ऑटो-कॉन्फ़िगरेशन

क्लाइन / जारी रखें / रूकोड


🚀 परिनियोजन

वीपीएस परिनियोजन

डॉकर

सीएलआई बायनेरिज़ के साथ होस्ट-एकीकृत मोड के लिए, मुख्य दस्तावेज़ में डॉकर अनुभाग देखें।

पर्यावरण चर

परिवर्तनीय डिफ़ॉल्ट विवरण
JWT_SECRET omniroute-default-secret-change-me JWT हस्ताक्षर रहस्य (उत्पादन में परिवर्तन)
INITIAL_PASSWORD 123456 पहला लॉगिन पासवर्ड
DATA_DIR ~/.omniroute डेटा निर्देशिका (डीबी, उपयोग, लॉग)
PORT फ्रेमवर्क डिफ़ॉल्ट सर्विस पोर्ट (उदाहरणों में 20128)
HOSTNAME फ्रेमवर्क डिफ़ॉल्ट बाइंड होस्ट (डॉकर डिफ़ॉल्ट रूप से 0.0.0.0)
NODE_ENV रनटाइम डिफ़ॉल्ट तैनाती के लिए production सेट करें
BASE_URL http://localhost:20128 सर्वर-साइड आंतरिक आधार URL
CLOUD_URL https://omniroute.dev क्लाउड सिंक एंडपॉइंट बेस यूआरएल
API_KEY_SECRET endpoint-proxy-api-key-secret जेनरेट की गई एपीआई कुंजियों के लिए एचएमएसी रहस्य
REQUIRE_API_KEY false /v1/* पर बियरर एपीआई कुंजी लागू करें
ENABLE_REQUEST_LOGS false अनुरोध/प्रतिक्रिया लॉग सक्षम करता है
AUTH_COOKIE_SECURE false फोर्स Secure ऑथ कुकी (HTTPS रिवर्स प्रॉक्सी के पीछे)

संपूर्ण पर्यावरण चर संदर्भ के लिए, README देखें।


📊 उपलब्ध मॉडल

सभी उपलब्ध मॉडल देखें

क्लाउड कोड (cc/) — प्रो/मैक्स: cc/claude-opus-4-6, cc/claude-sonnet-4-5-20250929, cc/claude-haiku-4-5-20251001

कोडेक्स (cx/) — प्लस/प्रो: cx/gpt-5.2-codex, cx/gpt-5.1-codex-max

मिथुन सीएलआई (gc/) — मुफ़्त: gc/gemini-3-flash-preview, gc/gemini-2.5-pro

गिटहब कोपायलट (gh/): gh/gpt-5, gh/claude-4.5-sonnet

जीएलएम (glm/) — $0.6/1M: glm/glm-4.7

मिनीमैक्स (minimax/) — $0.2/1M: minimax/MiniMax-M2.1

iFlow (if/) — मुफ़्त: if/kimi-k2-thinking, if/qwen3-coder-plus, if/deepseek-r1

क्वेन (qw/) — मुफ़्त: qw/qwen3-coder-plus, qw/qwen3-coder-flash

किरो (kr/) — मुफ़्त: kr/claude-sonnet-4.5, kr/claude-haiku-4.5

डीपसीक (ds/): ds/deepseek-chat, ds/deepseek-reasoner

ग्रोक (groq/): groq/llama-3.3-70b-versatile, groq/llama-4-maverick-17b-128e-instruct

xAI (xai/): xai/grok-4, xai/grok-4-0709-fast-reasoning, xai/grok-code-mini

मिस्ट्रल (mistral/): mistral/mistral-large-2501, mistral/codestral-2501

व्याकुलता (pplx/): pplx/sonar-pro, pplx/sonar

एक साथ AI (together/): together/meta-llama/Llama-3.3-70B-Instruct-Turbo

आतिशबाजी एआई (fireworks/): fireworks/accounts/fireworks/models/deepseek-v3p1

सेरेब्रस (cerebras/): cerebras/llama-3.3-70b

यहां (cohere/): cohere/command-r-plus-08-2024

एनवीडिया एनआईएम (nvidia/): nvidia/nvidia/llama-3.3-70b-instruct


🧩 उन्नत सुविधाएँ

कस्टम मॉडल

ऐप अपडेट की प्रतीक्षा किए बिना किसी भी प्रदाता से कोई भी मॉडल आईडी जोड़ें:

# Via API
curl -X POST http://localhost:20128/api/provider-models \
  -H "Content-Type: application/json" \
  -d '{"provider": "openai", "modelId": "gpt-4.5-preview", "modelName": "GPT-4.5 Preview"}'

# List: curl http://localhost:20128/api/provider-models?provider=openai
# Remove: curl -X DELETE "http://localhost:20128/api/provider-models?provider=openai&model=gpt-4.5-preview"

या डैशबोर्ड का उपयोग करें: प्रदाता → [प्रदाता] → कस्टम मॉडल

समर्पित प्रदाता मार्ग

मॉडल सत्यापन के साथ सीधे एक विशिष्ट प्रदाता को रूट अनुरोध:

गायब होने पर प्रदाता उपसर्ग स्वतः जुड़ जाता है। बेमेल मॉडल 400 लौटाते हैं।

नेटवर्क प्रॉक्सी कॉन्फ़िगरेशन

प्राथमिकता: कुंजी-विशिष्ट → कॉम्बो-विशिष्ट → प्रदाता-विशिष्ट → वैश्विक → पर्यावरण।

मॉडल कैटलॉग एपीआई

प्रदाता द्वारा प्रकारों (chat, embedding, image) के साथ समूहीकृत मॉडल लौटाता है।

क्लाउड सिंक

  • सभी डिवाइसों में सिंक प्रदाता, कॉम्बो और सेटिंग्स
  • टाइमआउट + फेल-फास्ट के साथ स्वचालित पृष्ठभूमि सिंक
  • उत्पादन में सर्वर-साइड BASE_URL/CLOUD_URL को प्राथमिकता दें

एलएलएम गेटवे इंटेलिजेंस (चरण 9)

  • सिमेंटिक कैश - ऑटो-कैश नॉन-स्ट्रीमिंग, तापमान = 0 प्रतिक्रियाएँ (X-OmniRoute-No-Cache: true के साथ बायपास)
  • इडेम्पोटेंसी का अनुरोध करें - Idempotency-Key या X-Request-Id हेडर के माध्यम से 5s के भीतर अनुरोधों को डीडुप्लिकेट करता है
  • प्रगति ट्रैकिंग - X-OmniRoute-Progress: true हेडर के माध्यम से SSE event: progress इवेंट में ऑप्ट-इन करें

अनुवादक खेल का मैदान

डैशबोर्ड → अनुवादक के माध्यम से पहुंच। डीबग करें और कल्पना करें कि कैसे ओमनीरूट प्रदाताओं के बीच एपीआई अनुरोधों का अनुवाद करता है।

मोड उद्देश्य
खेल का मैदान स्रोत/लक्ष्य प्रारूप चुनें, एक अनुरोध चिपकाएँ, और अनुवादित आउटपुट तुरंत देखें
चैट परीक्षक प्रॉक्सी के माध्यम से लाइव चैट संदेश भेजें और पूर्ण अनुरोध/प्रतिक्रिया चक्र का निरीक्षण करें
टेस्ट बेंच अनुवाद की शुद्धता को सत्यापित करने के लिए कई प्रारूप संयोजनों में बैच परीक्षण चलाएँ
लाइव मॉनिटर प्रॉक्सी के माध्यम से अनुरोध प्रवाहित होने पर वास्तविक समय में अनुवाद देखें

उपयोग के मामले:

  • डीबग करें कि कोई विशिष्ट ग्राहक/प्रदाता संयोजन विफल क्यों होता है
  • सत्यापित करें कि थिंकिंग टैग, टूल कॉल और सिस्टम प्रॉम्प्ट सही ढंग से अनुवाद करते हैं
  • ओपनएआई, क्लाउड, जेमिनी और रिस्पॉन्स एपीआई प्रारूपों के बीच प्रारूप अंतर की तुलना करें

रूटिंग रणनीतियाँ

डैशबोर्ड → सेटिंग्स → रूटिंग के माध्यम से कॉन्फ़िगर करें।

| रणनीति | विवरण | | -------------------------------- | ------------------------------------------------------------------------------------------------------------------ | ---------------------------------------------------------------------- | | पहले भरें | प्राथमिकता क्रम में खातों का उपयोग करता है - प्राथमिक खाता अनुपलब्ध होने तक सभी अनुरोधों को संभालता है | | राउंड रॉबिन | एक विन्यास योग्य चिपचिपा सीमा के साथ सभी खातों के माध्यम से चक्र (डिफ़ॉल्ट: प्रति खाता 3 कॉल) | | पी2सी (दो विकल्पों की शक्ति) | 2 यादृच्छिक खाते चुनता है और स्वस्थ खाते की ओर ले जाता है - स्वास्थ्य के प्रति जागरूकता के साथ भार संतुलित करता है | | यादृच्छिक | फिशर-येट्स शफल | का उपयोग करके प्रत्येक अनुरोध के लिए यादृच्छिक रूप से एक खाता चुनता है | | कम से कम इस्तेमाल | सबसे पुराने lastUsedAt टाइमस्टैम्प के साथ खाते तक रूट, ट्रैफ़िक को समान रूप से वितरित करना | | लागत अनुकूलित | सबसे कम लागत वाले प्रदाताओं के लिए अनुकूलन, सबसे कम प्राथमिकता मूल्य वाले खाते तक रूट |

वाइल्डकार्ड मॉडल उपनाम

मॉडल नामों को रीमैप करने के लिए वाइल्डकार्ड पैटर्न बनाएं:

वाइल्डकार्ड * (कोई भी वर्ण) और ? (एकल वर्ण) का समर्थन करते हैं।

फ़ॉलबैक चेन

वैश्विक फ़ॉलबैक श्रृंखलाओं को परिभाषित करें जो सभी अनुरोधों पर लागू होती हैं:


लचीलापन और सर्किट ब्रेकर

डैशबोर्ड → सेटिंग्स → लचीलापन के माध्यम से कॉन्फ़िगर करें।

ओमनीरूट चार घटकों के साथ प्रदाता-स्तरीय लचीलापन लागू करता है:

  1. प्रदाता प्रोफाइल - प्रति-प्रदाता कॉन्फ़िगरेशन:

    • विफलता सीमा (उद्घाटन से पहले कितनी विफलताएं)
    • कूलडाउन अवधि
    • दर सीमा का पता लगाने की संवेदनशीलता
    • घातीय बैकऑफ़ पैरामीटर
  2. संपादन योग्य दर सीमाएँ — डैशबोर्ड में कॉन्फ़िगर करने योग्य सिस्टम-स्तरीय डिफ़ॉल्ट:

    • प्रति मिनट अनुरोध (आरपीएम) - प्रति खाता प्रति मिनट अधिकतम अनुरोध
    • अनुरोधों के बीच न्यूनतम समय - अनुरोधों के बीच मिलीसेकंड में न्यूनतम अंतर
    • अधिकतम समवर्ती अनुरोध — प्रति खाता अधिकतम एक साथ अनुरोध
    • संशोधित करने के लिए संपादित करें पर क्लिक करें, फिर सहेजें या रद्द करें पर क्लिक करें। मान लचीलापन एपीआई के माध्यम से बने रहते हैं।
  3. सर्किट ब्रेकर - प्रति प्रदाता विफलताओं को ट्रैक करता है और सीमा तक पहुंचने पर स्वचालित रूप से सर्किट खोलता है:

    • बंद (स्वस्थ) - अनुरोध सामान्य रूप से प्रवाहित होते हैं
    • खुला - बार-बार विफलताओं के बाद प्रदाता अस्थायी रूप से अवरुद्ध हो जाता है
    • आधा_खुला — परीक्षण किया जा रहा है कि प्रदाता ठीक हो गया है या नहीं
  4. नीतियाँ और लॉक किए गए पहचानकर्ता - बल-अनलॉक क्षमता के साथ सर्किट ब्रेकर की स्थिति और लॉक किए गए पहचानकर्ताओं को दिखाता है।

  5. दर सीमा ऑटो-डिटेक्शन - प्रदाता दर सीमा से बचने के लिए 429 और Retry-After हेडर मॉनिटर करता है।

प्रो टिप: जब कोई प्रदाता आउटेज से उबरता है तो सभी सर्किट ब्रेकर और कूलडाउन को साफ़ करने के लिए रीसेट ऑल बटन का उपयोग करें।


डेटाबेस निर्यात/आयात

डैशबोर्ड → सेटिंग्स → सिस्टम और स्टोरेज में डेटाबेस बैकअप प्रबंधित करें।

कार्रवाई विवरण
डेटाबेस निर्यात करें वर्तमान SQLite डेटाबेस को .sqlite फ़ाइल के रूप में डाउनलोड करता है
सभी निर्यात करें (.tar.gz) एक पूर्ण बैकअप संग्रह डाउनलोड करता है जिसमें शामिल हैं: डेटाबेस, सेटिंग्स, कॉम्बो, प्रदाता कनेक्शन (कोई क्रेडेंशियल नहीं), एपीआई कुंजी मेटाडेटा
डेटाबेस आयात करें वर्तमान डेटाबेस को बदलने के लिए .sqlite फ़ाइल अपलोड करें। एक पूर्व-आयात बैकअप स्वचालित रूप से बनाया जाता है

आयात सत्यापन: आयातित फ़ाइल को अखंडता (SQLite प्राग्मा चेक), आवश्यक तालिकाओं (provider_connections, provider_nodes, combos, api_keys), और आकार (अधिकतम 100MB) के लिए मान्य किया गया है।

उपयोग के मामले:

  • मशीनों के बीच ओम्निरूट माइग्रेट करें
  • आपदा पुनर्प्राप्ति के लिए बाहरी बैकअप बनाएं
  • टीम के सदस्यों के बीच कॉन्फ़िगरेशन साझा करें (सभी निर्यात करें → संग्रह साझा करें)

सेटिंग्स डैशबोर्ड

आसान नेविगेशन के लिए सेटिंग पृष्ठ को 5 टैब में व्यवस्थित किया गया है:

टैब सामग्री
सुरक्षा लॉगिन/पासवर्ड सेटिंग्स, आईपी एक्सेस कंट्रोल, /models के लिए एपीआई प्रमाणीकरण, और प्रदाता ब्लॉकिंग
रूटिंग वैश्विक रूटिंग रणनीति (6 विकल्प), वाइल्डकार्ड मॉडल उपनाम, फ़ॉलबैक चेन, कॉम्बो डिफ़ॉल्ट
लचीलापन प्रदाता प्रोफाइल, संपादन योग्य दर सीमा, सर्किट ब्रेकर स्थिति, नीतियां और लॉक पहचानकर्ता
एआई बजट कॉन्फ़िगरेशन, ग्लोबल सिस्टम प्रॉम्प्ट इंजेक्शन, प्रॉम्प्ट कैश आँकड़े सोचना
उन्नत वैश्विक प्रॉक्सी कॉन्फ़िगरेशन (HTTP/SOCKS5)

लागत एवं बजट प्रबंधन

डैशबोर्ड → लागत के माध्यम से पहुंच।

टैब उद्देश्य
बजट दैनिक/साप्ताहिक/मासिक बजट और वास्तविक समय ट्रैकिंग के साथ प्रति एपीआई कुंजी खर्च सीमा निर्धारित करें
मूल्य निर्धारण मॉडल मूल्य निर्धारण प्रविष्टियाँ देखें और संपादित करें - प्रति प्रदाता प्रति 1K इनपुट/आउटपुट टोकन की लागत
# API: Set a budget
curl -X POST http://localhost:20128/api/usage/budget \
  -H "Content-Type: application/json" \
  -d '{"keyId": "key-123", "limit": 50.00, "period": "monthly"}'

# API: Get current budget status
curl http://localhost:20128/api/usage/budget

लागत ट्रैकिंग: प्रत्येक अनुरोध टोकन उपयोग को लॉग करता है और मूल्य निर्धारण तालिका का उपयोग करके लागत की गणना करता है। प्रदाता, मॉडल और एपीआई कुंजी द्वारा डैशबोर्ड → उपयोग में विश्लेषण देखें।


ऑडियो ट्रांसक्रिप्शन

ओमनीरूट ओपनएआई-संगत एंडपॉइंट के माध्यम से ऑडियो ट्रांसक्रिप्शन का समर्थन करता है:

POST /v1/audio/transcriptions
Authorization: Bearer your-api-key
Content-Type: multipart/form-data

# Example with curl
curl -X POST http://localhost:20128/v1/audio/transcriptions \
  -H "Authorization: Bearer your-api-key" \
  -F "file=@audio.mp3" \
  -F "model=deepgram/nova-3"

उपलब्ध प्रदाता: डीपग्राम (deepgram/), AssemblyAI (assemblyai/)।

समर्थित ऑडियो प्रारूप: mp3, wav, m4a, flac, ogg, webm


कॉम्बो संतुलन रणनीतियाँ

डैशबोर्ड → कॉम्बो → बनाएं/संपादित करें → रणनीति में प्रति-कॉम्बो संतुलन कॉन्फ़िगर करें।

रणनीति विवरण
राउंड-रॉबिन मॉडलों के माध्यम से क्रमिक रूप से घूमता है
प्राथमिकता हमेशा पहला मॉडल आज़माता है; केवल त्रुटि पर वापस आता है
यादृच्छिक प्रत्येक अनुरोध के लिए कॉम्बो से एक यादृच्छिक मॉडल चुनता है
भारित प्रति मॉडल निर्दिष्ट भार के आधार पर आनुपातिक रूप से मार्ग
कम से कम इस्तेमाल सबसे कम हालिया अनुरोधों के साथ मॉडल पर रूट (कॉम्बो मेट्रिक्स का उपयोग करता है)
लागत-अनुकूलित सबसे सस्ते उपलब्ध मॉडल के लिए मार्ग (मूल्य निर्धारण तालिका का उपयोग करता है)

ग्लोबल कॉम्बो डिफॉल्ट्स को डैशबोर्ड → सेटिंग्स → रूटिंग → कॉम्बो डिफॉल्ट्स में सेट किया जा सकता है।


स्वास्थ्य डैशबोर्ड

डैशबोर्ड → स्वास्थ्य के माध्यम से पहुंच। 6 कार्डों के साथ वास्तविक समय प्रणाली स्वास्थ्य अवलोकन:

कार्ड यह क्या दिखाता है
सिस्टम स्थिति अपटाइम, संस्करण, मेमोरी उपयोग, डेटा निर्देशिका
प्रदाता स्वास्थ्य प्रति-प्रदाता सर्किट ब्रेकर स्थिति (बंद/खुला/आधा-खुला)
दर सीमा शेष समय के साथ प्रति खाता सक्रिय दर सीमा को शांत करना
सक्रिय तालाबंदी प्रदाताओं को तालाबंदी नीति द्वारा अस्थायी रूप से अवरुद्ध कर दिया गया है
हस्ताक्षर कैश डिडुप्लीकेशन कैश आँकड़े (सक्रिय कुंजियाँ, हिट दर)
विलंबता टेलीमेट्री प्रति प्रदाता p50/p95/p99 विलंबता एकत्रीकरण

प्रो टिप: स्वास्थ्य पृष्ठ हर 10 सेकंड में स्वतः ताज़ा हो जाता है। यह पहचानने के लिए सर्किट ब्रेकर कार्ड का उपयोग करें कि कौन से प्रदाता समस्याओं का सामना कर रहे हैं।