Skip to content

Latest commit

 

History

History
559 lines (360 loc) · 41.8 KB

File metadata and controls

559 lines (360 loc) · 41.8 KB

उपयोगकर्ता गाइड

🌐 Languages: 🇺🇸 English | 🇧🇷 Português (Brasil) | 🇪🇸 Español | 🇫🇷 Français | 🇮🇹 Italiano | 🇷🇺 Русский | 🇨🇳 中文 (简体) | 🇩🇪 Deutsch | 🇮🇳 हिन्दी | 🇹🇭 ไทย | 🇺🇦 Українська | 🇸🇦 العربية | 🇯🇵 日本語 | 🇻🇳 Tiếng Việt | 🇧🇬 Български | 🇩🇰 Dansk | 🇫🇮 Suomi | 🇮🇱 עברית | 🇭🇺 Magyar | 🇮🇩 Bahasa Indonesia | 🇰🇷 한국어 | 🇲🇾 Bahasa Melayu | 🇳🇱 Nederlands | 🇳🇴 Norsk | 🇵🇹 Português (Portugal) | 🇷🇴 Română | 🇵🇱 Polski | 🇸🇰 Slovenčina | 🇸🇪 Svenska | 🇵🇭 Filipino

प्रदाताओं को कॉन्फ़िगर करने, कॉम्बो बनाने, सीएलआई टूल को एकीकृत करने और ओमनीरूट को तैनात करने के लिए संपूर्ण मार्गदर्शिका।


सामग्री तालिका


💰 मूल्य निर्धारण एक नज़र में

टियर प्रदाता लागत कोटा रीसेट के लिए सर्वश्रेष्ठ
💳 सदस्यता क्लाउड कोड (प्रो) $20/माह 5 घंटे + साप्ताहिक पहले ही सदस्यता ले ली है
कोडेक्स (प्लस/प्रो) $20-200/महीना 5 घंटे + साप्ताहिक OpenAI उपयोगकर्ता
जेमिनी सीएलआई मुफ़्त 180K/माह + 1K/दिन सब लोग!
गिटहब कोपायलट $10-19/माह मासिक GitHub उपयोगकर्ता
🔑एपीआई कुंजी डीपसीक प्रति उपयोग भुगतान करें कोई नहीं सस्ता तर्क
ग्रोक प्रति उपयोग भुगतान करें कोई नहीं अल्ट्रा-फास्ट अनुमान
एक्सएआई (ग्रोक) प्रति उपयोग भुगतान करें कोई नहीं ग्रोक 4 तर्क
मिस्ट्रल प्रति उपयोग भुगतान करें कोई नहीं ईयू द्वारा होस्ट किए गए मॉडल
उलझन प्रति उपयोग भुगतान करें कोई नहीं खोज-संवर्धित
एक साथ एआई प्रति उपयोग भुगतान करें कोई नहीं ओपन-सोर्स मॉडल
आतिशबाजी एआई प्रति उपयोग भुगतान करें कोई नहीं फास्ट फ्लक्स छवियां
सेरेब्रस प्रति उपयोग भुगतान करें कोई नहीं वेफर-स्केल गति
सहभागी प्रति उपयोग भुगतान करें कोई नहीं कमांड आर+आरएजी
एनवीडिया एनआईएम प्रति उपयोग भुगतान करें कोई नहीं एंटरप्राइज़ मॉडल
💰सस्ता जीएलएम-4.7 $0.6/1 मिलियन प्रतिदिन सुबह 10 बजे बजट बैकअप
मिनीमैक्स एम2.1 $0.2/1 मिलियन 5 घंटे की रोलिंग सबसे सस्ता विकल्प
किमी K2 $9/महीना फ्लैट 10एम टोकन/माह अनुमानित लागत
🆓 मुफ़्त आईफ्लो $0 असीमित 8 मॉडल निःशुल्क
क्वेन $0 असीमित 3 मॉडल मुफ़्त
किरो $0 असीमित क्लाउड मुक्त

💡 प्रो टिप: जेमिनी सीएलआई (180 हजार निःशुल्क/माह) + आईफ्लो (असीमित निःशुल्क) कॉम्बो = $0 लागत से शुरू करें!


🎯 उपयोग के मामले

केस 1: "मेरे पास क्लाउड प्रो सदस्यता है"

समस्या: भारी कोडिंग के दौरान कोटा अप्रयुक्त, दर सीमा समाप्त हो जाता है

Combo: "maximize-claude"
  1. cc/claude-opus-4-6        (use subscription fully)
  2. glm/glm-4.7               (cheap backup when quota out)
  3. if/kimi-k2-thinking       (free emergency fallback)

Monthly cost: $20 (subscription) + ~$5 (backup) = $25 total
vs. $20 + hitting limits = frustration

केस 2: "मुझे शून्य लागत चाहिए"

समस्या: सदस्यताएं वहन नहीं कर सकते, विश्वसनीय एआई कोडिंग की आवश्यकता है

OMNI_टोकन_1

केस 3: "मुझे 24/7 कोडिंग चाहिए, कोई रुकावट नहीं"

समस्या: समय सीमा, डाउनटाइम बर्दाश्त नहीं कर सकते

Combo: "always-on"
  1. cc/claude-opus-4-6        (best quality)
  2. cx/gpt-5.2-codex          (second subscription)
  3. glm/glm-4.7               (cheap, resets daily)
  4. minimax/MiniMax-M2.1      (cheapest, 5h reset)
  5. if/kimi-k2-thinking       (free unlimited)

Result: 5 layers of fallback = zero downtime
Monthly cost: $20-200 (subscriptions) + $10-20 (backup)

केस 4: "मुझे ओपनक्लॉ में मुफ़्त एआई चाहिए"

समस्या: मैसेजिंग ऐप्स में AI सहायक की आवश्यकता है, पूरी तरह से निःशुल्क

Combo: "openclaw-free"
  1. if/glm-4.7                (unlimited free)
  2. if/minimax-m2.1           (unlimited free)
  3. if/kimi-k2-thinking       (unlimited free)

Monthly cost: $0
Access via: WhatsApp, Telegram, Slack, Discord, iMessage, Signal...

📖 प्रदाता सेटअप

🔐 सदस्यता प्रदाता

क्लाउड कोड (प्रो/मैक्स)

Dashboard → Providers → Connect Claude Code
→ OAuth login → Auto token refresh
→ 5-hour + weekly quota tracking

Models:
  cc/claude-opus-4-6
  cc/claude-sonnet-4-5-20250929
  cc/claude-haiku-4-5-20251001

प्रो टिप: जटिल कार्यों के लिए ओपस और गति के लिए सॉनेट का उपयोग करें। ओमनीरूट प्रति मॉडल कोटा ट्रैक करता है!

ओपनएआई कोडेक्स (प्लस/प्रो)

OMNI_टोकन_5

जेमिनी सीएलआई (मुफ़्त 180K/माह!)

OMNI_टोकन_6

सर्वोत्तम मूल्य: विशाल निःशुल्क स्तर! सशुल्क स्तरों से पहले इसका उपयोग करें।

गिटहब कोपायलट

Dashboard → Providers → Connect GitHub
→ OAuth via GitHub
→ Monthly reset (1st of month)

Models:
  gh/gpt-5
  gh/claude-4.5-sonnet
  gh/gemini-3-pro

💰 सस्ते प्रदाता

GLM-4.7 (दैनिक रीसेट, $0.6/1 मिलियन)

  1. साइन अप करें: Zhipu AI
  2. कोडिंग योजना से एपीआई कुंजी प्राप्त करें
  3. डैशबोर्ड → एपीआई कुंजी जोड़ें: प्रदाता: glm, एपीआई कुंजी: your-key

उपयोग करें: glm/glm-4.7 - प्रो टिप: कोडिंग प्लान 1/7 लागत पर 3× कोटा प्रदान करता है! प्रतिदिन सुबह 10:00 बजे रीसेट करें।

मिनीमैक्स एम2.1 (5 घंटे रीसेट, $0.20/1 मिलियन)

  1. साइन अप करें: MiniMax
  2. एपीआई कुंजी प्राप्त करें → डैशबोर्ड → एपीआई कुंजी जोड़ें

उपयोग करें: minimax/MiniMax-M2.1 - प्रो टिप: लंबे संदर्भ के लिए सबसे सस्ता विकल्प (1M टोकन)!

किमी K2 ($9/माह फ्लैट)

  1. सदस्यता लें: Moonshot AI
  2. एपीआई कुंजी प्राप्त करें → डैशबोर्ड → एपीआई कुंजी जोड़ें

उपयोग करें: kimi/kimi-latest - प्रो टिप: 10M टोकन के लिए निश्चित $9/माह = $0.90/1M प्रभावी लागत!

🆓 निःशुल्क प्रदाता

आईफ्लो (8 मुफ़्त मॉडल)

OMNI_टोकन_8

क्वेन (3 मुफ़्त मॉडल)

Dashboard → Connect Qwen → Device code auth → Unlimited usage

Models: qw/qwen3-coder-plus, qw/qwen3-coder-flash

किरो (क्लाउड फ्री)

Dashboard → Connect Kiro → AWS Builder ID or Google/GitHub → Unlimited

Models: kr/claude-sonnet-4.5, kr/claude-haiku-4.5

🎨कॉम्बोज़

उदाहरण 1: सदस्यता अधिकतम करें → सस्ता बैकअप

OMNI_टोकन_11

उदाहरण 2: केवल निःशुल्क (शून्य लागत)

OMNI_टोकन_12


🔧 सीएलआई एकीकरण

कर्सर आईडीई

OMNI_टोकन_13

क्लाउड कोड

संपादित करें ~/.claude/config.json:

OMNI_टोकन_14

कोडेक्स सीएलआई

OMNI_टोकन_15

ओपनक्लॉ

संपादित करें ~/.openclaw/openclaw.json:

OMNI_टोकन_16

या डैशबोर्ड का उपयोग करें: सीएलआई टूल्स → ओपनक्लॉ → ऑटो-कॉन्फ़िगरेशन

क्लाइन / जारी रखें / रूकोड

OMNI_टोकन_17


🚀 परिनियोजन

वीपीएस परिनियोजन

OMNI_टोकन_18

डॉकर

OMNI_टोकन_19

सीएलआई बायनेरिज़ के साथ होस्ट-एकीकृत मोड के लिए, मुख्य दस्तावेज़ में डॉकर अनुभाग देखें।

पर्यावरण चर

परिवर्तनीय डिफ़ॉल्ट विवरण
JWT_SECRET omniroute-default-secret-change-me JWT हस्ताक्षर रहस्य (उत्पादन में परिवर्तन)
INITIAL_PASSWORD 123456 पहला लॉगिन पासवर्ड
DATA_DIR ~/.omniroute डेटा निर्देशिका (डीबी, उपयोग, लॉग)
PORT फ्रेमवर्क डिफ़ॉल्ट सर्विस पोर्ट (उदाहरणों में 20128)
HOSTNAME फ्रेमवर्क डिफ़ॉल्ट बाइंड होस्ट (डॉकर डिफ़ॉल्ट रूप से 0.0.0.0)
NODE_ENV रनटाइम डिफ़ॉल्ट तैनाती के लिए production सेट करें
BASE_URL http://localhost:20128 सर्वर-साइड आंतरिक आधार URL
CLOUD_URL https://omniroute.dev क्लाउड सिंक एंडपॉइंट बेस यूआरएल
API_KEY_SECRET endpoint-proxy-api-key-secret जेनरेट की गई एपीआई कुंजियों के लिए एचएमएसी रहस्य
REQUIRE_API_KEY false /v1/* पर बियरर एपीआई कुंजी लागू करें
ENABLE_REQUEST_LOGS false अनुरोध/प्रतिक्रिया लॉग सक्षम करता है
AUTH_COOKIE_SECURE false फोर्स Secure ऑथ कुकी (HTTPS रिवर्स प्रॉक्सी के पीछे)

संपूर्ण पर्यावरण चर संदर्भ के लिए, README देखें।


📊 उपलब्ध मॉडल

OMNI_टोकन_157

सभी उपलब्ध मॉडल देखें

क्लाउड कोड (cc/) — प्रो/मैक्स: cc/claude-opus-4-6, cc/claude-sonnet-4-5-20250929, cc/claude-haiku-4-5-20251001

कोडेक्स (cx/) — प्लस/प्रो: cx/gpt-5.2-codex, cx/gpt-5.1-codex-max

मिथुन सीएलआई (gc/) — मुफ़्त: gc/gemini-3-flash-preview, gc/gemini-2.5-pro

गिटहब कोपायलट (gh/): gh/gpt-5, gh/claude-4.5-sonnet

जीएलएम (glm/) — $0.6/1M: glm/glm-4.7

मिनीमैक्स (minimax/) — $0.2/1M: minimax/MiniMax-M2.1

iFlow (if/) — मुफ़्त: if/kimi-k2-thinking, if/qwen3-coder-plus, if/deepseek-r1

क्वेन (qw/) — मुफ़्त: qw/qwen3-coder-plus, qw/qwen3-coder-flash

किरो (kr/) — मुफ़्त: kr/claude-sonnet-4.5, kr/claude-haiku-4.5

डीपसीक (ds/): ds/deepseek-chat, ds/deepseek-reasoner

ग्रोक (groq/): groq/llama-3.3-70b-versatile, groq/llama-4-maverick-17b-128e-instruct

xAI (xai/): xai/grok-4, xai/grok-4-0709-fast-reasoning, xai/grok-code-mini

मिस्ट्रल (mistral/): mistral/mistral-large-2501, mistral/codestral-2501

व्याकुलता (pplx/): pplx/sonar-pro, pplx/sonar

एक साथ AI (together/): together/meta-llama/Llama-3.3-70B-Instruct-Turbo

आतिशबाजी एआई (fireworks/): fireworks/accounts/fireworks/models/deepseek-v3p1

सेरेब्रस (cerebras/): cerebras/llama-3.3-70b

यहां (cohere/): cohere/command-r-plus-08-2024

एनवीडिया एनआईएम (nvidia/): nvidia/nvidia/llama-3.3-70b-instruct

OMNI_टोकन_162


🧩 उन्नत सुविधाएँ

कस्टम मॉडल

ऐप अपडेट की प्रतीक्षा किए बिना किसी भी प्रदाता से कोई भी मॉडल आईडी जोड़ें:

# Via API
curl -X POST http://localhost:20128/api/provider-models \
  -H "Content-Type: application/json" \
  -d '{"provider": "openai", "modelId": "gpt-4.5-preview", "modelName": "GPT-4.5 Preview"}'

# List: curl http://localhost:20128/api/provider-models?provider=openai
# Remove: curl -X DELETE "http://localhost:20128/api/provider-models?provider=openai&model=gpt-4.5-preview"

या डैशबोर्ड का उपयोग करें: प्रदाता → [प्रदाता] → कस्टम मॉडल

समर्पित प्रदाता मार्ग

मॉडल सत्यापन के साथ सीधे एक विशिष्ट प्रदाता को रूट अनुरोध:

OMNI_टोकन_21

गायब होने पर प्रदाता उपसर्ग स्वतः जुड़ जाता है। बेमेल मॉडल 400 लौटाते हैं।

नेटवर्क प्रॉक्सी कॉन्फ़िगरेशन

OMNI_टोकन_22

प्राथमिकता: कुंजी-विशिष्ट → कॉम्बो-विशिष्ट → प्रदाता-विशिष्ट → वैश्विक → पर्यावरण।

मॉडल कैटलॉग एपीआई

OMNI_टोकन_23

प्रदाता द्वारा प्रकारों (chat, embedding, image) के साथ समूहीकृत मॉडल लौटाता है।

क्लाउड सिंक

  • सभी डिवाइसों में सिंक प्रदाता, कॉम्बो और सेटिंग्स
  • टाइमआउट + फेल-फास्ट के साथ स्वचालित पृष्ठभूमि सिंक
  • उत्पादन में सर्वर-साइड BASE_URL/CLOUD_URL को प्राथमिकता दें

एलएलएम गेटवे इंटेलिजेंस (चरण 9)

  • सिमेंटिक कैश - ऑटो-कैश नॉन-स्ट्रीमिंग, तापमान = 0 प्रतिक्रियाएँ (X-OmniRoute-No-Cache: true के साथ बायपास)
  • इडेम्पोटेंसी का अनुरोध करें - Idempotency-Key या X-Request-Id हेडर के माध्यम से 5s के भीतर अनुरोधों को डीडुप्लिकेट करता है
  • प्रगति ट्रैकिंग - X-OmniRoute-Progress: true हेडर के माध्यम से SSE event: progress इवेंट में ऑप्ट-इन करें

अनुवादक खेल का मैदान

डैशबोर्ड → अनुवादक के माध्यम से पहुंच। डीबग करें और कल्पना करें कि कैसे ओमनीरूट प्रदाताओं के बीच एपीआई अनुरोधों का अनुवाद करता है।

मोड उद्देश्य
खेल का मैदान स्रोत/लक्ष्य प्रारूप चुनें, एक अनुरोध चिपकाएँ, और अनुवादित आउटपुट तुरंत देखें
चैट परीक्षक प्रॉक्सी के माध्यम से लाइव चैट संदेश भेजें और पूर्ण अनुरोध/प्रतिक्रिया चक्र का निरीक्षण करें
टेस्ट बेंच अनुवाद की शुद्धता को सत्यापित करने के लिए कई प्रारूप संयोजनों में बैच परीक्षण चलाएँ
लाइव मॉनिटर प्रॉक्सी के माध्यम से अनुरोध प्रवाहित होने पर वास्तविक समय में अनुवाद देखें

उपयोग के मामले:

  • डीबग करें कि कोई विशिष्ट ग्राहक/प्रदाता संयोजन विफल क्यों होता है
  • सत्यापित करें कि थिंकिंग टैग, टूल कॉल और सिस्टम प्रॉम्प्ट सही ढंग से अनुवाद करते हैं
  • ओपनएआई, क्लाउड, जेमिनी और रिस्पॉन्स एपीआई प्रारूपों के बीच प्रारूप अंतर की तुलना करें

रूटिंग रणनीतियाँ

डैशबोर्ड → सेटिंग्स → रूटिंग के माध्यम से कॉन्फ़िगर करें।

| रणनीति | विवरण | | -------------------------------- | ------------------------------------------------------------------------------------------------------------------ | ---------------------------------------------------------------------- | | पहले भरें | प्राथमिकता क्रम में खातों का उपयोग करता है - प्राथमिक खाता अनुपलब्ध होने तक सभी अनुरोधों को संभालता है | | राउंड रॉबिन | एक विन्यास योग्य चिपचिपा सीमा के साथ सभी खातों के माध्यम से चक्र (डिफ़ॉल्ट: प्रति खाता 3 कॉल) | | पी2सी (दो विकल्पों की शक्ति) | 2 यादृच्छिक खाते चुनता है और स्वस्थ खाते की ओर ले जाता है - स्वास्थ्य के प्रति जागरूकता के साथ भार संतुलित करता है | | यादृच्छिक | फिशर-येट्स शफल | का उपयोग करके प्रत्येक अनुरोध के लिए यादृच्छिक रूप से एक खाता चुनता है | | कम से कम इस्तेमाल | सबसे पुराने lastUsedAt टाइमस्टैम्प के साथ खाते तक रूट, ट्रैफ़िक को समान रूप से वितरित करना | | लागत अनुकूलित | सबसे कम लागत वाले प्रदाताओं के लिए अनुकूलन, सबसे कम प्राथमिकता मूल्य वाले खाते तक रूट |

वाइल्डकार्ड मॉडल उपनाम

मॉडल नामों को रीमैप करने के लिए वाइल्डकार्ड पैटर्न बनाएं:

OMNI_टोकन_24

वाइल्डकार्ड * (कोई भी वर्ण) और ? (एकल वर्ण) का समर्थन करते हैं।

फ़ॉलबैक चेन

वैश्विक फ़ॉलबैक श्रृंखलाओं को परिभाषित करें जो सभी अनुरोधों पर लागू होती हैं:

OMNI_टोकन_25


लचीलापन और सर्किट ब्रेकर

डैशबोर्ड → सेटिंग्स → लचीलापन के माध्यम से कॉन्फ़िगर करें।

ओमनीरूट चार घटकों के साथ प्रदाता-स्तरीय लचीलापन लागू करता है:

  1. प्रदाता प्रोफाइल - प्रति-प्रदाता कॉन्फ़िगरेशन:

    • विफलता सीमा (उद्घाटन से पहले कितनी विफलताएं)
    • कूलडाउन अवधि
    • दर सीमा का पता लगाने की संवेदनशीलता
    • घातीय बैकऑफ़ पैरामीटर
  2. संपादन योग्य दर सीमाएँ — डैशबोर्ड में कॉन्फ़िगर करने योग्य सिस्टम-स्तरीय डिफ़ॉल्ट:

    • प्रति मिनट अनुरोध (आरपीएम) - प्रति खाता प्रति मिनट अधिकतम अनुरोध
    • अनुरोधों के बीच न्यूनतम समय - अनुरोधों के बीच मिलीसेकंड में न्यूनतम अंतर
    • अधिकतम समवर्ती अनुरोध — प्रति खाता अधिकतम एक साथ अनुरोध
    • संशोधित करने के लिए संपादित करें पर क्लिक करें, फिर सहेजें या रद्द करें पर क्लिक करें। मान लचीलापन एपीआई के माध्यम से बने रहते हैं।
  3. सर्किट ब्रेकर - प्रति प्रदाता विफलताओं को ट्रैक करता है और सीमा तक पहुंचने पर स्वचालित रूप से सर्किट खोलता है:

    • बंद (स्वस्थ) - अनुरोध सामान्य रूप से प्रवाहित होते हैं
    • खुला - बार-बार विफलताओं के बाद प्रदाता अस्थायी रूप से अवरुद्ध हो जाता है
    • आधा_खुला — परीक्षण किया जा रहा है कि प्रदाता ठीक हो गया है या नहीं
  4. नीतियाँ और लॉक किए गए पहचानकर्ता - बल-अनलॉक क्षमता के साथ सर्किट ब्रेकर की स्थिति और लॉक किए गए पहचानकर्ताओं को दिखाता है।

  5. दर सीमा ऑटो-डिटेक्शन - प्रदाता दर सीमा से बचने के लिए 429 और Retry-After हेडर मॉनिटर करता है।

प्रो टिप: जब कोई प्रदाता आउटेज से उबरता है तो सभी सर्किट ब्रेकर और कूलडाउन को साफ़ करने के लिए रीसेट ऑल बटन का उपयोग करें।


डेटाबेस निर्यात/आयात

डैशबोर्ड → सेटिंग्स → सिस्टम और स्टोरेज में डेटाबेस बैकअप प्रबंधित करें।

कार्रवाई विवरण
डेटाबेस निर्यात करें वर्तमान SQLite डेटाबेस को .sqlite फ़ाइल के रूप में डाउनलोड करता है
सभी निर्यात करें (.tar.gz) एक पूर्ण बैकअप संग्रह डाउनलोड करता है जिसमें शामिल हैं: डेटाबेस, सेटिंग्स, कॉम्बो, प्रदाता कनेक्शन (कोई क्रेडेंशियल नहीं), एपीआई कुंजी मेटाडेटा
डेटाबेस आयात करें वर्तमान डेटाबेस को बदलने के लिए .sqlite फ़ाइल अपलोड करें। एक पूर्व-आयात बैकअप स्वचालित रूप से बनाया जाता है

OMNI_टोकन_26

आयात सत्यापन: आयातित फ़ाइल को अखंडता (SQLite प्राग्मा चेक), आवश्यक तालिकाओं (provider_connections, provider_nodes, combos, api_keys), और आकार (अधिकतम 100MB) के लिए मान्य किया गया है।

उपयोग के मामले:

  • मशीनों के बीच ओम्निरूट माइग्रेट करें
  • आपदा पुनर्प्राप्ति के लिए बाहरी बैकअप बनाएं
  • टीम के सदस्यों के बीच कॉन्फ़िगरेशन साझा करें (सभी निर्यात करें → संग्रह साझा करें)

सेटिंग्स डैशबोर्ड

आसान नेविगेशन के लिए सेटिंग पृष्ठ को 5 टैब में व्यवस्थित किया गया है:

टैब सामग्री
सुरक्षा लॉगिन/पासवर्ड सेटिंग्स, आईपी एक्सेस कंट्रोल, /models के लिए एपीआई प्रमाणीकरण, और प्रदाता ब्लॉकिंग
रूटिंग वैश्विक रूटिंग रणनीति (6 विकल्प), वाइल्डकार्ड मॉडल उपनाम, फ़ॉलबैक चेन, कॉम्बो डिफ़ॉल्ट
लचीलापन प्रदाता प्रोफाइल, संपादन योग्य दर सीमा, सर्किट ब्रेकर स्थिति, नीतियां और लॉक पहचानकर्ता
एआई बजट कॉन्फ़िगरेशन, ग्लोबल सिस्टम प्रॉम्प्ट इंजेक्शन, प्रॉम्प्ट कैश आँकड़े सोचना
उन्नत वैश्विक प्रॉक्सी कॉन्फ़िगरेशन (HTTP/SOCKS5)

लागत एवं बजट प्रबंधन

डैशबोर्ड → लागत के माध्यम से पहुंच।

टैब उद्देश्य
बजट दैनिक/साप्ताहिक/मासिक बजट और वास्तविक समय ट्रैकिंग के साथ प्रति एपीआई कुंजी खर्च सीमा निर्धारित करें
मूल्य निर्धारण मॉडल मूल्य निर्धारण प्रविष्टियाँ देखें और संपादित करें - प्रति प्रदाता प्रति 1K इनपुट/आउटपुट टोकन की लागत
# API: Set a budget
curl -X POST http://localhost:20128/api/usage/budget \
  -H "Content-Type: application/json" \
  -d '{"keyId": "key-123", "limit": 50.00, "period": "monthly"}'

# API: Get current budget status
curl http://localhost:20128/api/usage/budget

लागत ट्रैकिंग: प्रत्येक अनुरोध टोकन उपयोग को लॉग करता है और मूल्य निर्धारण तालिका का उपयोग करके लागत की गणना करता है। प्रदाता, मॉडल और एपीआई कुंजी द्वारा डैशबोर्ड → उपयोग में विश्लेषण देखें।


ऑडियो ट्रांसक्रिप्शन

ओमनीरूट ओपनएआई-संगत एंडपॉइंट के माध्यम से ऑडियो ट्रांसक्रिप्शन का समर्थन करता है:

POST /v1/audio/transcriptions
Authorization: Bearer your-api-key
Content-Type: multipart/form-data

# Example with curl
curl -X POST http://localhost:20128/v1/audio/transcriptions \
  -H "Authorization: Bearer your-api-key" \
  -F "file=@audio.mp3" \
  -F "model=deepgram/nova-3"

उपलब्ध प्रदाता: डीपग्राम (deepgram/), AssemblyAI (assemblyai/)।

समर्थित ऑडियो प्रारूप: mp3, wav, m4a, flac, ogg, webm


कॉम्बो संतुलन रणनीतियाँ

डैशबोर्ड → कॉम्बो → बनाएं/संपादित करें → रणनीति में प्रति-कॉम्बो संतुलन कॉन्फ़िगर करें।

रणनीति विवरण
राउंड-रॉबिन मॉडलों के माध्यम से क्रमिक रूप से घूमता है
प्राथमिकता हमेशा पहला मॉडल आज़माता है; केवल त्रुटि पर वापस आता है
यादृच्छिक प्रत्येक अनुरोध के लिए कॉम्बो से एक यादृच्छिक मॉडल चुनता है
भारित प्रति मॉडल निर्दिष्ट भार के आधार पर आनुपातिक रूप से मार्ग
कम से कम इस्तेमाल सबसे कम हालिया अनुरोधों के साथ मॉडल पर रूट (कॉम्बो मेट्रिक्स का उपयोग करता है)
लागत-अनुकूलित सबसे सस्ते उपलब्ध मॉडल के लिए मार्ग (मूल्य निर्धारण तालिका का उपयोग करता है)

ग्लोबल कॉम्बो डिफॉल्ट्स को डैशबोर्ड → सेटिंग्स → रूटिंग → कॉम्बो डिफॉल्ट्स में सेट किया जा सकता है।


स्वास्थ्य डैशबोर्ड

डैशबोर्ड → स्वास्थ्य के माध्यम से पहुंच। 6 कार्डों के साथ वास्तविक समय प्रणाली स्वास्थ्य अवलोकन:

कार्ड यह क्या दिखाता है
सिस्टम स्थिति अपटाइम, संस्करण, मेमोरी उपयोग, डेटा निर्देशिका
प्रदाता स्वास्थ्य प्रति-प्रदाता सर्किट ब्रेकर स्थिति (बंद/खुला/आधा-खुला)
दर सीमा शेष समय के साथ प्रति खाता सक्रिय दर सीमा को शांत करना
सक्रिय तालाबंदी प्रदाताओं को तालाबंदी नीति द्वारा अस्थायी रूप से अवरुद्ध कर दिया गया है
हस्ताक्षर कैश डिडुप्लीकेशन कैश आँकड़े (सक्रिय कुंजियाँ, हिट दर)
विलंबता टेलीमेट्री प्रति प्रदाता p50/p95/p99 विलंबता एकत्रीकरण

प्रो टिप: स्वास्थ्य पृष्ठ हर 10 सेकंड में स्वतः ताज़ा हो जाता है। यह पहचानने के लिए सर्किट ब्रेकर कार्ड का उपयोग करें कि कौन से प्रदाता समस्याओं का सामना कर रहे हैं।