LLM

डॉकर मॉडल रनर चीटशीट: कमांड्स और उदाहरण

डॉकर मॉडल रनर चीटशीट: कमांड्स और उदाहरण

डॉकर मॉडल रनर कमांड्स के लिए त्वरित संदर्भ

डॉकर मॉडल रनर (डीएमआर) डॉकर का आधिकारिक समाधान है जो स्थानीय रूप से एआई मॉडल चलाने के लिए है, जो अप्रैल 2025 में पेश किया गया था। यह चीटशीट सभी आवश्यक कमांड्स, कॉन्फ़िगरेशन, और बेस्ट प्रैक्टिसेस के लिए एक तेज़ संदर्भ प्रदान करता है।

डॉकर मॉडल रनर बनाम ओल्लामा: किसे चुनना चाहिए?

डॉकर मॉडल रनर बनाम ओल्लामा: किसे चुनना चाहिए?

डॉकर मॉडल रनर और ओल्लामा को स्थानीय एलएलएम के लिए तुलना करें

स्थानीय रूप से बड़े भाषा मॉडल (LLMs) चलाना अब गोपनीयता, लागत नियंत्रण, और ऑफ़लाइन क्षमताओं के लिए increasingly popular हो गया है। अप्रैल 2025 में, जब Docker ने Docker Model Runner (DMR) पेश किया, तो परिदृश्य महत्वपूर्ण रूप से बदल गया, जो AI मॉडल डिप्लॉयमेंट के लिए इसका आधिकारिक समाधान है।

एलएलएम एएसआईसी का उदय: इन्फरेंस हार्डवेयर क्यों महत्वपूर्ण है

एलएलएम एएसआईसी का उदय: इन्फरेंस हार्डवेयर क्यों महत्वपूर्ण है

खास चिप्स AI इन्फरेंस को तेज़ और सस्ता बना रहे हैं

भविष्य की AI केवल अधिक बुद्धिमान मॉडल्स के बारे में नहीं है - यह अधिक बुद्धिमान सिलिकॉन के बारे में है। LLM इन्फरेंस के लिए विशेषीकृत हार्डवेयर एक क्रांति को चलाने में मदद कर रहा है जो बिटकॉइन माइनिंग के ASICs की ओर शिफ्ट के समान है।

DGX Spark vs. Mac Studio: NVIDIA के व्यक्तिगत AI सुपरकंप्यूटर की कीमत की तुलना

DGX Spark vs. Mac Studio: NVIDIA के व्यक्तिगत AI सुपरकंप्यूटर की कीमत की तुलना

उपलब्धता, छह देशों में वास्तविक रिटेल मूल्य, और मैक स्टूडियो के साथ तुलना।

NVIDIA DGX Spark वास्तविक है, बिक्री 15 अक्टूबर, 2025 से, और यह CUDA डेवलपर्स के लिए बनाया गया है जो स्थानीय LLM कार्य के लिए एक एकीकृत NVIDIA AI स्टैक की आवश्यकता रखते हैं। यूएस एमएसआरपी $3,999; UK/DE/JP रिटेल अधिक है VAT और चैनल के कारण। AUD/KRW सार्वजनिक स्टिकर मूल्य अभी तक व्यापक रूप से पोस्ट नहीं किए गए हैं

तुलना: क्वेन3:30बी vs जीपीटी-ओएसएस:20बी

तुलना: क्वेन3:30बी vs जीपीटी-ओएसएस:20बी

इन दो मॉडलों की गति, पैरामीटर्स और प्रदर्शन का तुलनात्मक अध्ययन

यहाँ Qwen3:30b और GPT-OSS:20b के बीच तुलना है, जो निर्देश पालन और प्रदर्शन पैरामीटर्स, स्पेसिफिकेशन्स और गति पर केंद्रित है:

ओल्लामा को पाइथन के साथ एकीकृत करना: REST API और पाइथन क्लाइंट उदाहरण

ओल्लामा को पाइथन के साथ एकीकृत करना: REST API और पाइथन क्लाइंट उदाहरण

+ सोचने वाले LLMs का उपयोग करने के विशिष्ट उदाहरण

इस पोस्ट में, हम दो तरीकों का पता लगाएंगे जिससे आप अपने Python एप्लिकेशन को Ollama से कनेक्ट कर सकते हैं: 1. HTTP REST API के माध्यम से; 2. अधिकृत Ollama Python लाइब्रेरी के माध्यम से।

ओलामा जीपीटी-ओएसएस संरचित आउटपुट समस्याएँ

ओलामा जीपीटी-ओएसएस संरचित आउटपुट समस्याएँ

बहुत अच्छा नहीं।

Ollama के GPT-OSS मॉडल्स में संरचित आउटपुट को हैंडल करने में बार-बार समस्याएं आती हैं, विशेष रूप से जब उन्हें LangChain, OpenAI SDK, vllm जैसे फ्रेमवर्क्स के साथ उपयोग किया जाता है, और अन्य।

लोकप्रिय एलएलएम प्रदाताओं - ओपनएआई, जेमिनी, एंथ्रोपिक, मिस्ट्रल और एडब्ल्यूएस बेड्रॉक के बीच संरचित आउटपुट तुलना

लोकप्रिय एलएलएम प्रदाताओं - ओपनएआई, जेमिनी, एंथ्रोपिक, मिस्ट्रल और एडब्ल्यूएस बेड्रॉक के बीच संरचित आउटपुट तुलना

अलग तरह के एपीआई के लिए विशेष दृष्टिकोण की आवश्यकता होती है।

यहाँ एक साइड-बाय-साइड सपोर्ट तुलना है संरचित आउटपुट (विश्वसनीय JSON प्राप्त करना) लोकप्रिय LLM प्रदाताओं के बीच, साथ ही न्यूनतम Python उदाहरण

संरचित आउटपुट के साथ एलएलएम को सीमित करना: ओल्लामा, क्वेन3 & पाइथन या गो

संरचित आउटपुट के साथ एलएलएम को सीमित करना: ओल्लामा, क्वेन3 & पाइथन या गो

Ollama से संरचित आउटपुट प्राप्त करने के कुछ तरीके

बड़े भाषा मॉडल (LLMs) शक्तिशाली हैं, लेकिन उत्पादन में हम आमतौर पर मुक्त-रूप पेराग्राफ नहीं चाहते। बजाय इसके, हम प्रत्याशित डेटा चाहते हैं: विशेषताएं, तथ्य, या संरचित वस्तुएं जिन्हें आप एक ऐप में फीड कर सकते हैं। यह है LLM संरचित आउटपुट

मेमोरी आवंटन मॉडल अनुसूचना नया संस्करण में - व0.12.1

मेमोरी आवंटन मॉडल अनुसूचना नया संस्करण में - व0.12.1

अपना खुद का परीक्षण ओलामा मॉडल शेड्यूलिंग

मैं नए ओल्लामा संस्करण में मॉडल के लिए आवंटित VRAM की तुलना (Ollama VRAM allocation) पुराने संस्करण के साथ कर रहा हूँ। नया संस्करण खराब है।

ओल्लामा एंशिटिफिकेशन - प्रारंभिक संकेत

ओल्लामा एंशिटिफिकेशन - प्रारंभिक संकेत

ओल्लामा विकास के वर्तमान स्थिति पर मेरा दृष्टिकोण

Ollama ने स्थानीय रूप से एलएलएम चलाने के लिए सबसे लोकप्रिय उपकरणों में से एक बनने में तेजी से प्रगति की है। इसके सरल सीएलआई और सुलभ मॉडल प्रबंधन ने इसे क्लाउड के बाहर एआई मॉडल्स के साथ काम करने वाले डेवलपर्स के लिए एक प्राथमिक विकल्प बना दिया है। लेकिन कई वादा करने वाले प्लेटफॉर्म की तरह, Enshittification के संकेत पहले से ही दिखाई देने लगे हैं:

स्थानीय ओल्लामा इंस्टेंस के लिए चैट यूआई

स्थानीय ओल्लामा इंस्टेंस के लिए चैट यूआई

2025 में ओल्लामा के लिए सबसे प्रमुख यूआई का त्वरित अवलोकन

स्थानीय रूप से होस्टेड Ollama आपको अपने मशीन पर बड़े भाषा मॉडल चलाने की अनुमति देता है, लेकिन कमांड-लाइन के माध्यम से इसका उपयोग करना उपयोगकर्ता-मित्र नहीं है। यहाँ कुछ ओपन-सोर्स प्रोजेक्ट्स हैं जो ChatGPT-स्टाइल इंटरफेस प्रदान करते हैं जो स्थानीय Ollama से कनेक्ट होते हैं।

एनवीडिया डीजीएक्स स्पार्क - नया छोटा एआई सुपरकंप्यूटर

एनवीडिया डीजीएक्स स्पार्क - नया छोटा एआई सुपरकंप्यूटर

जुलाई 2025 में, जल्द ही यह उपलब्ध हो जाना चाहिए

एनवीडिया DGX स्पार्क जारी करने वाला है NVIDIA DGX स्पार्क - ब्लैकवेल आर्किटेक्चर पर छोटा AI सुपरकंप्यूटर जिसमें 128+GB यूनिफाइड RAM और 1 PFLOPS AI प्रदर्शन है। LLM चलाने के लिए एक अच्छा डिवाइस है।

मॉडल कॉन्टेक्स्ट प्रोटोकॉल (MCP), और MCP सर्वर को Go में लागू करने के नोट्स

मॉडल कॉन्टेक्स्ट प्रोटोकॉल (MCP), और MCP सर्वर को Go में लागू करने के नोट्स

MCP विशेषताओं और GO में कार्यान्वयन पर लंबा लेख

यहाँ मॉडल कॉन्टेक्स्ट प्रोटोकॉल (MCP) का वर्णन है, जिसमें Go में एक MCP सर्वर का कार्यान्वयन के बारे में संक्षिप्त नोट्स शामिल हैं, जिसमें संदेश संरचना और प्रोटोकॉल विनिर्देश शामिल हैं।

ओलामा और क्वेन3 रीरैंकर मॉडल के साथ दस्तावेजों को फिर से रैंक करें - गो में

ओलामा और क्वेन3 रीरैंकर मॉडल के साथ दस्तावेजों को फिर से रैंक करें - गो में

RAG को लागू कर रहे हैं? यहाँ कुछ Go कोड टुकड़े हैं - 2...

चूंकि मानक Ollama में सीधा रीरैंक एपीआई नहीं है,
आपको Qwen3 Reranker के साथ रीरैंकिंग करें GO में जेनरेट करके प्रश्न-दस्तावेज़ जोड़े के एम्बेडिंग्स और उनके स्कोरिंग करना होगा।

हुगो पेज अनुवाद की गुणवत्ता की तुलना - ओलामा पर एलईएमसँ

हुगो पेज अनुवाद की गुणवत्ता की तुलना - ओलामा पर एलईएमसँ

qwen3 8b, 14b और 30b, devstral 24b, mistral small 24b

इस परीक्षण में मैं अलग-अलग LLMs के ओलामा पर होस्ट करने के बारे में जांच कर रहा हूं अंग्रेजी से जर्मन में अनुवाद करते हैं।
मैंने जो तीन पेजों की परीक्षा की वे अलग-अलग विषयों पर थे, कुछ अच्छे मार्कडाउन के साथ थे, जिसमें कुछ संरचना थी: मुख्य शीर्षक, सूची, तालिका, लिंक आदि।