AI - Page 3 - Rost Glukhov | व्यक्तिगत साइट और तकनीकी ब्लॉग

स्थानीय ओल्लामा इंस्टेंस के लिए चैट यूआई

स्थानीय रूप से होस्टेड Ollama आपको अपने मशीन पर बड़े भाषा मॉडल चलाने की अनुमति देता है, लेकिन कमांड-लाइन के माध्यम से इसका उपयोग करना उपयोगकर्ता-मित्र नहीं है। यहाँ कुछ ओपन-सोर्स प्रोजेक्ट्स हैं जो ChatGPT-स्टाइल इंटरफेस प्रदान करते हैं जो स्थानीय Ollama से कनेक्ट होते हैं।

प्रोग्रामिंग भाषाओं और सॉफ्टवेयर डेवलपर टूल्स की लोकप्रियता

द प्रैग्मैटिक इंजीनियर लेटर ने कुछ दिन पहले एक सर्वेक्षण प्रकाशित किया जिसमें 2025 के मध्य के लिए प्रोग्रामिंग भाषाओं, IDEs, AI टूल्स और अन्य डेटा की लोकप्रियता के आंकड़े शामिल हैं।

एनवीडिया डीजीएक्स स्पार्क - नया छोटा एआई सुपरकंप्यूटर

एनवीडिया DGX स्पार्क जारी करने वाला है NVIDIA DGX स्पार्क - ब्लैकवेल आर्किटेक्चर पर छोटा AI सुपरकंप्यूटर जिसमें 128+GB यूनिफाइड RAM और 1 PFLOPS AI प्रदर्शन है। LLM चलाने के लिए एक अच्छा डिवाइस है।

ओलामा और क्वेन3 रीरैंकर मॉडल के साथ दस्तावेजों को फिर से रैंक करें - गो में

चूंकि मानक Ollama में सीधा रीरैंक एपीआई नहीं है,
आपको Qwen3 Reranker के साथ रीरैंकिंग करें GO में जेनरेट करके प्रश्न-दस्तावेज़ जोड़े के एम्बेडिंग्स और उनके स्कोरिंग करना होगा।

एक ठंडे जुलाई के दिन… जो कि ऑस्ट्रेलिया में होता है… मुझे एक एआई मॉडल ट्रेन करने की तत्काल आवश्यकता महसूस हुई जो अनकैप्ड कंक्रीट रीइनफोर्समेंट बार्स को पहचान सके…

हुगो पेज अनुवाद की गुणवत्ता की तुलना - ओलामा पर एलईएमसँ

इस परीक्षण में मैं अलग-अलग LLMs के ओलामा पर होस्ट करने के बारे में जांच कर रहा हूं अंग्रेजी से जर्मन में अनुवाद करते हैं।
मैंने जो तीन पेजों की परीक्षा की वे अलग-अलग विषयों पर थे, कुछ अच्छे मार्कडाउन के साथ थे, जिसमें कुछ संरचना थी: मुख्य शीर्षक, सूची, तालिका, लिंक आदि।

ओलमा और क्वेन-3 एमबेडिंग मॉडल का उपयोग करके टेक्स्ट दस्तावेजों को पुनर्अभिषेक - गो भाषा में

यह छोटा सा
पुनर्विन्यास Go केode उदाहरण में Ollama को रनिंग (Reranking) करके एम्बेडिंग (embeddings) जनरेट करने का प्रयोग हुआ है
क्वेरी (query) और प्रत्येक कैंडिडेट दस्तावेज़ (candidate document) के लिए,
फिर कोसाइन समानता (cosine similarity) के आधार पर अवरोधकता (descending order) में दर्जीन (sorting) करना है।

LLM प्रदर्शन और PCIe चैनल: महत्वपूर्ण परिवेशन

PCIe चैनल कैसे LLM के कार्यक्षमता पर प्रभाव डालते हैं? कार्य पर निर्भर करता है। प्रशिक्षण और बहु-GPU अनुमान लगाने के लिए - कार्यक्षमता में गिरावट महत्वपूर्ण होती है।

HTML सामग्री को मार्कडाउन में बदलें, एलईएम और ओलामा का उपयोग करके

ओलामा मॉडल पुस्तकालय में ऐसे मॉडल हैं जो HTML कंटेंट को मार्कडाउन में परिवर्तित कर सकते हैं के लिए उपयोगी हैं, जो कंटेंट परिवर्तन कार्यों के लिए उपयोगी हैं।

खोज शब्दों के उपयोग द्वारा त्वरित और सीधे जानकारी प्राप्त करने के लिए सबसे अच्छा है।
गहरी खोज प्रसंग और उद्देश्य के समझने में उत्कृष्ट है, जो जटिल प्रश्नों के लिए अधिक संबंधित और व्यापक परिणाम प्रदान करता है।

यहाँ कुछ AI सहायक निर्माण उपकरणों और AI Coding Assistants तथा उनके अच्छे पक्षों की सूची है।

एलएलएम का उपयोग करना बहुत महंगा नहीं है, नई शानदार जीपीयू खरीदने की आवश्यकता नहीं हो सकती। यहाँ क्लाउड में एलएलएम प्रदाताओं की सूची है जिनके पास वे एलएलएम होस्ट करते हैं।

परीक्षण: ओलामा कैसे इंटेल CPU के प्रदर्शन और कुशल कोर का उपयोग कर रहा है

मेरे पास एक सिद्धांत है जिसे परीक्षण करना है - अगर इंटेल के CPU पर सभी कोर का उपयोग करने से LLMs की गति बढ़ेगी? (परीक्षण: ओलामा कैसे इंटेल CPU के प्रदर्शन और कुशल कोर का उपयोग करता है)
यह मुझे चिंता कर रहा है कि नए gemma3 27 बिट मॉडल (gemma3:27b, 17GB ओलामा पर) मेरे GPU के 16GB VRAM में फिट नहीं हो रहा है और इसके कुछ हिस्सा CPU पर चल रहा है।

एआई के लिए एनवीडिया जीपीयू के उपयुक्तता की तुलना

आधुनिक दुनिया के अस्थिरता के बीच यहाँ मैं विभिन्न कार्ड के तकनीकी विशेषताओं की तुलना कर रहा हूँ, जो AI कार्यों के लिए उपयुक्त हैं
(डीप लर्निंग,
ऑब्जेक्ट डिटेक्शन
और LLMs।
हालाँकि, वे सभी बहुत महंगे हैं।

ओलामा कैसे समानांतर अनुरोधों का संभालता है

जब Ollama सर्वर एक ही समय में दो अनुरोध प्राप्त करता है, तो इसका व्यवहार इसके विन्यास और उपलब्ध प्रणाली संसाधनों पर निर्भर करता है।

वाइब कोडिंग एक आईई चालित कोडिंग प्रक्रिया है जहां डेवलपर्स अपनी आवश्यकता के बारे में प्राकृतिक भाषा में वर्णन करते हैं, जिससे आईई उपकरण ऑटोमैटिक रूप से कोड उत्पन्न करते हैं।

AI

स्थानीय ओल्लामा इंस्टेंस के लिए चैट यूआई

प्रोग्रामिंग भाषाओं और सॉफ्टवेयर डेवलपर टूल्स की लोकप्रियता

एनवीडिया डीजीएक्स स्पार्क - नया छोटा एआई सुपरकंप्यूटर

ओलामा और क्वेन3 रीरैंकर मॉडल के साथ दस्तावेजों को फिर से रैंक करें - गो में

टेंसरफ्लो के साथ ऑब्जेक्ट डिटेक्शन

हुगो पेज अनुवाद की गुणवत्ता की तुलना - ओलामा पर एलईएमसँ

ओलमा और क्वेन-3 एमबेडिंग मॉडल का उपयोग करके टेक्स्ट दस्तावेजों को पुनर्अभिषेक - गो भाषा में

LLM प्रदर्शन और PCIe चैनल: महत्वपूर्ण परिवेशन

HTML सामग्री को मार्कडाउन में बदलें, एलईएम और ओलामा का उपयोग करके

खोज vs डीपसर्च vs डीप रिसर्च

AI निर्माण सहायकों की तुलना

क्लाउड एलएलएम प्रदाता

परीक्षण: ओलामा कैसे इंटेल CPU के प्रदर्शन और कुशल कोर का उपयोग कर रहा है

एआई के लिए एनवीडिया जीपीयू के उपयुक्तता की तुलना

ओलामा कैसे समानांतर अनुरोधों का संभालता है

वाइब कोडिंग - अर्थ और विवरण