ओलामा पर Qwen3 एम्बेडिंग एवं रीरैंकर मॉडल: अत्याधुनिक प्रदर्शन

ओलामा में नए अद्भुत एलईएम उपलब्ध हैं

Page content

Qwen3 Embedding और Reranker मॉडल Qwen परिवार के नवीनतम रिलीज हैं, जो उन्नत पाठ एम्बेडिंग, पुनर्प्राप्ति और पुनर्क्रमण कार्यों के लिए विशेष रूप से डिज़ाइन किए गए हैं।

आंख के लिए खुशी Qwen3 Embedding Reranker संदर्भ लंबाई और एम्बेडिंग आयाम

Qwen3 Embedding और Reranker मॉडल बहुभाषी प्राकृतिक भाषा प्रसंस्करण (NLP) में एक महत्वपूर्ण प्रगति का प्रतिनिधित्व करते हैं, जो पाठ एम्बेडिंग और पुनर्क्रमण कार्यों में अत्याधुनिक प्रदर्शन प्रदान करते हैं। ये मॉडल, जो अलीबाबा द्वारा विकसित Qwen श्रृंखला के हिस्सा हैं, विस्तृत अनुप्रयोगों के लिए डिज़ाइन किए गए हैं, जैसे कि अर्थ पुनर्प्राप्ति से लेकर कोड खोज तक। जबकि Ollama बड़े भाषा मॉडल (LLMs) के मेजबानी और तैनाती के लिए एक लोकप्रिय ओपन-स्रोत प्लेटफॉर्म है, Qwen3 मॉडलों के Ollama से एकीकरण को आधिकारिक दस्तावेजों में विशेष रूप से विस्तार से नहीं दिखाया गया है। हालांकि, ये मॉडल Hugging Face, GitHub और ModelScope के माध्यम से उपलब्ध हैं, जिसके माध्यम से Ollama या इसके अन्य उपकरणों के माध्यम से स्थानीय तैनाती संभव है।

Ollama पर नए Qwen3 Embedding और Reranker मॉडल के सामान्य दृष्टिकोण

अब ये मॉडल Ollama पर विभिन्न आकारों में तैनात करने के लिए उपलब्ध हैं, जो विस्तृत भाषा और कोड संबंधी अनुप्रयोगों के लिए अत्याधुनिक प्रदर्शन और लचीलापन प्रदान करते हैं।

मुख्य विशेषताएं और क्षमताएं

  • मॉडल आकार और लचीलापन

    • एम्बेडिंग और पुनर्क्रमण कार्यों के लिए 0.6B, 4B और 8B पैरामीटर के विभिन्न आकारों में उपलब्ध।
    • 8B एम्बेडिंग मॉडल वर्तमान में MTEB बहुभाषी लीडरबोर्ड पर शीर्ष पर है (जून 5, 2025 तक, स्कोर 70.58)।
    • प्रदर्शन, मेमोरी उपयोग और गति के बीच संतुलन के लिए कई प्रकार के क्वांटाइजेशन विकल्प (Q4, Q5, Q8 आदि) का समर्थन करता है। Q5_K_M अधिकांश उपयोगकर्ताओं के लिए अनुशंसित है क्योंकि यह अधिकांश मॉडल प्रदर्शन को बरकरार रखते हुए संसाधन दक्ष है।
  • आर्किटेक्चर और प्रशिक्षण

    • Qwen3 फाउंडेशन पर बनाए गए हैं, जो द्वि-एन्कोडर (एम्बेडिंग के लिए) और क्रॉस-एन्कोडर (पुनर्क्रमण के लिए) आर्किटेक्चर के उपयोग के साथ लाभ उठाते हैं।
    • एम्बेडिंग मॉडल: एकल पाठ खंडों के विश्लेषण करता है, अंतिम छिपा हुआ अवस्था से अर्थ निरूपण निकालता है।
    • पुनर्क्रमण मॉडल: पाठ जोड़े (उदाहरण के लिए, प्रश्न और दस्तावेज) लेता है और क्रॉस-एन्कोडर दृष्टिकोण के उपयोग से एक संबंधत स्कोर निकालता है।
    • एम्बेडिंग मॉडल तीन चरणों के प्रशिक्षण परिप्रेक्ष्य पर आधारित हैं: विपरीत प्रशिक्षण, उच्च गुणवत्ता डेटा के साथ सुपरवाइज्ड प्रशिक्षण और मॉडल मर्ज करना अनुकूल विस्तार और अनुकूलता के लिए।
    • पुनर्क्रमण मॉडल उच्च गुणवत्ता चिह्नित डेटा के साथ सीधे प्रशिक्षित किए जाते हैं दक्षता और प्रभावकारता के लिए।
  • बहुभाषी और बहुकार्य समर्थन

    • 100 से अधिक भाषाओं के समर्थन, जिसमें कार्यक्रम भाषाएं शामिल हैं, जो मजबूत बहुभाषी, पार-भाषी और कोड पुनर्प्राप्ति क्षमताओं के लिए अनुमति देता है।
    • एम्बेडिंग मॉडल वेक्टर परिभाषाओं के लचीलापन और उपयोगकर्ता परिभाषित निर्देशों के समर्थन के साथ विशिष्ट कार्यों या भाषाओं के लिए प्रदर्शन को अनुकूलित करने की अनुमति देता है।
  • प्रदर्शन और उपयोग के मामले

    • पाठ पुनर्प्राप्ति, कोड पुनर्प्राप्ति, वर्गीकरण, गुच्छा खोज और बिटेक्स खोज में अत्याधुनिक परिणाम।
    • पुनर्क्रमण मॉडल विभिन्न पाठ पुनर्प्राप्ति परिस्थितियों में उत्कृष्ट प्रदर्शन करते हैं और एम्बेडिंग मॉडलों के साथ अंत-से-अंत पुनर्प्राप्ति पाइपलाइनों के लिए सुगम रूप से संयोजित किए जा सकते हैं।

Ollama पर उपयोग कैसे करें

आप इन मॉडलों को Ollama पर निम्नलिखित आदेशों के साथ चला सकते हैं:

ollama run dengcao/Qwen3-Embedding-8B:Q5_K_M
ollama run dengcao/Qwen3-Reranker-0.6B:F16

अपने हार्डवेयर और प्रदर्शन आवश्यकताओं के अनुसार सबसे अच्छा क्वांटाइजेशन संस्करण चुनें।


सारांश सारणी

मॉडल प्रकार उपलब्ध आकार मुख्य शक्तियाँ बहुभाषी समर्थन क्वांटाइजेशन विकल्प
एम्बेडिंग 0.6B, 4B, 8B शीर्ष MTEB स्कोर, लचीलापन, दक्षता, अत्याधुनिक हां (100+ भाषाएं) Q4, Q5, Q6, Q8, आदि
पुनर्क्रमण 0.6B, 4B, 8B पाठ जोड़े के संबंध में उत्कृष्ट, दक्षता, लचीलापन हां F16, Q4, Q5, आदि

अद्भुत समाचार!

Ollama पर Qwen3 एम्बेडिंग और पुनर्क्रमण मॉडल बहुभाषी, बहुकार्य पाठ और कोड पुनर्प्राप्ति क्षमताओं में एक महत्वपूर्ण उछाल का प्रतिनिधित्व करते हैं। लचीले तैनाती विकल्पों, मजबूत बेंचमार्क प्रदर्शन और विस्तृत भाषाओं और कार्यों के समर्थन के साथ, वे शोध और उत्पादन वातावरणों दोनों के लिए उपयुक्त हैं।

मॉडल जू - अब आंख के लिए खुशी

Qwen3 एम्बेडिंग

https://ollama.com/dengcao/Qwen3-Embedding-8B

Qwen3 एम्बेडिंग 8b

https://ollama.com/dengcao/Qwen3-Embedding-4B/tags

Qwen3 एम्बेडिंग 4b

https://ollama.com/dengcao/Qwen3-Embedding-0.6B/tags

Qwen3 एम्बेडिंग 0.6b

Qwen3 पुनर्क्रमण

https://ollama.com/dengcao/Qwen3-Reranker-8B

Qwen3 पुनर्क्रमण 8b

dengcao/Qwen3-Reranker-8B:Q3_K_M
dengcao/Qwen3-Reranker-8B:Q5_K_M

https://ollama.com/dengcao/Qwen3-Reranker-4B/tags

dengcao/Qwen3-Reranker-4B:Q5_K_M

Qwen3-Reranker-4B

https://ollama.com/dengcao/Qwen3-Reranker-0.6B/tags

Qwen3-Reranker-0.6B

अच्छा!

उपयोगी लिंक