LLMs के साथ तर्कात्मक अपराध पता लगाना

इस बात का परीक्षण करते हैं कि विभिन्दु एलआईएम्स (LLMs) योजनात्मक अशुद्धि (logical fallacy) का पता लगाने में कैसी सक्षम हैं।

Page content

आपत्कारी आर्थिक गड़बड़ी

हम जो स्थिति का परीक्षण करते हैं।

मुझे लंबे समय से आपत्कारी आर्थिक गड़बड़ी (Logical Fallacy) का प्रावधिक पहचानने में रुचि रही है, और इस प्रयोग में मैं विभिन्न बड़े भाष्य (Large Language Models) वाले AI का इस वास्तविक-जीवन उदाहरण पर प्रभाव समझने का प्रयास कर रहा हूँ।

कुछ समय पहले, मैंने आपत्कारी आर्थिक गड़बड़ी का प्रावधिक पहचानने में दिलचस्पी थी, और इस अनुभव में मैं llama3 (Meta), phi3 (Microsoft), gemma (Google), mistral (ओपन सोource) और qwen (Alibaba) के माध्यम से जो प्रकार की आपत्कारी गड़बड़ी पहचान सकते हैं, उसे देखना चाहा। मुझे हर एक मॉडल को दोहराया ताकि अगर किसी भी समय मॉडल ने कोई विशेष आपत्कारी गड़बड़ी पहचानी, तो उसके लिए V V होगा।

यहां नीचे मैंने किया है:

मॉडल संस्करण GPU RAM A2CS Straw man Ad homi-nem Red Herring Appeal to autho-rity False dichotomytomy Hasty Generalization Begging the Question Slippery Slope
l3:8b-i-q4_0 5.8GB V V V V V V
l3:8b-i-q8_0 9.1GB V V V V
l3:8b-i-fp16 9.1GB V V V
p3:3.8b 4.3GB V V V
p3:3.8b-mini-4k-i-q8_0 5.8GB V V V V
p3:14b 9.3GB V V
mi:7b-i-v0.3-q8_0 8.6GB V V V V

आपत्कारी आर्थिक गड़बड़ी के संक्षेप: A2CS=Appeal to common sense

मॉडलों के नाम के संक्षेप:

  • l3=llama3
  • p3=phi3
  • i=instruct
  • m=medium
  • mi=mistral
  • ge=gemma
  • qw=qwen

Oversimplification=False dichotomy

जैसा हम देखते हैं, अधिकांश मॉडल Strawman fallacy, Ad Hominem, Appeal to authority को सही पहचानते हैं।

TL;DR

**कृपया देखें नए LLMs के आपत्कारी गड़बड़ी पहचान में V V शामिल हैं।

मॉडलों के सटीक प्रतिक्रिया

यहां मुझे दोहराना है कि हम जो वाक्यांश का परीक्षण कर रहे हैं:

Look, on first blush, it all sounds perfectly reasonable:
too many people, not enough houses.

But it is never that simple,
as a former home affairs minister should know.

llama3:8b-instruct-q4_0 की प्रतिक्रिया

यह एक आपत्कारी आर्थिक गड़बड़ी (Logical Fallacy) समूचे विचारों का उदाहरण है!

llama3:8b-instruct-q8_0 की प्रतिक्रिया

यह वाक्यांश में आपत्कारी आर्थिक गड़बड़ी (Logical Fallacy) हैं।

phi3:14b-medium-4k-instruct-q6_K की प्रतिक्रिया

यह वाक्यांश में आपत्कारी आर्थीक गड़बड़ी (Logical Fallacy) हैं।