
Rilevazione di errori logici con i LLM
Testiamo la qualità della rilevazione delle fallacie logiche di diversi LLM
Confronto di diverse versioni di modelli LLM: llama3 (Meta), phi3 (Microsoft), gemma (Google), mistral (open source) e qwen (Alibaba).