Détection de fausses démonstrations logiques avec les modèles génératifs de langage
Testons la qualité de détection des sophismes logiques dans différents modèles LLM
Sommaire
Comparaison de plusieurs versions LLMs : llama3 (Meta), phi3 (Microsoft), gemma (Google), mistral (open source) et qwen (Alibaba).
Qu’est-ce que nous testons.
Please see the English page for correct data.
Liens utiles
Merci pour votre intérêt sur ce sujet. Si vous souhaitez en savoir plus ici :
- Comparaison de la qualité de traduction Hugo Page - LLMs sur Ollama
- Testing Deepseek-r1 on Ollame
- Testing logical fallacy detection by new LLMs: gemma2, qwen2 and mistralNemo
- Comparaison de la performance de vitesse LLM
- Comparaison des capacités d’assomption LLM
Vous pouvez aussi consulter :
- Logical Fallacies : https://www.logical-fallacy.com
- Ollama : https://ollama.com/
- Déplacer les modèles Ollama vers un autre disque ou dossier
- Test : Comment Ollama utilise-t-il la performance CPU Intel et les coeurs efficaces ?
- Écrire des prompts efficaces pour les LLMs
Note : Les noms de modèle et leurs raccourcis ont été adaptés au mieux en français tout en conservant leur signification technique.