Ollama

In questo test sto confrontando come diversi LLM ospitati su Ollama traducono una pagina Hugo dall’inglese al tedesco.

Reranking di testi con Ollama e Qwen3 Embedding LLM - in Go

Questo piccolo esempio di codice Go per il Reranking chiama Ollama per generare gli embedding per la query e per ciascun documento candidato, ordinando poi in ordine decrescente in base alla similarità coseno.

Modelli di Embedding e Reranker Qwen3 su Ollama: prestazioni all'avanguardia

I modelli Qwen3 Embedding e Reranker sono le ultime uscite della famiglia Qwen, progettati specificamente per compiti avanzati di incorporazione (embedding), recupero (retrieval) e riordinamento (reranking) del testo.

Prestazioni degli LLM e canali PCIe: considerazioni chiave

Come le lane PCIe influenzano le prestazioni degli LLM? Dipende dal compito. Per l’addestramento e l’inferenza multi-GPU, la riduzione delle prestazioni è significativa.

Converti il contenuto HTML in Markdown utilizzando LLM e Ollama

Nella libreria dei modelli Ollama ci sono modelli in grado di convertire contenuti HTML in Markdown, che è utile per compiti di conversione del contenuto. Questa guida fa parte del nostro Strumenti per la Documentazione nel 2026: Markdown, LaTeX, PDF e Flussi di Lavoro per la Stampa hub.

Confronto tra assistenti di programmazione basati sull'IA

Elencherò qui alcuni strumenti di coding assistito dall’IA e Assistenti di Coding AI e i loro aspetti positivi.

Test: Come Ollama utilizza le prestazioni della CPU Intel e i core efficienti

Ho un’ipotesi da testare: se utilizzare TUTTI i core su un processore Intel aumenterebbe la velocità degli LLM? Mi sta infastidendo il fatto che il nuovo modello gemma3 27 bit (gemma3:27b, 17 GB su ollama) non si adatti ai 16 GB di VRAM della mia GPU, e venga eseguito parzialmente sul CPU.

Come Ollama gestisce le richieste parallele

Quando il server Ollama riceve due richieste contemporaneamente, il suo comportamento dipende dalla sua configurazione e dalle risorse del sistema disponibili.

DeepSeek’s prima generazione di modelli di ragionamento con prestazioni paragonabili a quelle di OpenAI-o1, inclusi sei modelli densi distillati da DeepSeek-R1 basati su Llama e Qwen.

Questa scheda di riferimento per Ollama CLI si concentra sui comandi che utilizzi ogni giorno (ollama ls, ollama serve, ollama run, ollama ps, gestione dei modelli e flussi di lavoro comuni), con esempi pronti per il copia-incolla.

Non molto tempo fa è stato rilasciato. Veniamo al punto e testiamo come si comporta Mistral Small rispetto ad altri LLM.

Reranking è un secondo passo nella Generazione Aumentata dal Recupero (RAG) sistemi, posizionato esattamente tra il Recupero e la Generazione.

Il cibo meraviglioso è un piacere anche per i tuoi occhi. Ma in questo post confronteremo due sistemi di ricerca basati sull’IA, Farfalle e Perplexica.

È davvero entusiasmante! Invece di chiamare Copilot o Perplexity.ai e rivelare al mondo intero cosa stai cercando, ora puoi ospitare un servizio simile sul tuo PC o laptop!

Recentemente abbiamo visto l’uscita di diversi nuovi LLM. Tempi eccitanti. Proviamo a testarli e a vedere come si comportano nel rilevare le fallacie logiche.

Tuttavia, esistono alcuni approcci comuni per scrivere promemoria efficaci in modo che i modelli linguistici non si confondano cercando di capire cosa si desidera da essi.

Ollama

Confronto della qualità della traduzione delle pagine di Hugo - LLM su Ollama

Reranking di testi con Ollama e Qwen3 Embedding LLM - in Go

Modelli di Embedding e Reranker Qwen3 su Ollama: prestazioni all'avanguardia

Prestazioni degli LLM e canali PCIe: considerazioni chiave

Converti il contenuto HTML in Markdown utilizzando LLM e Ollama

Confronto tra assistenti di programmazione basati sull'IA

Test: Come Ollama utilizza le prestazioni della CPU Intel e i core efficienti

Come Ollama gestisce le richieste parallele

Test di Deepseek-R1 su Ollama

Scheda di riferimento della CLI di Ollama: ls, serve, run, ps e altri comandi (aggiornamento 2026)

Mistral Small, Gemma 2, Qwen 2.5, Mistral Nemo, LLama3 e Phi - Test con LLM

Reranking con modelli di embedding

Farfalle contro Perplexica

Self-hosting di Perplexica - con Ollama

Gemma2 vs Qwen2 vs Mistral Nemo vs...

Scrivere prompt efficaci per i modelli linguistici di grandi dimensioni