LLM

NVIDIA DGX Spark - nuovo piccolo supercomputer AI

Nvidia sta per rilasciare NVIDIA DGX Spark - un piccolo supercomputer AI basato sull’architettura Blackwell con 128+GB di RAM unificata e un’efficienza AI di 1 PFLOPS. Un dispositivo interessante per eseguire LLM.

Model Context Protocol (MCP), e note sull'implementazione del server MCP in Go

Ecco una descrizione del Model Context Protocol (MCP), note brevi su come implementare un server MCP in Go, inclusa la struttura dei messaggi e le specifiche del protocollo.

Riordinare i documenti con Ollama e modello Qwen3 Reranker - in Go

Poiché l’Ollama standard non dispone di un’API di reranking diretta, sarà necessario implementare reranking utilizzando Qwen3 Reranker in GO generando gli embedding per le coppie query-documento e valutandoli.

Confronto della qualità della traduzione delle pagine di Hugo - LLM su Ollama

In questo test sto confrontando come diversi LLM ospitati su Ollama traducono una pagina Hugo dall’inglese al tedesco. Le tre pagine che ho testato erano su argomenti diversi, avevano un bel markdown con una certa struttura: intestazioni, elenchi, tabelle, link, ecc.

Riordinare i testi con Ollama e Qwen3 Embedding LLM - in Go

Questo piccolo Esempio di codice Go per il rirango è che chiama Ollama per generare embedding per la query e per ogni documento candidato, poi ordinando in ordine discendente per similarità coseno.

Modelli Qwen3 Embedding & Reranker su Ollama: Prestazioni all'avanguardia

I modelli Qwen3 Embedding e Reranker sono le ultime release della famiglia Qwen, specificamente progettati per compiti avanzati di embedding del testo, recupero e rirango.

Prestazioni degli LLM e canali PCIe: considerazioni chiave

Come le lane PCIe influenzano le prestazioni degli LLM? Dipende dal compito. Per l’addestramento e l’inferenza multi-GPU, la riduzione delle prestazioni è significativa.

Converti il contenuto HTML in Markdown utilizzando LLM e Ollama

Nella libreria dei modelli Ollama ci sono modelli in grado di convertire contenuti HTML in Markdown, che è utile per compiti di conversione del contenuto.

Ricerca vs Deepsearch vs Ricerca approfondita

Cerca è ideale per recuperare rapidamente informazioni semplici e dirette utilizzando parole chiave.
Ricerca approfondita eccelle nell’intendere il contesto e l’intento, fornendo risultati più rilevanti e completi per domande complesse.

Ecco la traduzione del contenuto della pagina Hugo dallo pseudocodice in italiano, mantenendo tutte le specifiche tecniche e gli elementi Hugo originali:

Will elencare qui alcuni strumenti di coding assistiti da AI e AI Coding Assistants con i loro lati positivi.

L’utilizzo di LLM non è molto costoso, potrebbe non esserci bisogno di acquistare un nuovo GPU eccezionale.
Ecco un elenco di fornitori di LLM in cloud con gli LLM che ospitano.

Test: Come Ollama utilizza le prestazioni del processore Intel e i core efficienti

Ho un’idea da testare: se l’utilizzo di tutti i core su un processore Intel aumenterebbe la velocità degli LLM? Mi sta infastidendo il fatto che il nuovo modello gemma3 27 bit (gemma3:27b, 17 GB su ollama) non entra nei 16 GB di VRAM della mia GPU e viene eseguito parzialmente sul CPU.

Confronto della idoneità delle GPU NVidia per l'AI

Nel mezzo del caos del mondo moderno qui sto confrontando le specifiche tecniche di diverse schede adatte a AI compiti (Deep Learning, Object Detection e LLMs). Sono tutte incredibilmente costose però.

Come Ollama Gestisce le Richieste Parallele

Quando il server Ollama riceve due richieste contemporaneamente, il suo comportamento dipende dalla sua configurazione e dalle risorse del sistema disponibili.

Vibe coding è un approccio alla programmazione guidato dall’AI in cui gli sviluppatori descrivono la funzionalità desiderata in linguaggio naturale, permettendo agli strumenti AI di generare automaticamente il codice.

DeepSeek’s prima generazione di modelli di ragionamento con prestazioni paragonabili a quelle di OpenAI-o1, inclusi sei modelli densi distillati da DeepSeek-R1 basati su Llama e Qwen.

NVIDIA DGX Spark - nuovo piccolo supercomputer AI

Model Context Protocol (MCP), e note sull'implementazione del server MCP in Go

Riordinare i documenti con Ollama e modello Qwen3 Reranker - in Go

Confronto della qualità della traduzione delle pagine di Hugo - LLM su Ollama

Riordinare i testi con Ollama e Qwen3 Embedding LLM - in Go

Modelli Qwen3 Embedding & Reranker su Ollama: Prestazioni all'avanguardia

Prestazioni degli LLM e canali PCIe: considerazioni chiave

Converti il contenuto HTML in Markdown utilizzando LLM e Ollama

Ricerca vs Deepsearch vs Ricerca approfondita

Confronto tra assistenti di codifica AI

Fornitori di LLM Cloud

Test: Come Ollama utilizza le prestazioni del processore Intel e i core efficienti

Confronto della idoneità delle GPU NVidia per l'AI

Come Ollama Gestisce le Richieste Parallele

Vibe Coding - Significato e descrizione

Testare Deepseek-R1 su Ollama