NVidia

Qwen 3.6 27B en 35B MTP versus standaard op een 16 GB GPU

Ik heb de prestaties van speculatief decoderen (Multi-Token Prediction, MTP) getest in Qwen 3.6 27B en 35B op een RTX 4080 met 16 GB VRAM.

LLM-benchmarks met 16 GB VRAM met behulp van llama.cpp (snelheid en context)

Hier vergelijk ik de snelheid van verschillende LLM’s die op een GPU met 16 GB VRAM draaien, en kies ik de beste optie voor zelfhosting.

RTX 5090 in Australië: Prijzen, voorraad en realiteit in maart 2026

Australië heeft voorraad RTX 5090. Amper. En als je er eentje vindt, betaal je een premie die los staat van de realiteit.

Ollama in Docker Compose met GPU en persistente modelopslag

Ollama werkt uitstekend op bare metal. Het wordt nog interessanter wanneer je het als een service behandelt: een stabiel eindpunt, vastgezet versies, persistente opslag en een GPU die ofwel beschikbaar is of niet.

Vergelijking van de prestaties van LLM’s op Ollama op een GPU met 16 GB VRAM

Het lokaal draaien van grote taalmodellen geeft je privacy, offline mogelijkheden en geen API-kosten. Deze benchmark onthult precies wat je kunt verwachten van 14 populaire LLM’s op Ollama op een RTX 4080.

De beste Linux-terminalprogramma's: vergelijking 2026

Een van de meest essentiële tools voor Linux-gebruikers is de terminal emulator.

Prijzen voor DGX Spark AU: €6.249–€7.999 bij grote retailers

De NVIDIA DGX Spark (GB10 Grace Blackwell) is nu in Australië beschikbaar bij grote PC-handelaars met lokale voorraad. Als u de welvaartsprijzen en beschikbaarheid van de DGX Spark wereldwijd volgt, bent u misschien geïnteresseerd om te weten dat de prijzen in Australië variëren van $6.249 tot $7.999 AUD, afhankelijk van de opslagconfiguratie en de handelaar.

Prijzen van de NVIDIA RTX 5080 en RTX 5090 in Australië – november 2025

Laten we prijzen vergelijken voor topconsumptie-GPU’s, die met name geschikt zijn voor LLM’s en AI in het algemeen. Specifiek kijk ik naar RTX-5080- en RTX-5090-prijzen.

Cross-Modale Embeddingen: Bruggen tussen AI-modellen

Cross-modale ingebedden stellen een doorbraak voor in de kunstmatige intelligentie, waardoor begrip en redeneren mogelijk worden over verschillende gegefstypen binnen een gedeelde representatie-ruimte.

AI-infrastructuur op consumentenhardware

De democratisering van AI is een feit. Met open-source LLM’s zoals Llama, Mistral en Qwen die nu eigen modellen rivaliseren, kunnen teams krachtige AI-infrastructuur op consumentenhardware bouwen – kosten drastisch verlagen terwijl volledige controle over gegevensprivacy en implementatie behouden blijft.

Docker Model Runner: Gids voor het configureren van contextgrootte

Het instellen van contextgrootte in Docker Model Runner is complexer dan het zou moeten zijn.

FLUX.1-Kontext-dev: AI-model voor beeldversterking

Black Forest Labs heeft FLUX.1-Kontext-dev, een geavanceerd beeld-naar-beeld AI-model dat bestaande beelden verrijkt met behulp van tekstinstructies, vrijgegeven.

GPU-onsteunigheid van NVIDIA toevoegen aan Docker Model Runner

Docker Model Runner is Docker’s officiële tool om AI-modellen lokaal uit te voeren, maar NVIDIA GPU-acceleratie inschakelen in Docker Model Runner vereist specifieke configuratie.

NVIDIA DGX Spark vs Mac Studio vs RTX-4080: Ollama-prestatielijst

Ik vond enkele interessante prestatietests van GPT-OSS 120b die draaien op Ollama over drie verschillende platforms: NVIDIA DGX Spark, Mac Studio, en RTX 4080. De GPT-OSS 120b model uit de Ollama bibliotheek weegt 65 GB, wat betekent dat het niet past in de 16 GB VRAM van een RTX 4080 (of de nieuwere RTX 5080).

Docker Model Runner Cheatsheet: Opdrachten & Voorbeelden

Docker Model Runner (DMR) is de officiële oplossing van Docker voor het lokaal uitvoeren van AI-modellen, geïntroduceerd in april 2025. Deze cheatsheet biedt een snelle verwijzing naar alle essentiële opdrachten, configuraties en beste praktijken.

Docker Model Runner vs Ollama (2026): Welk van de twee is beter voor lokale LLMs?

Het uitvoeren van grote taalmodellen (LLMs) lokaal is steeds populairder geworden vanwege privacy, kostcontrole en offlinefunctionaliteiten. Het landschap is aanzienlijk veranderd in april 2025 toen Docker Docker Model Runner (DMR) introduceerde, hun officiële oplossing voor AI-modellering.