Docker Model Runner: Gids voor het configureren van contextgrootte
Stel contextgroottes in in Docker Model Runner met omzeilingen
Het instellen van contextgrootte in Docker Model Runner is complexer dan het zou moeten zijn.
Stel contextgroottes in in Docker Model Runner met omzeilingen
Het instellen van contextgrootte in Docker Model Runner is complexer dan het zou moeten zijn.
Stel GPU-acceleratie in voor Docker Model Runner met ondersteuning voor NVIDIA CUDA
Docker Model Runner is Docker’s officiële tool om AI-modellen lokaal uit te voeren, maar NVIDIA GPU-acceleratie inschakelen in Docker Model Runner vereist specifieke configuratie.
Snelle verwijzing naar Docker Model Runner-commands
Docker Model Runner (DMR) is de officiële oplossing van Docker voor het lokaal uitvoeren van AI-modellen, geïntroduceerd in april 2025. Deze cheatsheet biedt een snelle verwijzing naar alle essentiële opdrachten, configuraties en beste praktijken.
Vergelijk Docker Model Runner en Ollama voor lokale LLM
Het uitvoeren van grote taalmodellen (LLMs) lokaal is steeds populairder geworden vanwege privacy, kostcontrole en offlinefunctionaliteiten. Het landschap is aanzienlijk veranderd in april 2025 toen Docker Docker Model Runner (DMR) introduceerde, hun officiële oplossing voor AI-modellering.
Integreer Ollama met Go: SDK-gids, voorbeelden en productiebest practices.
Deze gids biedt een uitgebreid overzicht van beschikbare Go SDKs voor Ollama en vergelijkt hun functionaliteiten.
+ Specifieke Voorbeelden Met Denkende LLMs
In dit bericht gaan we twee manieren bespreken om je Python-toepassing te verbinden met Ollama: 1. Via de HTTP REST API; 2. Via de officiële Ollama Python-bibliotheek.
Mijn visie op de huidige staat van Ollama-ontwikkeling
Ollama is snel geworden tot een van de meest populaire tools om LLMs lokaal uit te voeren. Zijn eenvoudige CLI en gestroomlijnde modelbeheer hebben het tot de favoriete keuze gemaakt voor ontwikkelaars die willen werken met AI-modellen buiten de cloud.
Korte overzicht van de meest opvallende UI's voor Ollama in 2025
Locally geïnstalleerde Ollama maakt het mogelijk om grote taalmodellen op je eigen computer te draaien, maar het gebruik ervan via de opdrachtnaam is niet gebruikersvriendelijk. Hieronder vind je verschillende open-source projecten die ChatGPT-stijl interfaces bieden die verbinding maken met een lokale Ollama.
qwen3 8b, 14b en 30b, devstral 24b, mistral small 24b
In deze test ben ik aan het vergelijken hoe verschillende LLMs die op Ollama worden gehost de Hugo-pagina vertalen van Engels naar Duits.
Korte lijst van LLM-anbieders
Het gebruik van LLMs is niet erg duur, er is mogelijk geen behoefte om een nieuw geweldige GPU aan te schaffen.
Hier is een lijst met LLM providers in de cloud met LLMs die ze hosten.
Vergelijking van twee deepseek-r1-modellen met twee basismodellen
DeepSeek’s eerste generatie redeneingsmodellen met vergelijkbare prestaties als OpenAI-o1, waaronder zes dichte modellen gedistilleerd van DeepSeek-R1 gebaseerd op Llama en Qwen.
Bijgewerkte Ollama-commandolijst - ls, ps, run, serve, enz.
Deze Ollama CLI-cheat sheet richt zich op de commando’s die je dagelijks gebruikt (ollama ls, ollama serve, ollama run, ollama ps, modelbeheer en veelvoorkomende workflows), met voorbeelden die je kunt kopiëren en plakken.
Twee zelfgehoste AI-zoekmachines vergeleken
Geweldige eten is ook een plezier voor de ogen. Maar in dit bericht vergelijken we twee op AI gebaseerde zoeksystemen: Farfalle en Perplexica.
Lokale uitvoering van een Copilot-stijl service? Gemakkelijk!
Dat is erg spannend! In plaats van Copilot of perplexity.ai aan te roepen en de hele wereld te vertellen wat je zoekt, kun je nu een vergelijkbare dienst op je eigen PC of laptop hosten!
Ollama LLM-modelbestanden nemen veel ruimte in beslag.
Na het installeren van Ollama is het beter om Ollama direct opnieuw te configureren om de modellen op een nieuwe locatie op te slaan. Zodat wanneer we een nieuw model ophalen, deze niet naar de oude locatie wordt gedownload.