Ollama

Kiezen voor de Beste LLM voor Cognee vereist een balans tussen de kwaliteit van het bouwen van grafieken, hallucinatiepercentages en hardwarebeperkingen.
Cognee excelleert met grotere modellen met lage hallucinatie (32B+) via Ollama, maar middelgrote opties werken voor lichtere opzetten.

Het gebruik van de Ollama Web Search API in Python

De Ollama Python-bibliotheek bevat nu native OLlama web zoekfunctie mogelijkheden. Met slechts een paar regels code kunt u uw lokale LLMs verrijken met real-time informatie van het web, waardoor hallucinaties worden verminderd en de nauwkeurigheid wordt verbeterd.

Het gebruik van de Ollama Web Search API in Go

Ollama’s Web Search API laat je lokale LLMs verrijken met real-time webinformatie. Deze gids laat je zien hoe je web zoekfunctionaliteiten in Go kunt implementeren, van eenvoudige API-aanroepen tot volledig uitgeruste zoekagenten.

Lokaal LLM-hosten: Compleet 2025-overzicht - Ollama, vLLM, LocalAI, Jan, LM Studio & Meer

Lokale implementatie van LLMs is steeds populairder geworden, aangezien ontwikkelaars en organisaties betere privacy, lagere latentie en grotere controle over hun AI-infrastructuur nastreven.

AI-infrastructuur op consumptieghardware

De democratisering van AI is nu een feit. Met open-source LLMs zoals Llama 3, Mixtral en Qwen die nu concurreren met eigenaarmodellen, kunnen teams krachtige AI-infrastructuur op consumentenhardware bouwen - kosten verminderen terwijl volledige controle wordt behouden over gegevensprivacy en implementatie.

NVIDIA DGX Spark vs Mac Studio vs RTX-4080: Ollama-prestatielijst

Ik vond enkele interessante prestatietests van GPT-OSS 120b die draaien op Ollama over drie verschillende platforms: NVIDIA DGX Spark, Mac Studio en RTX 4080. De GPT-OSS 120b model uit de Ollama bibliotheek weegt 65 GB, wat betekent dat het niet past in de 16 GB VRAM van een RTX 4080 (of de nieuwere RTX 5080).

Docker Model Runner vs Ollama: welk product kiezen?

Het lokaal uitvoeren van grote taalmodellen (LLMs) is steeds populairder geworden vanwege privacy, kostcontrole en offline functionaliteit. Het landschap veranderde aanzienlijk in april 2025 toen Docker Docker Model Runner (DMR) introduceerde, hun officiële oplossing voor AI-modellering.

Go-clients voor Ollama: SDK-vergelijking en Qwen3/GPT-OSS-voorbeelden

Deze gids biedt een uitgebreid overzicht van beschikbare Go SDKs voor Ollama en vergelijkt hun functionaliteiten.

Hier is een vergelijking tussen Qwen3:30b en GPT-OSS:20b
met aandacht voor instructievolgzaamheid en prestatieparameters, specificaties en snelheid:

Integrare Ollama met Python: Voorbeelden van REST API en Python-client

In dit bericht verkennen we twee manieren om uw Python-toepassing te verbinden met Ollama: 1. Via de HTTP REST API; 2. Via de officiële Ollama Python-bibliotheek.

Ollama GPT-OSS Structured Outputproblemen

Ollama’s GPT-OSS modellen hebben herhalende problemen bij het verwerken van gestructureerde uitvoer, vooral wanneer ze worden gebruikt met frameworks zoals LangChain, OpenAI SDK, vllm en andere.

Beperken van LLMs met gestructureerde uitvoer: Ollama, Qwen3 & Python of Go

Large Language Models (LLMs) zijn krachtig, maar in productie willen we zelden vrije tekst. In plaats daarvan willen we voorspelbare data: kenmerken, feiten of gestructureerde objecten die je kunt voeden in een app. Dat is LLM Structured Output.

Geheugentoewijzing model planning in Ollama nieuwe versie - v0.12.1

Hier vergelijk ik hoeveel VRAM de nieuwe versie van Ollama toewijst aan het model hier met de vorige Ollama-versie. De nieuwe versie is erger.

Ollama Enshittification - De vroege tekenen

Ollama is snel geworden tot een van de populairste tools voor het lokaal uitvoeren van LLMs. Zijn eenvoudige CLI en gestroomlijnde modelbeheer hebben het tot de favoriete optie gemaakt voor ontwikkelaars die willen werken met AI-modellen buiten de cloud. Maar net als bij veel veelbelovende platforms zijn er al tekenen van Enshittification:

Locally geïnstalleerde Ollama stelt u in staat om grote taalmodellen op uw eigen computer te draaien, maar het gebruik ervan via de opdrachtnaam is niet gebruikersvriendelijk. Hier zijn verschillende open-source projecten die ChatGPT-stijl interfaces bieden die verbinding maken met een lokale Ollama.

Documenten herschikken met Ollama en Qwen3 Reranker model - in Go

Aangezien standaard Ollama geen directe rerank API heeft, zal je herordenen met Qwen3 Reranker in GO moeten implementeren door embeddings te genereren voor query-documentparen en deze te scoren.

Ollama

Het kiezen van het juiste LLM voor Cognee: lokale Ollama-installatie

Het gebruik van de Ollama Web Search API in Python

Het gebruik van de Ollama Web Search API in Go

Lokaal LLM-hosten: Compleet 2025-overzicht - Ollama, vLLM, LocalAI, Jan, LM Studio & Meer

AI-infrastructuur op consumptieghardware

NVIDIA DGX Spark vs Mac Studio vs RTX-4080: Ollama-prestatielijst

Docker Model Runner vs Ollama: welk product kiezen?

Go-clients voor Ollama: SDK-vergelijking en Qwen3/GPT-OSS-voorbeelden

Vergelijking: Qwen3:30b vs GPT-OSS:20b

Integrare Ollama met Python: Voorbeelden van REST API en Python-client

Ollama GPT-OSS Structured Outputproblemen

Beperken van LLMs met gestructureerde uitvoer: Ollama, Qwen3 & Python of Go

Geheugentoewijzing model planning in Ollama nieuwe versie - v0.12.1

Ollama Enshittification - De vroege tekenen

Chat-UI's voor lokale Ollama-instanties

Documenten herschikken met Ollama en Qwen3 Reranker model - in Go