LLM Hosting

Docker Model Runner: Kontextgrößen-Konfigurationsleitfaden

Einrichten von Kontextgrößen im Docker Model Runner ist komplexer, als es sein sollte.

Hinzufügen von NVIDIA-GPU-Unterstützung zum Docker-Modell-Runner

Docker Model Runner ist das offizielle Tool von Docker, um KI-Modelle lokal zu verwenden, aber GPU-Beschleunigung mit NVidia in Docker Model Runner erfordert eine spezifische Konfiguration.

Docker Model Runner Cheatsheet: Befehle & Beispiele

Docker Model Runner (DMR) ist Docks offizielle Lösung zur lokalen Ausführung von KI-Modellen, eingeführt im April 2025. Dieses Cheat Sheet bietet eine schnelle Referenz für alle wesentlichen Befehle, Konfigurationen und Best Practices.

Docker Model Runner vs. Ollama (2026): Welches ist besser für lokale LLMs?

Große Sprachmodelle (LLMs) lokal ausführen wird zunehmend beliebt, um den Schutz der Privatsphäre, den Kostenkontroll und die Offline-Fähigkeiten zu gewährleisten. Der Markt hat sich im April 2025 deutlich verändert, als Docker Docker Model Runner (DMR) eingeführt hat, seine offizielle Lösung zur Bereitstellung von KI-Modellen.

Go-Client für Ollama: SDK-Vergleich und Qwen3/GPT-OSS-Beispiele

Dieser Leitfaden bietet einen umfassenden Überblick über die verfügbaren Go SDKs für Ollama und vergleicht ihre Funktionsumfänge.

Ollama mit Python integrieren: REST-API- und Python-Client-Beispiele

In diesem Beitrag untersuchen wir zwei Möglichkeiten, Ihre Python-Anwendung mit Ollama zu verbinden: 1. Über die HTTP REST API; 2. Über die offizielle Ollama Python-Bibliothek.

Ollama-Enshittification – die frühen Anzeichen

Ollama hat sich schnell zu einem der beliebtesten Tools zur lokalen Ausführung von LLMs entwickelt. Seine einfache CLI und die nahtlose Modellverwaltung haben es zu einer bevorzugten Option für Entwickler gemacht, die mit AI-Modellen außerhalb der Cloud arbeiten möchten.

Chat-Oberflächen für lokale Ollama-Instanzen

Locally gehostete Ollama ermöglicht es, große Sprachmodelle auf Ihrem eigenen Gerät auszuführen, aber die Verwendung über die Befehlszeile ist nicht benutzerfreundlich. Hier sind mehrere Open-Source-Projekte, die ChatGPT-ähnliche Schnittstellen bereitstellen, die mit einer lokalen Ollama verbunden sind.

Vergleich der Qualität der Hugo-Seitentranslation – LLMs auf Ollama

In diesem Test vergleiche ich, wie verschiedene LLMs, die auf Ollama gehostet werden, Hugo- Seiten von englisch auf deutsch übersetzen.

Die Verwendung von LLMs ist nicht sehr teuer, es könnte kein Bedarf bestehen, neue, unglaublich leistungsstarke GPUs zu kaufen.
Hier ist eine Liste der LLM-Anbieter in der Cloud mit den LLMs, die sie hosten.

DeepSeek’s erste Generation von Reasoning-Modellen mit Leistungen, die vergleichbar sind mit OpenAI-o1, einschließlich sechs dichter Modelle, die aus DeepSeek-R1 basierend auf Llama und Qwen destilliert wurden.

Dieser Ollama CLI-Schnellreferenz konzentriert sich auf die Befehle, die Sie täglich verwenden (ollama ls, ollama serve, ollama run, ollama ps, Modellverwaltung und gängige Workflows), mit Beispielen, die Sie kopieren und einfügen können.

Hervorragendes Essen ist auch ein Genuss für die Augen. Aber in diesem Beitrag vergleichen wir zwei KI-basierte Suchsysteme, Farfalle und Perplexica.

Das ist sehr aufregend! Anstatt Copilot oder perplexity.ai zu nutzen und der ganzen Welt mitzuteilen, wonach Sie suchen, können Sie nun einen ähnlichen Dienst auf Ihrem eigenen PC oder Laptop hosten!

Nach dem Installieren von Ollama ist es besser, Ollama sofort neu zu konfigurieren, um die Modelle direkt am neuen Speicherort abzulegen. So werden nach dem Herunterladen eines neuen Modells keine Dateien mehr am alten Ort gespeichert.

LLM Hosting

Docker Model Runner: Kontextgrößen-Konfigurationsleitfaden

Hinzufügen von NVIDIA-GPU-Unterstützung zum Docker-Modell-Runner

Docker Model Runner Cheatsheet: Befehle & Beispiele

Docker Model Runner vs. Ollama (2026): Welches ist besser für lokale LLMs?

Go-Client für Ollama: SDK-Vergleich und Qwen3/GPT-OSS-Beispiele

Ollama mit Python integrieren: REST-API- und Python-Client-Beispiele

Ollama-Enshittification – die frühen Anzeichen

Chat-Oberflächen für lokale Ollama-Instanzen

Vergleich der Qualität der Hugo-Seitentranslation – LLMs auf Ollama

Cloud-LLM-Anbieter

Testen von Deepseek-R1 mit Ollama

Ollama CLI-Referenz: ls, serve, run, ps und weitere Befehle (Update 2026)

Farfalle vs. Perplexica

Selbstgehostetes Perplexica – mit Ollama

Ollama-Modelle an einen anderen Speicherort verschieben