Self-Hosting

Verwendung der Ollama Web Search API in Python

Ollamas Python-Bibliothek umfasst nun native OLlama Websuche-Funktionen. Mit nur wenigen Codezeilen können Sie Ihre lokalen LLMs mit Echtzeitinformationen aus dem Web erweitern, um Halluzinationen zu reduzieren und die Genauigkeit zu verbessern.

Die Wahl des richtigen Vektor-Speichers kann über Leistung, Kosten und Skalierbarkeit Ihrer RAG-Anwendung entscheiden. Dieser umfassende Vergleich deckt die beliebtesten Optionen für 2024-2025 ab.

Verwendung der Ollama Web Search API in Go

Ollamas Web-Search-API ermöglicht es Ihnen, lokale LLMs mit Echtzeit-Webinformationen zu erweitern. Diese Anleitung zeigt Ihnen, wie Sie Web-Suchfunktionen in Go implementieren, von einfachen API-Aufrufen bis hin zu vollwertigen Suchagenten.

RAM-Preisanstieg: Bis zu 619 % im Jahr 2025

Der Speichermarkt erlebt im späten Jahr 2025 eine beispiellose Preisschwankung, wobei die RAM-Preise stark gestiegen sind.

Lokales LLM-Hosting: Komplettführer 2025 - Ollama, vLLM, LocalAI, Jan, LM Studio & Mehr

Lokale Bereitstellung von LLMs hat an Beliebtheit zugenommen, da Entwickler und Organisationen eine verbesserte Privatsphäre, reduzierte Latenz und eine größere Kontrolle über ihre KI-Infrastruktur anstreben.

NVIDIA RTX 5080- und RTX 5090-Preise in Australien – November 2025

Lassen Sie uns die Preise für High-End-Consumer-GPUs vergleichen, die insbesondere für LLMs und allgemein für KI geeignet sind. Speziell betrachte ich die Preise für RTX-5080 und RTX-5090.

Die Demokratisierung von KI ist da. Mit Open-Source-LLMs wie Llama 3, Mixtral und Qwen, die nun mit proprietären Modellen mithalten, können Teams leistungsstarke KI-Infrastruktur mit Consumer-Hardware aufbauen - Kosten senken, während sie die vollständige Kontrolle über Datenschutz und Bereitstellung behalten.

Prometheus-Monitoring: Komplette Einrichtung & Best Practices

Prometheus ist zum de facto Standard für die Überwachung cloud-nativer Anwendungen und Infrastruktur geworden und bietet Metriken-Sammlung, Abfragen und Integration mit Visualisierungstools.

Grafana auf Ubuntu installieren und verwenden: Komplettanleitung

Grafana ist die führende Open-Source-Plattform für Überwachung und Observability, die Metriken, Protokolle und Spuren in handlungsorientierte Erkenntnisse durch beeindruckende Visualisierungen umwandelt.

StatefulSets & Persistente Speicherung in Kubernetes

Kubernetes StatefulSets sind die optimale Lösung für die Verwaltung von zustandsbehafteten Anwendungen, die stabile Identitäten, dauerhafte Speicherung und geordnete Bereitstellungsmuster benötigen – essenziell für Datenbanken, verteilte Systeme und Caching-Schichten.

FLUX.1-dev ist ein leistungsstarkes Text-zu-Bild-Modell, das beeindruckende Ergebnisse liefert, aber dessen Speicherbedarf von über 24GB die Nutzung auf vielen Systemen erschwert. GGUF-Quantisierung von FLUX.1-dev bietet eine Lösung, indem sie den Speicherbedarf um etwa 50% reduziert, während die Bildqualität erhalten bleibt.

Docker Model Runner: Leitfaden zur Konfiguration der Kontextgröße

Konfigurieren von Kontextgrößen im Docker Model Runner ist komplexer, als es sein sollte.

FLUX.1-Kontext-dev: KI-Modell zur Bildvergrößerung

Black Forest Labs hat FLUX.1-Kontext-dev veröffentlicht, ein fortschrittliches Bild-zu-Bild-KI-Modell, das bestehende Bilder mithilfe von Textanweisungen erweitert.

Hinzufügen von NVIDIA-GPU-Unterstützung zum Docker-Modell-Runner

Docker Model Runner ist Docker’s offizielles Tool zum lokalen Ausführen von KI-Modellen, aber die Aktivierung der NVidia-GPU-Beschleunigung in Docker Model Runner erfordert eine spezifische Konfiguration.

Strapi vs Directus vs Payload: Headless-CMS-Vergleich

Die Wahl der richtigen headless CMS kann über den Erfolg Ihrer Content-Management-Strategie entscheiden. Lassen Sie uns drei Open-Source-Lösungen vergleichen, die den Aufbau von contentgetriebenen Anwendungen beeinflussen.

Nextcloud selbst hosten: Ihre private Cloud-Lösung

Nextcloud ist die führende Open-Source-, Self-Hosting-Cloud-Speicher- und Kollaborationsplattform, die Sie vollständig in den Besitz Ihrer Daten bringt.

Self-Hosting

Verwendung der Ollama Web Search API in Python

Vektor-Speicher für RAG-Vergleiche

Verwendung der Ollama Web Search API in Go

RAM-Preisanstieg: Bis zu 619 % im Jahr 2025

Lokales LLM-Hosting: Komplettführer 2025 - Ollama, vLLM, LocalAI, Jan, LM Studio & Mehr

NVIDIA RTX 5080- und RTX 5090-Preise in Australien – November 2025

KI-Infrastruktur auf Consumer-Hardware

Prometheus-Monitoring: Komplette Einrichtung & Best Practices

Grafana auf Ubuntu installieren und verwenden: Komplettanleitung

StatefulSets & Persistente Speicherung in Kubernetes

FLUX.1-dev mit GGUF Q8 ausführen

Docker Model Runner: Leitfaden zur Konfiguration der Kontextgröße

FLUX.1-Kontext-dev: KI-Modell zur Bildvergrößerung

Hinzufügen von NVIDIA-GPU-Unterstützung zum Docker-Modell-Runner

Strapi vs Directus vs Payload: Headless-CMS-Vergleich

Nextcloud selbst hosten: Ihre private Cloud-Lösung