AI - Page 4 - Rost Glukhov | Persönliche Website und technischer Blog

LLM-Leistung und PCIe-Lanes: Wichtige Aspekte

Wie PCIe-Lanes die LLM-Performance beeinflussen? Je nach Aufgabe. Bei Training und Multi-GPU- Inferenz ist der Leistungsverlust erheblich.

HTML-Inhalt in Markdown konvertieren mit LLM und Ollama

Im Ollama-Modell-Repository gibt es Modelle, die in der Lage sind, HTML-Inhalt in Markdown umzuwandeln – was für Aufgaben zur Inhaltskonvertierung nützlich ist.

Suche ist am besten geeignet, um Informationen schnell und direkt mit Schlüsselwörtern abzurufen.
Tiefe Suche ist hervorragend darin, den Kontext und die Absicht zu verstehen und dadurch für komplexe Abfragen relevantere und umfassendere Ergebnisse liefert.

Kurzübersicht zur Vergleichsanalyse von KI-Codierassistenten

Hier finden Sie eine Übersicht über einige AI-betriebene Coding-Tools und ihre Vorzüge:

Die Verwendung von LLMs ist nicht sehr teuer, es könnte also kein Bedarf bestehen, neue, beeindruckende GPU-Karten zu kaufen.
Hier ist eine Liste der LLM-Anbieter in der Cloud mit den LLMs, die sie hosten.

Test: Wie Ollama die Leistung und Effizienz der Intel CPU-Kerne nutzt

Ich habe eine Theorie, die ich testen möchte – wenn man alle Kerne eines Intel-Prozessors nutzt, würde das die Geschwindigkeit von LLMs erhöhen? Test: Wie Ollama die Leistung und effizienten Kerne von Intel-Prozessoren nutzt

Es stört mich, dass das neue Gemma3-Modell mit 27 Bit (gemma3:27b, 17 GB auf Ollama) nicht in die 16 GB VRAM meines GPUs passt und teilweise auf dem CPU läuft.

Vergleich der Eignung von NVidia-GPUs für KI

Inmitten der Turbulenzen der modernen Welt hier vergleiche ich die technischen Spezifikationen verschiedener Grafikkarten für KI-Aufgaben
(Deep Learning,
Objekterkennung
und LLMs).
Sie sind jedoch alle unglaublich teuer.

Wie Ollama parallele Anfragen verarbeitet

Wenn der Ollama-Server zwei Anfragen gleichzeitig erhält, hängt sein Verhalten von seiner Konfiguration und den verfügbaren Systemressourcen ab.

Vibe Coding – Bedeutung und Beschreibung

Vibe coding ist ein AI-getriebener Programmieransatz, bei dem Entwickler die gewünschte Funktionalität in natürlicher Sprache beschreiben, wodurch AI-Tools den Code automatisch generieren.

Ich habe MMDetection (mmengine, mdet, mmcv) bereits häufig verwendet,
und jetzt scheint es aus dem Spiel zu sein.
Das ist schade. Ich mochte seine Modellbibliothek.

DeepSeek’s erste Generation von Schlussfolgerungsmodellen mit Leistung, die vergleichbar mit OpenAI-o1 ist, einschließlich sechs dichter Modelle, die aus DeepSeek-R1 basierend auf Llama und Qwen destilliert wurden.

Hier ist die Liste und Beispiele der nützlichsten Ollama-Befehle (Ollama-Befehle-Cheat-Sheet), die ich vor einiger Zeit zusammengestellt habe, zuletzt aktualisiert im Januar 2026. Hoffentlich wird es Ihnen auch nützlich sein!

Vor nicht allzu langer Zeit wurde veröffentlicht. Lassen Sie uns aufschließen und
testen, wie Mistral Small sich im Vergleich zu anderen LLMs schlägt.

Reranking ist der zweite Schritt im Retrieval Augmented Generation (RAG) systemen, direkt zwischen Retrieving und Generating.

Kürzlich hat Black Forest Labs eine Reihe von
text-to-image AI-Modellen veröffentlicht.
Diese Modelle sollen eine deutlich höhere Ausgabegüte haben.
Lasst uns sie ausprobieren

Hervorragende Nahrung ist auch ein Vergnügen für die Augen. Aber in diesem Beitrag vergleichen wir zwei AI-basierte Suchsysteme, Farfalle und Perplexica.

AI

LLM-Leistung und PCIe-Lanes: Wichtige Aspekte

HTML-Inhalt in Markdown konvertieren mit LLM und Ollama

Suche vs. Deepsearch vs. Deep Research

Kurzübersicht zur Vergleichsanalyse von KI-Codierassistenten

Cloud-LLM-Anbieter

Test: Wie Ollama die Leistung und Effizienz der Intel CPU-Kerne nutzt

Vergleich der Eignung von NVidia-GPUs für KI

Wie Ollama parallele Anfragen verarbeitet

Vibe Coding – Bedeutung und Beschreibung

MMdetection wird nicht mehr unterstützt

Testen von Deepseek-R1 mit Ollama

Ollama Cheatsheet - die nützlichsten Befehle - Update 2026

Mistral Small, Gemma 2, Qwen 2.5, Mistral Nemo, LLama3 und Phi – LLM-Test

Reranking mit Embedding-Modellen

Flux Text-zu-Bild KI-Modell

Farfalle vs. Perplexica