LLM

モデルコンテキストプロトコル（MCP）およびGoでMCPサーバーを実装する際の注意点

ここに、モデルコンテキストプロトコル（MCP）の説明が示されています。MCPサーバーの実装方法の短いノート（GoでのMCPサーバーの実装）も含まれており、メッセージ構造やプロトコル仕様についても記載されています。

Ollama と Qwen3 Reranker モデルを使用したドキュメントの再ランキング - Go 言語で

標準的な Ollama には直接のリランク API がありませんので、クエリとドキュメントのペアに対して埋め込みを生成し、それらをスコアリングすることで、Qwen3 リランカーを使用したリランキング（GO 言語で）を実装する必要があります。

このテストでは、Ollama上でホストされているさまざまなLLMがHugoページを英語からドイツ語に翻訳する方法を比較しています（[英語からドイツ語へのHugoページの翻訳の比較](https://www.glukhov.org/ja/post/2025/06/translation-quality-comparison-llms-on-ollama/ “英語からドイツ語へのHugoページの翻訳の比較”）。

テストした3つのページは、異なるトピックについており、いくつかの構造を持つマークダウンがありました：見出し、リスト、テーブル、リンクなど。

Ollama と Qwen3 Embedding LLM を用いたテキストの再ランク付け - Go 言語で

この小さな Reranking Goコード例はOllamaを呼び出して埋め込みを生成していますクエリと各候補ドキュメントに対して、その後、コサイン類似度で降順にソートします。

Qwen3 Embedding および Reranker モデルは、Qwenファミリの最新リリースで、高度なテキスト埋め込み、検索、再順位付けタスクに特化して設計されています。

PCIe レーンがLLMの性能に与える影響? タスクによります。トレーニングやマルチGPUの推論では、パフォーマンスの低下が顕著です。

Ollama モデルライブラリには、HTML コンテンツを Markdown に変換できるモデルが存在します。これはコンテンツ変換タスクに役立ちます。HTML を Markdown に変換。

検索は、キーワードを使用して情報を迅速かつ直接的に検索するのに最適です。
Deep Search は、文脈や意図を理解し、複雑なクエリに対してより関連性が高く、包括的な結果を提供する点で優れています。

いくつかのAI支援によるコーディングツールおよびAIコーディングアシスタントとその魅力的な特徴について紹介します。

LLMを使用することは非常に費用が高くないため、新しい高性能なGPUを購入する必要があるとは限りません。
LLMを提供しているクラウド上のプロバイダーのリストはこちら: LLMプロバイダー一覧。

テスト: Ollama がインテル CPU のパフォーマンスコアと効率コアをどのように利用しているか

私は理論をテストしたいと思っています - すべてのコアをIntel CPUで使用するとLLMの速度が上がるか？
新しいgemma3 27bitモデル（gemma3:27b、ollama上では17GB）が私のGPUの16GB VRAMに収まらず、部分的にCPU上でも実行されていることが気になります。

現代の世界の混乱の中でここにいて、さまざまなカードのテクスペックを比較で、AI のタスクに適したものを確認しています。
(Deep Learning, オブジェクト検出、 LLMs など)。
しかし、これらはすべて非常に高価です。

Ollama サーバーが同時に2つのリクエストを受けると、その動作は設定と利用可能なシステムリソースに依存します。

Vibe coding は、開発者が自然言語で望む機能を説明し、AIツールが自動的にコードを生成するという、AI駆動型のプログラミングアプローチです。

DeepSeekの 1世代目の推論モデルで、OpenAI-o1と同等の性能を備えています。これは、LlamaおよびQwenに基づいてDeepSeek-R1から蒸留された6つの密なモデルです。

以下は、Ollama コマンドのリストと例です（[Ollama コマンドのチートシート](https://www.glukhov.org/ja/post/2024/12/ollama-cheatsheet/ “ollama commands cheat sheet”））。
以前にまとめたものです。
あなたにとっても役立つことを願っています（役立つことを願っています）。

モデルコンテキストプロトコル（MCP）およびGoでMCPサーバーを実装する際の注意点

Ollama と Qwen3 Reranker モデルを使用したドキュメントの再ランキング - Go 言語で

Hugoページ翻訳品質の比較 - Ollama上のLLM

Ollama と Qwen3 Embedding LLM を用いたテキストの再ランク付け - Go 言語で

Ollama上でのQwen3埋め込みおよび再ランクモデル:最先端の性能

LLMの性能とPCIeレーン：重要な考慮点

LLMとOllamaを使用してHTMLコンテンツをMarkdownに変換する

検索 vs ディープサーチ vs ディープリサーチ

AIコーディングアシスタントの比較

クラウドLLMプロバイダーズ

テスト: Ollama がインテル CPU のパフォーマンスコアと効率コアをどのように利用しているか

NVidia GPUのAI適性比較

Ollamaが並列リクエストを処理する方法

バイブコーディング - 意味と説明

Ollama上でDeepseek-R1をテストする

Ollama チートシート - 最も役立つコマンド