RAG

RAG と検索向けのテキスト埋め込み - Python、Ollama、OpenAI 互換 API

検索拡張生成 (RAG) を実装されている方に向けて、このセクションではテキスト埋め込み（text embeddings）について平易な言葉で解説します。埋め込みとは何か、検索や検索（リトリバル）にどのように組み込まれるか、そしてOllamaやllama.cppベースのサーバーが提供するOpenAI 互換の HTTP API を使用して、Pythonから 2 つの一般的なローカル環境を呼び出す方法を説明します。

RAGにおけるチャンキング戦略の比較：代替案、トレードオフ、および例

Chunking は、Retrieval ‑ Augmented Generation (RAG) において 最も過小評価されている ハイパラメータです。
静かに、LLM が「何を見ているか」を決定し、インジェストのコストをどのくらい高めるか、そしてLLMのコンテキストウィンドウがどのくらい使われるかを決めています。

検索拡張生成（RAG）チュートリアル：アーキテクチャ、実装、および本番導入ガイド

Production-focused guide to building RAG systems: chunking, vector stores, hybrid retrieval, reranking, evaluation, and when to choose RAG over fine-tuning.

RAG 比較のためのベクトルストア

適切なベクトルストアを選択することは、RAG アプリケーションのパフォーマンス、コスト、スケーラビビリティを決定づけます。この包括的な比較では、2024-2025 年における最も人気のあるオプションを取り上げています。

クロスモーダル埋め込み: AIモダリティの橋渡し

クロスモーダル埋め込みは、人工知能において画期的な進展をもたらし、統一された表現空間内で異なるデータタイプ間の理解と推論を可能にします。

高度な RAG: LongRAG、Self-RAG、GraphRAG の解説

検索拡張生成 (RAG) は、単純なベクトル類似度検索の域を遥かに超えて進化しました。LongRAG、Self-RAG、GraphRAG は、これらの能力の最先端を代表しています。

Ollama と Qwen3 Reranker モデルを用いたドキュメントの再評価 - Go での実装

標準の Ollama には直接的なリランク API がないため、クエリ - ドキュメントペアのエンベッディングを生成してスコアリングを行うことで、Go 言語による Qwen3 Reranker を使ったリランキングを実装する必要があります。

Ollama と Qwen3 Embedding LLM を用いたテキストの再ランキング - Go 実装

この小さな Reranking Go コード例は、クエリと各候補ドキュメントの埋め込みを生成するために Ollama を呼び出し、その後、コサイン類似度で降順にソートします。

Ollama 上の Qwen3 埋め込みモデルとリランカーモデル：最先端のパフォーマンス

Qwen3 埋め込みモデルとreranker モデルは、Qwen ファミリー最新リリースであり、高度なテキスト埋め込み、検索、再ランク付けタスクに特じて設計されています。

2026 年における検索、ディープ・サーチ、ディープ・リサーチの比較

検索（Search） は、キーワードを使用して素早く直接的な情報を取得するのに最適です。
ディープ検索（Deep Search） は、文脈と意図を理解することに優れており、複雑なクエリに対してより関連性が高く、包括的な結果を提供します。

埋め込みモデルによる再評価

Reranking は、Retrieval Augmented Generation (RAG) システムにおける 2 番目のステップであり、Retrieval（検索）と Generation（生成）の間に位置します。