RAG

知識システムにおける「検索」と「表現」

知識システムにおける「検索」と「表現」

検索は知識構造ではない

最新の知識システムのほとんどは検索(Retrieval)を最適化しています。それは理解できることです。検索は目に見えやすく、デモンストレーションも容易で、機能すると魔法のように感じられます。質問を入力すれば、答えが返ってきます。

LLM Wiki:RAGでは代替できない統合された知識

LLM Wiki:RAGでは代替できない統合された知識

AIシステム向けの構造化された知識

前提はシンプルです。コンパイルされた知識は、取得された断片的な情報よりも再利用性が高いというものです。 RAG(検索強化生成)は、LLM(大規模言語モデル)に外部知識へのアクセスをどのように与えるかという直接的な問いに対するデフォルトの答えとなりました。

PKM、RAG、Wiki、メモリシステムの明確な比較と解説

PKM、RAG、Wiki、メモリシステムの明確な比較と解説

現代の知識システムの地図

PKM、RAG、ウィキ、およびAIメモリシステムは、しばしば同じ問題を解決するものとして議論されます。 しかし、そうではありません。 これらはすべて知識を扱いますが、異なるレイヤーで動作しています:

エンジニアとナレッジワーカーのための「セカンドブレイン」解説

エンジニアとナレッジワーカーのための「セカンドブレイン」解説

ノートは記憶であり、セカンドブレインは計算である

情報過多(インフォメーションオーバーロード)の問題は、単に情報の量が多すぎるという点よりも、処理されていない入力が多いという点にあります。現代の知識労働は、タブ、チャットのやり取り、ドキュメント、ハイライト、スニペット、文字起こし、スクリーンショット、そして書きかけのメモといった痕跡を残します。

Pythonで堅牢なLLM構造化出力の検証

Pythonで堅牢なLLM構造化出力の検証

「雰囲気」に頼る解析をやめ、契約を検証せよ。

ほとんどのLLM「構造化出力」チュートリアルは、本気度にかけるものです。 それらは、JSONを丁寧な口調でリクエストし、モデルが適切に動作することを祈る方法を教えます。 それでは検証ではありません。 それは単に括弧で囲まれた楽観主義にすぎません。

RAG と検索向けのテキスト埋め込み - Python、Ollama、OpenAI 互換 API

RAG と検索向けのテキスト埋め込み - Python、Ollama、OpenAI 互換 API

RAG エンベッディング - Python、Ollama、OpenAI API。

検索拡張生成 (RAG) を実装されている方に向けて、このセクションではテキスト埋め込み(text embeddings)について平易な言葉で解説します。埋め込みとは何か、検索や検索(リトリバル)にどのように組み込まれるか、そしてOllamallama.cppベースのサーバーが提供するOpenAI 互換の HTTP API を使用して、Pythonから 2 つの一般的なローカル環境を呼び出す方法を説明します。

RAGにおけるチャンキング戦略の比較:代替案、トレードオフ、および例

RAGにおけるチャンキング戦略の比較:代替案、トレードオフ、および例

RAGにおけるチャンキング戦略の比較

Chunking は、Retrieval ‑ Augmented Generation (RAG) において 最も過小評価されている ハイパラメータです。
静かに、LLM が「何を見ているか」を決定し、インジェストのコストをどのくらい高めるか、そしてLLMのコンテキストウィンドウがどのくらい使われるかを決めています。

LLMのセルフホスティングとAI主権

LLMのセルフホスティングとAI主権

セルフホスト型LLMでデータとモデルを制御

LLM(大規模言語モデル)のセルフホスティングは、データ、モデル、推論をあなたの管理下に保つものであり、チーム、企業、国家にとって AI主権 を実現するための実用的な手段です。