AI 시스템 메모리 — 지속적 지식 및 에이전트 메모리
단일 채팅 세션을 넘어 지속되는 지식
이 섹션에서는 AI 시스템의 지속적인 지식과 메모리에 대한 가이드를 수집합니다. 즉, 어시스턴트가 모든 토큰을 하나의 프롬프트에 넣지 않고도 세션 간에 사실, 선호도 및 압축된 컨텍스트를 어떻게 유지하는지에 대한 내용입니다. 여기서 메모리는 GPU RAM이나 모델 가중치가 아닌, 의도적인 유지(사용자 사실, 요약, 플러그인 기반 저장소)를 의미합니다.
이 내용은 OpenClaw, Hermes, 오케스트레이션 등 더 넓은 AI 시스템 클러스터를 보완하며, 검색 메커니즘에 관한 RAG 및 모델 실행에 관한 LLM 호스팅과 함께 제공됩니다.
메모리는 라우팅, 도구 사용, 관찰 가능성과 함께 AI 어시스턴트 아키텍처에 설명된 더 넓은 어시스턴트 스택 내부에 위치합니다.
어시스턴트를 위한 메모리 설계
단기, 구조화 및 검색 메모리에 대한 크로스 프레임워크 가이드 — 통합 정책, 벡터 트레이드오프, 그리고 OpenAI, LangGraph, Hermes, OpenClaw의 패턴.
- 실제로 도움이 되는 AI 어시스턴트의 메모리 시스템 — 작업 기억, 구조화된 상태, 검색 계층, 그리고 메모리가 도움이 되는 경우와 해가 되는 경우
에이전트 메모리 제공자
Hermes Agent와 OpenClaw와 같은 프레임워크에서 노출되는 드롭인 백엔드 — Honcho, OpenViking, Mem0, Hindsight 등 — 다양한 LLM, 임베딩 및 데이터베이스 트레이드오프를 제공합니다.
- 에이전트 메모리 제공자 비교 — 전체 표, 의존성 참고 사항, 그리고 Hermes
memory setup흐름
Hermes 전용 유한 핵심 메모리(MEMORY.md / USER.md)에 대해서는 **Hermes 에이전트 메모리 시스템**을 참조하십시오.
지식 그래프 및 Cognee
검색 인지 어시스턴트를 위해 그래프로 추출된 기관 및 프로젝트 지식.
- Cognee 셀프 호스팅 — Ollama에서 LLM 선택 — 로컬 모델과 함께하는 실습용 Cognee 빠른 시작
- Cognee에 적합한 LLM 선택 — 로컬 Ollama 설정 — 그래프 품질 대 하드웨어 모델 비교
Cognee와 같은 그래프 빌더는 일반적으로 사용자가 이미 편집한 Markdown vault, 위키 또는 수출물을 가져옵니다. 중요성, 명명 및 “왜 이것이 중요한지”는 청크가 임베딩에 도달하기 전에 대부분 결정되어 있습니다. 부주의한 업스트림 코퍼스(데이터 집합)는 모호성을 어시스턴트에 다시 학습시킵니다. 표현을 통한 체계적인 캡처 워크플로우가 이러한 손상을 제한합니다. 이러한 인간 중심의 프레임워크(검색 중심 RAG와의 차이점 포함)에 대해서는 엔지니어를 위한 두 번째 뇌 설명을 참조하십시오.