Go to file

Bifang d5c9368c1b 测试版本第一版		2026-06-09 10:38:24 +08:00
.env.example	测试版本第一版	2026-06-09 10:38:24 +08:00
.gitignore	测试版本第一版	2026-06-09 10:38:24 +08:00
MIGRATION_TASKS.md	测试版本第一版	2026-06-09 10:38:24 +08:00
README.md	测试版本第一版	2026-06-09 10:38:24 +08:00
config.py	测试版本第一版	2026-06-09 10:38:24 +08:00
extractor.py	测试版本第一版	2026-06-09 10:38:24 +08:00
graph_store.py	测试版本第一版	2026-06-09 10:38:24 +08:00
main.py	测试版本第一版	2026-06-09 10:38:24 +08:00
meeting1.md	测试版本第一版	2026-06-09 10:38:24 +08:00
meeting_example.md	测试版本第一版	2026-06-09 10:38:24 +08:00
meeting_processor.py	测试版本第一版	2026-06-09 10:38:24 +08:00
meeting_state.py	测试版本第一版	2026-06-09 10:38:24 +08:00
raw_store.py	测试版本第一版	2026-06-09 10:38:24 +08:00
requirements.txt	测试版本第一版	2026-06-09 10:38:24 +08:00
vector_store.py	测试版本第一版	2026-06-09 10:38:24 +08:00

README.md

会议纪要长期记忆系统

基于 LLM + LlamaIndex + 本地状态存储 的会议纪要长期记忆原型，当前聚焦三件事：

会议内容结构化抽取
跨会议行动项与指标状态追踪
语义检索与重复内容过滤

当前处理链路

meeting.md
  -> 内容哈希去重
  -> 语义相似去重
  -> LLM 结构化抽取
  -> 状态合并
  -> 原文归档到 data/raw
  -> 写入向量索引

当前版本已经移除了 Obsidian 作为主流程依赖，后续会继续引入图数据库来承载关系层。

快速开始

cd meeting_memory

python -m venv .venv
.venv\Scripts\pip install -r requirements.txt

copy .env.example .env
# 然后补充 API 配置

.venv\Scripts\python main.py process meeting_example.md

用法

python main.py
python main.py process meeting_example.md
python main.py process meeting_example.md -f
python main.py query "弱光指标目标值是多少"
python main.py stats
python main.py text "今天会议讨论了..."
python main.py batch "meetings/*.md" -f

meeting_memory/
├── config.py              配置
├── extractor.py           LLM 结构化抽取
├── meeting_processor.py   主处理流程
├── meeting_state.py       跨会议状态追踪
├── raw_store.py           原文归档
├── vector_store.py        向量索引与语义检索
├── main.py                CLI 入口
├── data/
│   ├── raw/               原始会议文本归档
│   └── meeting_state.json 状态持久化
└── vector_store_data/     向量索引持久化目录

核心能力

1. 结构化抽取

从会议文本中提取：

标题、日期、参会人
实体
关系
行动项
指标
决策
摘要

2. 长期状态追踪

行动项按 task + assignee 做稳定 ID
指标按 metric_name + owner 做稳定 ID
保留历史状态演化
支持跨会议合并

3. 双重去重

内容哈希精确去重
语义相似度去重

4. 语义检索

会议内容写入向量库
支持自然语言查询
索引持久化，重启自动加载

配置

编辑 .env：

LLM_API_KEY=sk-xxx
LLM_BASE_URL=https://api.deepseek.com/v1
LLM_MODEL=deepseek-chat

EMBEDDING_API_KEY=sk-xxx
EMBEDDING_BASE_URL=https://api.openai.com/v1
EMBEDDING_MODEL=text-embedding-3-small

迁移计划

当前迁移进度见 MIGRATION_TASKS.md。

README.md Unescape Escape

会议纪要长期记忆系统

当前处理链路

快速开始

用法

目录

核心能力

1. 结构化抽取

2. 长期状态追踪

3. 双重去重

4. 语义检索

配置

迁移计划

README.md