AI 数据通道:JSON·Markdown

互联网让知识可以自由传播;数字记忆让经验可以可信流通。

元认知:我们可能一直在问错问题 #

今天所有人都在讨论:AI 能不能更聪明?Agent 能不能自动工作?模型还能不能更强?

但这些都建立在一个假设上:

AI 的记忆属于 AI 公司。

今天的 AI 服务——ChatGPT、Claude、Gemini——它们的 Memory 都存放在平台。因此它们只是 Personalized AI(个性化 AI),而不是 Personal AI(真正属于个人的 AI)。这两者有本质区别——前者的”个性”是平台给你的,后者的”个性”是你自己的。

操作系统都有 Root,Personal AI OS 的 Root 在哪里 #

Linux 有 Root。Windows 有 Administrator。互联网有 DNS Root。

Personal AI OS 的 Root 今天还不完整。

所以主流 AI 服务都只能重新认识你。换一个模型,Memory 全没了。如果真正存在 Personal AI OS,它的架构应该是:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
                Person


Personal Root Device

┌───────────┼───────────┐
│ │ │
Identity Memory Permission
│ │ │
└───────────┼───────────┘

Memory Protocol

┌──────────────┼──────────────┐
│ │ │
ChatGPT Claude 未来任何 AI

AI 只是读取者,不是拥有者。Memory 应该属于用户。

记忆有两种,Agent 缺的是第二种 #

人脑有两种记忆系统:

  • 陈述性记忆——“知道什么”(巴黎是法国首都、你上周说过喜欢暗色模式)
  • 程序性记忆——“知道怎么做”(骑自行车、部署一个 Hexo 博客)

当前大部分 Agent 的”记忆”是陈述性的——记住你说了什么。Hermes 的突破在于程序性记忆——完成复杂任务后把成功路径沉淀为 skill,skill 在使用中持续改进。

陈述性记忆让 Agent”想起”你上次说了什么。程序性记忆让 Agent”会做”它上次不会的事。前者是检索增强,后者是能力增长。

Personal AI OS 的”缺失的根”,不是缺一个 Agent runtime,不是缺一个 MCP 协议,不是缺一个工具市场——是缺一个让 Agent 越用越懂你、越用越会做事的数字记忆层。这个记忆层必须同时具备陈述性记忆和程序性记忆,并且是独立于 Agent 框架的基础设施——换 AI 不丢记忆。

这不是 2026 年才有的需求。80 年前就有人看到了。


一、Memex(1945):所有数字记忆的起点 #

1945 年,Vannevar Bush 在《As We May Think》中提出了 Memex(Memory Extender):

一个个人化的设备,存储一个人所有的书籍、记录和通信,且以关联索引(associative indexing)的方式组织——不是按字母顺序,而是按照思维联想的路径,一条 trail 连到下一条。

Memex 的两个核心设计,80 年后仍然是所有数字记忆系统的目标:

  1. 全量存储——记录一切,不丢弃
  2. 关联检索——不按目录找,按”思维联想”找

80 年来,”全量存储”随着存储成本下降已不再是问题——一个几 TB 的硬盘可以存下一个人一生的文本和图片。”关联检索”才是真正的瓶颈——如何让机器理解”这个概念和那个概念有关联”?

Memex 的悲剧是:它预见了一切,但 1945 年的索引引擎——缩微胶片和机械选择器——无法实现”关联”。直到 LLM 出现,”理解概念之间的关联”才终于有了技术载体。

LLM 天然就是”关联引擎”——它通过向量空间把”意思相近”的东西放在附近。这不是 Memex 的机械选择器能做到的。2026 年的 Mem0、GBrain、MemOS,本质上都是在用 LLM 的理解能力实现 Memex 80 年前的愿景。

但 Memex 缺了一个更根本的东西——所有权。Memex 是你的设备,但今天的 AI 记忆在云上。这个缺口 80 年来没有被填补。


二、MyLifeBits:全量记录的实验与教训 #

2001 年,微软研究院的 Gordon Bell 开始了 MyLifeBits 实验——把自己的一切数字化:文档、照片、电话录音、浏览历史、邮件、屏幕截图。目标是验证 Memex 的”全量存储”可行性。

实验持续了二十多年。结论是双面的:

发现说明
存储不是瓶颈一个人的全量数字记录,文本+图片,TB 级别即可
检索是瓶颈“我记得 2007 年和某人讨论过某个话题”——怎么找?关键词搜索找不到语义关联
理解是更大的瓶颈找到了文档,但”这段对话意味着什么”需要人脑解读——机器做不到
遗忘是必要的全量记录导致信息过载——没有遗忘机制,记忆变成噪音

Gordon Bell 的实验证明了 Memex 的”存储”部分可以做到。但”关联检索”——让机器理解概念之间的关系——需要的是一个理解引擎,而不是更大的索引。这个引擎在 2022 年后出现了:LLM。

MyLifeBits 的”遗忘是必要的”这个教训,在 2026 年的 Mem0 上重现了——Mem0 的 ADD-only 策略让记忆只增不减,长期使用后变成”记忆垃圾场”。没有遗忘机制的记忆系统不是记忆,是堆栈。


三、Lifelog:从主动记录到被动采集 #

MyLifeBits 需要主动把东西数字化。Lifelog 更进一步——被动采集一切

2003 年,DARPA 启动了 LifeLog 项目——用传感器自动记录一个人的一切:GPS、体温、心率、周围声音、拍摄的照片。目标是创建一个”数字孪生”。项目在启动前被取消(隐私争议),但学术界延续了这个方向:

  • SenseCam(微软)——挂在脖子上的自动拍照设备,每 20-30 秒拍一张
  • 量化自我运动(Quantified Self)——用 Apple Watch、手机传感器被动采集健康数据
  • Apple Recall(2024-2025 专利)——据媒体报道的”数字记忆”产品,用 AI 理解你的全部数字活动

Lifelog 的核心洞察是:主动记录有摩擦,被动采集才是持续的方式。 你不会每天手动写日记,但你的手机已经在每天记录你的位置、步数、心率、浏览历史。

问题是:这些数据被采集了,但没有被理解。Apple Watch 知道你今天走了 8000 步,但它不知道”你为什么走这 8000 步”。Lifelog 缺的不是数据采集,是一个理解引擎。

LLM 是这个理解引擎。它可以读你的日历、邮件、消息记录,理解”你今天做了什么、和谁聊了什么、心情怎么样”。Memex 的”全量存储”被 Lifelog 用传感器实现了,MyLifeBits 的”理解瓶颈”被 LLM 解决了。剩下的拼图是:如何让这些理解结构化、可关联、可检索


四、Memory Point:数字记忆的最小单位 #

在讨论结构化之前,需要定义”数字记忆”到底存什么。

数字记忆不是聊天记录,不是数据库,更不是向量数据库。它应该有一个最小单位:

Memory Point(记忆点)——任何能够客观描述一个事实的内容。

1
2
3
4
今天认识了张三。
今天完成了 OpenClaw 的部署。
今天决定开始创业。
今天猫过生日。

这些都是记忆点。每个记忆点只有最基本的信息:

字段说明
时间何时发生
事实发生了什么
来源从哪来的——对话、传感器、手动记录
重要程度1-5 星
标签分类
关联人物涉及谁
关联项目涉及什么项目

如果需要更多细节——会议录音、聊天记录、照片、视频、代码、文档——这些是附件。主体永远是事实,不是原始数据。

数字记忆不是 Everything Storage(保存一切),而是 Meaning Storage(保存意义)。每天发生一百万件事,最后留下几十个真正重要的记忆点。

这是 MyLifeBits 教训的工程化——不是全量保存,而是选择性保存有意义的记忆点,原始数据作为附件可选展开。


五、知识图谱:Memory Point 连成经验网络 #

有了记忆点,下一个问题是:它们之间什么关系?

Memex 的”关联索引”是所有数字记忆系统最难实现的部分。关键词搜索做不到关联——“记忆”和”memory”关键词不匹配但语义相同。向量搜索做到了语义关联,但缺少结构化关系

Google 在 2012 年向公众推出 Knowledge Graph,核心理念是:不只是文档之间的相似度,而是实体之间的类型化关系

1
2
3
4
Bob —[works_at]→ Acme
Bob —[attended]→ Stanford
Bob —[invested_in]→ Startup X
Acme —[competitor_of]→ Startup X

这些”类型化边”让推理成为可能——“Bob 投资了 Acme 的竞争对手”不是一个文档,是一个从图遍历推导出的结论

知识图谱和向量搜索看到不同的世界。向量是”意思搜索”——“记忆”匹配”memory”。图遍历是”关系搜索”——“Bob 投资了谁”需要沿着 invested_in 边走。两者互补,缺一不可。

GBrain 在 2026 年实现了这个理念——自接线知识图谱用零 LLM 调用[[wiki/people/bob]] 式引用中提取实体关系,创建类型化边。P@5 49.1%,比纯向量检索高 31.4 个百分点。这证明了知识图谱不是向量搜索的替代,而是必要的补充

经验网络的本质是:不存储”结论”,存储”关系”。 结论可以从关系推导出来。这比存储”Bob 和 Startup X 有利益冲突”更灵活——因为关系是原子的,结论可以随上下文变化。


六、TEE:记忆是隐私,需硬件级保护 #

如果 Agent 的记忆存储了你的一切——对话、偏好、工作流、人际关系——那它就是你最隐私的数据。比浏览器历史更隐私,比聊天记录更隐私。因为记忆不仅记录了你说什么,还记录了你怎么想

当前所有 Agent 记忆方案的安全模型:

项目安全模型问题
Mem0服务端加密 + API Key服务端可以看到你的记忆
GBrain自托管(你的服务器)服务器被入侵 = 记忆泄露
MemOSDocker 隔离容器逃逸 = 记忆泄露
ChatGPT Memory平台存储平台完全拥有你的记忆

这些都是软件级隔离——如果攻击者获得了服务器 root 权限,所有记忆暴露。

Trusted Execution Environment(TEE) 是硬件级隔离:

1
2
3
4
5
6
普通内存                  安全内存(TEE)
↑ ↑
操作系统可以读写 操作系统不能读写
其他进程可以读写 其他进程不能读写
即使 root 权限也 即使 root 权限也
可以访问 不能访问

ARM TrustZone、Intel SGX、AMD SEV、Apple Secure Enclave——这些技术创造了一块连操作系统都无法访问的内存区域

为什么这对 Personal AI OS 至关重要?因为记忆是”数字自我”的核心。如果记忆可以被第三方读取,那它就不是”你的”记忆,是”被托管”的记忆。

但真正重要的不是隐私,而是所有权。如果 Memory 在平台,AI 属于平台。如果 Memory 在个人,AI 才真正属于个人。


七、Personal Root Device:为什么需要物理设备 #

主流的 AI 服务属于 AI 公司。云属于云厂商。谁属于你?

没有物理设备作为”根”,Memory 只能在平台上——而平台上的 Memory 永远是”被托管”的。

这就是为什么需要一个 Personal Root Device——它可以像手表、项链、戒指,甚至一张卡片。重要的不是外形,而是:它永远属于你,默认离线。

1
2
3
4
5
6
7
8
9
10
11
12
默认:Never Online

所有数据交换:只能通过物理连接

电脑

USB-C

Memory Device

没有云同步。没有账号。没有服务器。
只有用户主动授权。

最彻底的安全来自不连接,而不是加密以后再联网。

AI 永远只是访客——它申请权限读取 Memory,读取结束权限立即失效。AI 不保存任何数据,Memory 永远不会离开设备。

1
2
3
4
读取最近七天:OpenClaw 项目。
允许:√ / 拒绝:×

读取结束。权限立即失效。

Apple 在 2024 年的 Apple Intelligence 中已经开始用 Secure Enclave 处理个人 AI 数据——这是 TEE 在消费级 AI 中的大规模应用之一。但 Apple 的方案是封闭的——记忆锁在 Apple 生态内。开源世界需要一个开放的 Personal Root Device。


八、Memory Protocol:比硬件更重要的是协议 #

如果未来真的存在 Personal AI OS,最重要的不是手表,而是协议

硬件可以换,AI 可以换,但协议是基础设施。它需要回答几个最基本的问题:

问题说明
什么是一条记忆点?格式定义——时间、事实、来源、重要程度、关联
如何证明它真实发生?来源签名——对话记录、传感器数据、手动记录各有不同信任级别
如何保证不可篡改?append-only 日志 + 密码学哈希(Merkle Tree 结构,无需公链)
如何记录来源?谁产生的记忆点——用户、Agent、传感器
如何授权别人读取?临时令牌——授权有时效,到期自动失效
如何授权 AI 学习?区分”读取”和”学习”——AI 可以读但不能持久化
如何继承?遗嘱机制——用户去世后的记忆归属
如何交易?记忆作为数字资产的交易协议
如何撤销授权?撤销令牌传播到所有持有者

只有协议存在,任何硬件、任何 AI、任何公司才能共同工作。MCP 协议统一了”Agent 调用工具”的接口,但还没有一个协议统一”Agent 读写记忆”的接口。


九、2026 年的拼图:碎片完整但不统一 #

把所有线索放在一起,Personal AI OS 的记忆层应该长这样:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
┌─────────────────────────────────────────┐
│ Agent Runtime(OpenClaw/Hermes) │ ← 已有
├─────────────────────────────────────────┤
│ 工具调用 + MCP 协议 │ ← 已有
├─────────────────────────────────────────┤
│ ┌─────────────────────────────┐ │
│ │ 数字记忆层 │ │ ← 缺失的根
│ │ │ │
│ │ Memory Point(最小单位) │ │
│ │ 关联检索(LLM + 图谱) │ │
│ │ 陈述性 + 程序性记忆 │ │
│ │ 遗忘机制(Mean Storage) │ │
│ │ 硬件级隐私(TEE) │ │
│ │ Personal Root Device │ │
│ │ Memory Protocol │ │
│ │ 独立于 Agent 框架 │ │
│ └─────────────────────────────┘ │
├─────────────────────────────────────────┤
│ 操作系统 / 硬件 │
└─────────────────────────────────────────┘

2026 年,每个拼图碎片都有了对应的实现:

碎片对应理念当前实现缺什么
全量采集Memex / Lifelog手机传感器被动采集没有统一接口给 Agent
Memory PointMean Storage无——所有项目都是 chunk/向量格式未定义
关联检索Memex 关联索引LLM 向量检索 + 知识图谱两者未统一
陈述性记忆MyLifeBitsMem0(LoCoMo 91.6 分)遗忘机制不足
程序性记忆Hermes skill 自创建Hermes Agent + agentskills.io质量无防护
经验网络知识图谱GBrain 自接线图谱 + MemOS graph依赖结构化数据
硬件隐私TEEApple Secure Enclave开源项目未集成
物理根设备Personal Root Device概念阶段
记忆协议Memory ProtocolMCP(工具接口,非记忆接口)记忆读写协议不存在
框架独立数据库独立于应用Mem0 独立服务普及率低

没有任何一个项目同时覆盖了所有碎片。 MemOS 最接近(L1/L2/L3/Skills 自演化 + 多模态 + OpenClaw/Hermes 插件),但缺 TEE、Personal Root Device 和 Memory Protocol。Mem0 做了检索和独立服务,但缺图谱和程序性记忆。GBrain 做了图谱和综合层,但缺多模态和框架独立。

这就是”缺失的根”——不是没有人在做,是每个人做了一块碎片,没有人把碎片拼起来。


十、缺陷与批判:为什么碎片拼不起来 #

缺陷一:LLM 理解 ≠ 人脑理解 #

Memex 的愿景是”按思维联想检索”。LLM 做到了语义关联——“记忆”匹配”memory”。但 LLM 的”理解”是概率推理,不是因果推理。它知道”Bob 和 Acme 相关”(因为文本里经常一起出现),但不知道”Bob 离开 Acme 了”意味着关系变化。

从原理角度说:LLM 的向量空间是统计关联,不是因果推理。知识图谱补了一部分——类型化边是显式关系,比向量隐含关联精确。但建图的成本和图的维护(关系变化时更新边)都是挑战。GBrain 用零 LLM 模式匹配建图解决了成本,但只能处理结构化引用,非结构化文本仍需 LLM。

缺陷二:遗忘比记忆更难 #

MyLifeBits 教训之一是”遗忘是必要的”。但如何让 Agent 遗忘?

人脑的遗忘不是删除——是衰减。不常用的记忆变得模糊但不清零,重要的记忆被强化。Mem0 的 ADD-only 是”只增不减”——简单但不可持续。GBrain 的 dream cycle 是”夜间整理”——去重、修复引用、发现矛盾,但没有真正的遗忘。

遗忘的工程难题是:怎么判断一条记忆”不重要”? 一条今天看起来无关紧要的对话,可能三年后成为关键线索。人脑用情感强化和频率衰减来遗忘,但 Agent 没有”情感”这个信号。Mean Storage(保存意义)是对的方向,但”什么是有意义的”需要 LLM 判断——而 LLM 的判断本身不完美。

缺陷三:TEE 的性能代价 #

TEE 提供了硬件级隐私,但有代价:TEE 内的内存是受限的——通常只有几 MB 到几十 MB。Agent 的记忆如果全部存在 TEE 内,放不下;如果部分在 TEE 外,那部分不安全。

从原理角度说:安全性和可用性是根本矛盾。你不可能同时做到”记忆完全不可被第三方访问”和”记忆可以被任意大的 LLM 高速检索”。TEE 适合存储最敏感的元数据,不适合存储全量对话历史。分层安全——敏感数据在 TEE,一般数据在加密存储——是更务实的方案,但增加了架构复杂度。Personal Root Device 的”默认离线”是另一个方向——不连接比加密更安全,但牺牲了实时性。

缺陷四:程序性记忆的漂移 #

Hermes 的 skill 自动创建解决了”Agent 越用越会做事”的问题,但引入了新风险——skill 漂移

如果 Agent 第一次做某个任务时走了一条错误路径,它会把错误路径沉淀为 skill。之后每次做类似任务,都会调用这个有 bug 的 skill。错误被固化了。

人脑有”纠错机制”——做错了事会感到痛苦,痛苦信号强化正确的记忆。Agent 没有这个信号。MemOS 的 L2 Policies 和 L3 World Model 如果建立在错误数据上,整个记忆系统会”学会错误”。

缺陷五:协议不存在 #

最根本的问题:Memory Protocol 不存在

MCP 统一了”Agent 调用工具”的接口——什么是工具、怎么发现、怎么调用。但”什么是记忆点、怎么读写、怎么授权、怎么撤销”——没有协议。每个项目用自己的格式:Mem0 用 JSON、GBrain 用 wiki 链接、MemOS 用 MemCube。

从原理角度说:协议是基础设施的根基。HTTP 定义了 Web,SMTP 定义了邮件,MCP 定义了 Agent 工具调用。没有 Memory Protocol,数字记忆就不可能成为基础设施——它只能是某个项目的功能。协议需要标准,标准需要共识,共识需要时间。

缺陷六:所有权 vs 可用性的根本矛盾 #

用户要求数字记忆”永远属于个人”——默认离线,物理设备存储。但 AI 要”实时读取”——在线、低延迟、大上下文。

这是 Personal AI OS 最根本的矛盾:记忆的所有权要求离线,AI 的可用性要求在线。 完全离线 = AI 不能用你的记忆。完全在线 = 记忆不属于你。折中方案是”授权代理”——Memory 在物理设备上,AI 通过临时授权读取——但授权过程中的数据缓存、延迟、安全边界都是未解的工程问题。本地模型(如 Ollama)可以离线运行,但无法访问云端模型的能力。


十一、经验作为新的生产资料 #

如果数字记忆实现了——Memory Point、经验网络、Memory Protocol、Personal Root Device 全部到位——它改变的不只是 AI 体验,而是生产资料的形态

时代生产资料数字记忆改变什么
农业时代土地
工业时代机器
互联网时代数据数据可以被复制,没有所有权
AI 时代经验经验通过数字记忆第一次成为可拥有、可授权、可交易的数字资产

互联网传播的是知识——易于被复制,难以追溯来源。数字记忆传播的是经验——长期积累形成的决策能力,不可复制(因为它是你独特经历的产物)。

1
Memory Point → Experience Graph → Decision Pattern → Capability

一个医生四十年临床经验,今天退休后几乎全部消失。未来:数字记忆可以形成 Experience Package——带作者、来源、时间、签名、所有权、授权、收益。别人购买的是经验,不是聊天记录。

数字记忆让经验第一次拥有:作者、来源、时间、签名、所有权、授权、收益。它开始成为真正的数字资产。不是秘密——可以共享、可以授权、可以交易、甚至可以继承。真正不能发生的是篡改。


总结:数字记忆是什么 #

数字记忆不是 AI 的一个功能。它是 Personal AI OS 的根。

没有记忆的 Agent,每次对话从零开始——它是工具,你用完就走。有记忆的 Agent,越用越懂你——它开始像”你的数字分身”。

80 年前,Vannevar Bush 在 Memex 中预见了这个需求——存储一切、按关联检索。但 1945 年的索引引擎做不到关联。20 年前,Gordon Bell 在 MyLifeBits 中证明了全量存储可行——但发现瓶颈不在存储,在理解。Lifelog 用传感器实现了被动采集——但数据没被理解。知识图谱给了结构化的关系模型——但建图成本高。TEE 给了硬件级隐私保障——但开源项目还没用上。

2026 年,LLM 终于成为了 Memex 缺失的”理解引擎”。Mem0 做了高效的陈述性记忆检索。GBrain 做了零成本的知识图谱建边。Hermes 做了程序性记忆的自动沉淀。MemOS 试图做”记忆操作系统”。MCP 统一了工具调用接口。

但碎片没有拼起来。

数字记忆不是为了让 AI 更懂你,而是为了让人在 AI 时代依然拥有自己的经验、身份与创造力。

它需要:Memory Point 作为最小单位 + 经验网络作为结构 + Memory Protocol 作为标准 + Personal Root Device 作为物理根 + TEE 作为安全地基 + 遗忘机制作为可持续性 + 独立于任何 AI 框架。

没有数字记忆,就只有越来越强大的 AI;有了数字记忆,才有可能诞生真正属于每个人的 Personal AI OS。

模型可以更换。公司可以倒闭。硬件可以升级。协议可以迭代。但是:一个人的生命只有一次,一个人的经验不可重来。数字记忆真正保存的不是过去,而是一个人的生命连续性(Life Continuity)


信息来源声明 #

本文的思想线索来自以下来源:

  • Memex:Vannevar Bush, “As We May Think” (1945)——数字记忆的起点
  • MyLifeBits:Gordon Bell & Jim Gemmell, Microsoft Research (2001-2010s)——全量记录实验
  • Lifelog:DARPA LifeLog (2003) 及学术界延续——被动采集研究
  • TEE:ARM TrustZone / Intel SGX / Apple Secure Enclave——硬件级安全
  • 知识图谱:Google Knowledge Graph (2012) 及 GBrain 自接线图谱 (2026)——结构化关系
  • Mem0:github.com/mem0ai/mem0——独立记忆服务(LoCoMo 91.6, LongMemEval 94.8)
  • GBrain:github.com/garrytan/gbrain——综合层 + 自接线知识图谱(P@5 49.1%)
  • MemOS:github.com/MemTensor/MemOS——记忆操作系统(L1/L2/L3/Skills 自演化)
  • Hermes Agent:github.com/NousResearch/hermes-agent——程序性记忆(skill 自创建)
  • Gwern.net:gwern.net/about——“写给未来的自己”的写作哲学