2026 年 Agent 圈有个说法:「龙虾当先」(OpenClaw 网关与技能栈)——你花大量时间配 Skill、写 Prompt、拉工作流,AI 才会「像工程师」;关掉会话,跨周的决策理由仍要重讲一遍。紧接着 OpenHuman 在 GitHub Trending 上再度刷屏:口号变成「不用你教,20 分钟一轮同步,把你的一切写进本地知识库」。
这不是又一篇 Star 数科普。本文聚焦「连 — 抓 — 记」三步:如何在 Early Beta 前提下,用最小权限接 Gmail、GitHub、日历等源,让记忆树(SQLite + 可导出 Obsidian Markdown)真的服务于「懂你」,而不是多一个吃 Token 的黑盒。若你还没读过项目定位,可先对照本站《GitHub 爆火的 OpenHuman,到底是什么?》。
1. 「虾马」解决了什么,又留下了什么?
社区把「虾马」当作 Agent 1.5 代的缩影,并非两家公司的注册商标,而是两种你仍在「教」AI 的路线:
- 「虾」侧(集成型):像 OpenClaw 网关 + ClawHub 技能——强项是 Webhook、Cron、多通道消息,但要自己装技能、跑 doctor、守权限。
- 「马」侧(流程型):像 mattpocock/skills——用
/grill-me、/tdd把工程纪律写进对话,但 CONTEXT.md 与仓库规则仍要你维护。
共同点:跨 Gmail、GitHub、Notion、日历的个人上下文不会自动汇聚;关掉 IDE,上周的「为什么选方案 B」仍要靠人复述。Andrej Karpathy 在 2026 年强调的「个人知识库」路径——把笔记、邮件、代码决策沉淀成可检索 Markdown——在虾马体系里往往仍是手工活。
OpenHuman 的叙事则是:把 Karpathy 式知识库做成后台流水线。官方文档与社区评测描述的核心循环是:OAuth 连接 → 约每 20 分钟增量同步 → 清洗压缩进「记忆树」→ 对话时按任务路由模型并检索片段。Star 数请以 GitHub 实时为准;仓库标注 Early Beta,下文步骤以 官方 GitBook 当前版本为准。
2. 技术背景:记忆树与「Karpathy 式」知识库
OpenHuman 不是简单 RAG 套壳。公开材料里,长期记忆大致分三层(名称以文档为准):
- 来源树:按连接器(Gmail、GitHub 等)归档原始增量。
- 主题树:按项目、人物、时间线做摘要与关联。
- 全局树:跨主题的高层索引,供 Agent 规划「该查哪条枝」。
存储上,权威数据在本地 SQLite;同时导出兼容 Obsidian 的 .md 片段(社区称单段约 ≤3000 Token),便于你用双链笔记人工纠偏。对话前,TokenJuice 一类压缩会把相关片段压进上下文,减轻「把整库聊天记录塞进 Prompt」的成本——具体节省比例随任务变化,勿当成固定 80% 承诺。
模型侧,Model Routing 按任务选推理/快速/视觉模型;也可接 本机 Ollama / MLX 做离线推理。这与「虾马」层只解决编排与纪律、不解决个人级全源记忆形成清晰分工。
3. 对比:虾马路线 vs OpenHuman「连—抓—记」
| 维度 | 虾马(Skill / 网关 / Rules) | OpenHuman |
|---|---|---|
| 谁在维护「懂我」 | 你写 Prompt、Skill、CONTEXT.md | 后台同步 + 记忆树索引(你可审 Obsidian 导出) |
| 接第三方服务 | 逐平台配 Key / Webhook | 文档称 118+ 服务 OAuth(以控制台列表为准) |
| 刷新节奏 | 手动或自建 Cron | 默认约 20 分钟轮询已连接账户 |
| 跨周协作 | 依赖仓库文档与持久记忆设计 | 强调跨会话检索个人上下文 |
| 典型代价 | 运维网关、技能版本、权限 | Beta 稳定性、GPL-3.0、连接器权限审计 |
一句话:虾马让你当教练;OpenHuman 试图当「持续读你日记的助教」——助教仍可能记错,所以 SQLite + Markdown 双份落地是为了让你能查、能改、能删。
4. 工作流:20 分钟周期内你能做完什么
「20 分钟」指同步周期,不是「安装后 1200 秒立刻全知」。下面是一条可复现的首次上手路径(UI 文案随版本变,逻辑不变):
4.1 连:最小连接器集
从 Releases 安装桌面端后,不要一次 OAuth 118 个。建议首批只接:
- 一个邮箱(工作 Gmail 或别名邮箱二选一);
- 一个代码源(GitHub 个人账号或单一 Org);
- 一个日程(Google / Outlook 其一);
- 可选:Notion 或 Drive 之一,避免重复文档源。
每接一个源,在纸上记:只读还是可写、能否撤销、是否含客户 PII。企业邮箱请先过安全评审。
4.2 抓:等待至少 1~2 个同步周期
连接成功后,后台会按默认间隔(社区与评测多写约 20 分钟)拉取增量:新邮件主题、提交记录、日程变更等。此阶段你应做:
- 在应用内查看「上次同步时间」与失败连接器;
- 确认磁盘占用增长是否符合预期(索引 + 导出 md);
- 勿用「它怎么还不知道我昨天会议说了啥」来评判——第一轮只验证管道是否通。
4.3 记:验收记忆树与 Obsidian 导出
打开 Obsidian 库路径(安装向导或设置里查看),抽查 3~5 个自动生成的 md:
- 标题是否对应真实事件(例如某次 PR、某封邮件线程);
- 是否误把促销邮件当成「项目决策」;
- 敏感 token、密钥是否被写进正文——若有,立即断开该连接器并提 Issue。
然后在 OpenHuman 里问一个需要跨源推理的问题,例如:「本周我在仓库 X 的提交,和日历里与 Y 的会议是否相关?」对照回答里的引用片段是否来自正确 md。
4.4 与虾马组件并联(推荐拓扑)
[Gmail/GitHub/日历 …] --OAuth--> OpenHuman 记忆树 (SQLite + .md)
|
v
模型路由 (云端 / Ollama / MLX)
^
[Cursor + mattpocock/skills] ----写代码----+
[OpenClaw 网关] ----IM/Webhook/Cron--------+
避免让 Skills 的 CONTEXT.md 与 OpenHuman 导出目录各写一套「项目真相」而不同步。实践上:个人生活与跨工具上下文交给 OpenHuman;仓库内工程决策仍以 Git tracked 的 CONTEXT.md / ADR 为准。
4.5 何时停手或回退
- 检索经常「张冠李戴」,且 Obsidian 里摘要质量差——先减连接器,而非加模型。
- 你需要 GPL 之外的商业闭源分发——法务不通过则不要深度集成。
- 只想 24×7 跑 Telegram 机器人——优先 OpenClaw 远程 Mac 部署实操,不是 OpenHuman 主场景。
5. 常见问题
「20 分钟封神」是不是营销夸张?
更准确的说法是:20 分钟一轮自动同步。真正「懂你」取决于连接源数量、历史数据量与你是否愿意审阅导出笔记。把它当「可审计的个人 ETL」,比当「读心术」更不容易失望。
和 Karpathy 手工知识库冲突吗?
不冲突。OpenHuman 自动化的是「从 SaaS 拉事实」;你仍应在 Obsidian 里写判断、优先级与 ADR 式结论。机器记「发生了什么」,人记「我们选择了什么」。
Token 账单会爆吗?
路由 + 压缩旨在只送相关片段;但若你接太多高频源(群聊、监控告警),索引体积与检索次数都会涨。先用最小连接器跑一周,再看账单与磁盘。
6. 算力放哪:笔记本、台式与远程 Mac
记忆树与索引主要在本地磁盘;大模型推理可留在本机 Apple Silicon,也可把 Ollama/MLX 指到高内存远程 Mac,让笔记本只跑 OpenHuman UI。24×7 同步 + 网关场景下,独占 macOS 节点能减少合盖休眠导致的同步中断——这与 Macstripe 读者常用的「Agent 在云上、数据出口可控」拓扑一致。
若你下一步要评估独享 M4 Mac Mini 承载 OpenHuman 与 OpenClaw,可到Macstripe 首页查看节点与开通方式。
7. 结论
虾马时代证明了:工程师愿意教 AI,但不想重复教同一件事。OpenHuman 的「封神」叙事,实质是把 Karpathy 式个人知识库从手工笔记变成可轮询、可压缩、可导出审阅的本地流水线——「连—抓—记」三步,20 分钟是节奏,不是魔法。
- 先最小 OAuth,等 1~2 个周期再测检索质量。
- 用 Obsidian 导出当「记忆体检表」,错了就删源或改权限。
- 与 Skills / OpenClaw 分工:个人上下文 vs 仓库纪律 vs 消息网关。
Early Beta 务必当审计项目,而非生产秘书。更多 OpenHuman 架构解读见《GitHub 爆火的 OpenHuman,到底是什么?》;跨周记忆方法论见《Cursor 为什么总「失忆」?》。