Vocalog——我的第一个 vibe coding 产品
2026年3月6日 · 971 字 · 2 分钟 · #ai vibe_coding ai
缘起
从记事开始,多次想要当个不正经人,写写日记。
无论是纸质的小本子,还是电子版本,最长的坚持了几个月,而后就还是过着短期记忆生活。但最近两件事情,又把想要记录的心思勾起来。一个是常听播客的主理人,讲到他使用 AI 进行辅助写作,语音记录,AI 总结,效率提升 60% 以上。其实在这之后就开始了 Vocalog 的构想,并慢慢实施,已经有了产品雏形。另一个是卡兹克最近的一篇博客:AI时代,为什么我极力推荐你开始写日记?, 他随意而记的观点与我不谋而合,于是我想要好好整理一下目前这套记录工作流,如果能帮助到别人,那再好不过了。
构思
为什么之间写日记都失败了?于我而言,答案是一个字:写。
“写” 这件事,对于一个懒人来说,想要每天坚持,难度过大。并且在写时,我们的脑子用在感受与总结的精力会超过记录本身。于是,我更想侧重记录本身,或许在脑机接口直接读取意图以前,最直接的记录,就是语音了。
但我们回顾漫长的过往,却不是通过语音,最持久的记录,是文字。所以语音是需要转为文字的,卡兹克的方法是直接 STT 转为文字,但我还是想借用 LLM 的能力,去做最简短的总结,避免个人语音中那些废话。quote在你真正去打字的时候,你不只是在记录你的想法,你同时也在编辑你的想法。
于是,考虑自己的常用工具,一条关于记录的链路便形成了,其中需要实现的包括 快捷指令一键录音 和 obsidian 插件:

实现
快捷指令
终于是找到了手机上 Action Button 的使用场景,我目前是将 obsidian 的工作文件夹放在 icloud 中以实现多端同步。 快捷指令流如下:

Obsidian 插件
插件的核心功能是将已经同步过来的音频做转录总结,核心需求包括:
- 调用 STT 模型,将音频转为文字;
- 带头 LLM 模型,根据 prompt 总结;
- 可选择总结当日或者一段时间的音频内容;
这里的需求,其实也是我与 Claude Code 进行 Plan 的过程聊清楚的。Vibe Coding 时代,编程的范式早已经发生改变。我之前更偏向使用 Cursor 进行代码段的小功能修改,究其本质,还是手工编码的惯性。刚好这个插件的开发,成为了 Coding 范式转换的练手刀。
我还记得刚开始使用野生 CC 的时候,一句话改一堆,Change Log 文件堆出十几个,项目结构乱得不行。于是各种搜寻 Vibe Coding 编程方法,才了解到 CC 的最佳实践,核心思想 Plan first ,至于具体的 文档驱动开发 , 测试驱动开发 等多种模式,可根据具体需要定义在 claude.md 中。
这个开发项目已经开源,地址见github 链接,目前正在申请上架 Obsidian 插件平台,后面可以直接在插件市场安装。

