Vocalog——我的第一个 vibe coding 产品

2026年3月6日 · 971 字 · 2 分钟 · #ai vibe_coding ai

缘起

从记事开始,多次想要当个不正经人,写写日记。

无论是纸质的小本子,还是电子版本,最长的坚持了几个月,而后就还是过着短期记忆生活。但最近两件事情,又把想要记录的心思勾起来。一个是常听播客的主理人,讲到他使用 AI 进行辅助写作,语音记录,AI 总结,效率提升 60% 以上。其实在这之后就开始了 Vocalog 的构想,并慢慢实施,已经有了产品雏形。另一个是卡兹克最近的一篇博客:AI时代,为什么我极力推荐你开始写日记?, 他随意而记的观点与我不谋而合,于是我想要好好整理一下目前这套记录工作流,如果能帮助到别人,那再好不过了。

构思

为什么之间写日记都失败了?于我而言,答案是一个字:写。

“写” 这件事,对于一个懒人来说,想要每天坚持,难度过大。并且在写时,我们的脑子用在感受与总结的精力会超过记录本身。于是,我更想侧重记录本身,或许在脑机接口直接读取意图以前,最直接的记录,就是语音了。

quote
在你真正去打字的时候,你不只是在记录你的想法,你同时也在编辑你的想法。
但我们回顾漫长的过往,却不是通过语音,最持久的记录,是文字。所以语音是需要转为文字的,卡兹克的方法是直接 STT 转为文字,但我还是想借用 LLM 的能力,去做最简短的总结,避免个人语音中那些废话。

于是,考虑自己的常用工具,一条关于记录的链路便形成了,其中需要实现的包括 快捷指令一键录音obsidian 插件

记录工作流

实现

快捷指令

终于是找到了手机上 Action Button 的使用场景,我目前是将 obsidian 的工作文件夹放在 icloud 中以实现多端同步。 快捷指令流如下:

Obsidian 插件

插件的核心功能是将已经同步过来的音频做转录总结,核心需求包括:

  • 调用 STT 模型,将音频转为文字;
  • 带头 LLM 模型,根据 prompt 总结;
  • 可选择总结当日或者一段时间的音频内容;

这里的需求,其实也是我与 Claude Code 进行 Plan 的过程聊清楚的。Vibe Coding 时代,编程的范式早已经发生改变。我之前更偏向使用 Cursor 进行代码段的小功能修改,究其本质,还是手工编码的惯性。刚好这个插件的开发,成为了 Coding 范式转换的练手刀。

我还记得刚开始使用野生 CC 的时候,一句话改一堆,Change Log 文件堆出十几个,项目结构乱得不行。于是各种搜寻 Vibe Coding 编程方法,才了解到 CC 的最佳实践,核心思想 Plan first ,至于具体的 文档驱动开发测试驱动开发 等多种模式,可根据具体需要定义在 claude.md 中。

这个开发项目已经开源,地址见github 链接,目前正在申请上架 Obsidian 插件平台,后面可以直接在插件市场安装。

日期选择

生成

演示

Comments