一个独立开发者捣鼓的化学 AI 解题工具:从想法到上线的踩坑记录
作为一个在 Laravel 和 Vue 生态里泡了好几年的独立开发者,我最近上线了一个偏「冷门」方向的小工具——Chemistry AI,一个专注于化学学科的 AI 解题辅助平台。说它冷门,是因为市面上 AI 工具卷的都是编程、写作、画图这些大热门赛道,很少有人盯上化学这个垂直领域。但正是因为它够窄,才让我觉得值得花时间认真做一做。
事情的起因很简单:我一个正在读大二的表妹,期末复习物化(物理化学)的时候给我发了张写了半页草稿纸的照片,问我能不能帮她看看哪一步算错了。我盯着那张写得密密麻麻、箭头到处飞的草稿纸,实话说,完全看不懂。那一刻我就在想:如果有个 AI 工具,能让她拍照上传,然后一步步拆解给她看,该多好。
为什么不是又一个「通用型 AI 套壳」
一开始我直接用通用大模型的 API 搭了个 Demo,很快就发现不对劲。通用模型在化学场景下有几个硬伤:
- 化学方程式配平不稳定:你让它配平 KMnO4+HCl→KCl+MnCl2+Cl2+H2OKMnO_4 + HCl \rightarrow KCl + MnCl_2 + Cl_2 + H_2OKMnO4+HCl→KCl+MnCl2+Cl2+H2O,同样的 prompt 跑三次可能给出三种不同结果,中间步骤还经常跳步。
- 单位换算容易出错:摩尔质量、摩尔浓度、产率这些计算,一旦涉及 g ↔ mol ↔ M 之间的跳转,通用模型算着算着就忘了带单位。
- 化学结构式的可视化是真空地带:让学生用文字描述 Born-Haber 循环或者回流装置?不现实。通用模型画图更是基本抓瞎。
所以后来决定不走纯 Chat 的路子,而是针对化学场景做了两套专用模式。
双模式设计的取舍
这是整个产品里我纠结最久的部分。最终定下来的方案是 Speed Mode(快速出答案)和 Coach Mode(分步引导)两条线:
- Speed Mode 走的是「结构化输出」路线:给定条件 → 列出公式 → 代入数值 → 单位校验 → 最终结果。每一步都有明确的边界,输出格式可控,不像 Chat 模式那样容易发散。这个模式特别适合考试前刷题对答案,或者做完实验快速验证计算结果。
- Coach Mode 走的是「苏格拉底式引导」路线:不直接给完整答案,而是把复杂问题拆成若干个微步骤,用一个一个的 checkpoint 引导用户自己推理。比如配平氧化还原反应,它会先问「你能找出哪个原子被氧化了吗?」,等用户回答后再继续。这种体验更像一个坐在旁边的家教,而不是一本丢过来的参考答案。
这里有踩过一个坑:Coach Mode 的 prompt 体系比 Speed Mode 复杂得多,每一类题型(配平、计量、热力学、有机机理)都需要单独设计引导路径。最早我想偷懒用一套通用 prompt 覆盖所有场景,结果引导问题的质量参差不齐,后来老老实实按题型拆分才稳定下来。
手写识别和图表生成:两个意外的大坑
手写识别的难度远超预期。学生拍过来的草稿纸质量参差不齐——有灯光昏暗的、有纸张皱巴巴的、还有用铅笔写得轻飘飘的。单纯的 OCR 方案基本不可用,最后是结合视觉模型做语义理解才勉强达到可用的准确率。即便如此,目前也只在「光照充足、纸张平整、完整题目入框」的条件下表现稳定。这是接下来需要持续优化的头号难题。
图表生成是另一个有意思的方向。化学里很多东西光靠文字解释根本说不清——比如蒸馏装置图、回流装置图、电子转移的箭头推演、热力学循环图。后来我干脆在工具里内置了一套「描述即绘图」的能力:用户输入一句话描述(比如 “Visualize the Ksp to E° cycle”),系统直接生成对应的化学示意图。这个功能的反响意外的好,很多学生说「比自己去 Google 搜图快太多了」。
覆盖的知识范围
目前 Chemistry AI 覆盖的知识面大概是这样:
| 领域 | 典型内容 | 适合人群 |
|---|---|---|
| 普通化学 | 化学计量、元素周期律、酸碱平衡、氧化还原配平 | AP Chem / 大一基础课 |
| 有机化学 | 反应机理、立体化学 (R/S, E/Z)、逆合成分析入门、NMR/IR 基础 | 大学有机化学 |
| 物理化学 | 热力学、动力学与速率方程、电化学、气体定律 | 大二/大三物化 |
| 生物化学 | 酶动力学、代谢通路、蛋白质结构 | 生科/医学预科 |
关于定价的一点想法
市面上很多 AI 工具要么完全免费但体验打折扣,要么一上来就是 20+/月。我最后定了一个比较温和的三档方案:免费档给7次体验机会,标准档20+/月。我最后定了一个比较温和的三档方案:免费档给 7 次体验机会,标准档 20+/月。我最后定了一个比较温和的三档方案:免费档给7次体验机会,标准档5.9/月(500 次),专业档 $11.9/月(1500 次 + 优先响应 + 视觉解释)。定价的逻辑是:让真正需要的人用得起,同时让产品能持续活下去。
从开发者视角的一点总结
做一个垂直领域的 AI 工具,和做一个通用型产品是完全不同的体验。通用的难点在于「什么都能做」,垂直的难点在于「一个场景做深到极致」。化学 AI 这个方向其实还有大量值得深挖的空间,比如反应路径预测的准确性、更复杂的有机合成路线推荐、三维分子构象的可视化等等。
如果你也是独立开发者,正在琢磨一个垂直领域的小产品,我的建议是:不要一上来就纠结「这个赛道够不够大」,先花两周时间做最小原型,直接丢给你的目标用户去用。我表妹和她班上的同学,就是我最早的测试用户。
如果你对这个工具有兴趣,或者身边有被化学课折磨的朋友,可以去 Chemistry AI 看看。免费注册就能上手试用,不需要绑卡。
本作品采用《CC 协议》,转载必须注明作者和本文链接
关于 LearnKu