数月的自我测试:引用功能表现亮眼,其他功能仍未经证实。

发布日期:2026-05-26 10:00:48   浏览量 :1
发布日期:2026-05-26 10:00:48  
1

2026西湖龙井茶官网DTC发售:茶农直供,政府溯源防伪到农户家 

好吧,坦白说:我就是构建这个产品的人。我并不是要向你推销商业计划书——我只是希望那些真正深陷 PDF 地狱的人告诉我,我究竟是在解决一个真实存在的问题,还是在假装创业。

我过去的工作方式(令人尴尬)

我的“系统”是这样的:文件存在云端硬盘 → 打开聊天机器人 → 粘贴半份 PDF → 祈祷好运 → 切换到另一个模型 → 再次粘贴 → 然后忘记模型是从哪一段开始胡编乱造的。

笔记本语言模型(NotebookLM)是我第一次产生“哦,它真的读了文档”这种感觉的时候。但我最终得到的聊天线程离开那个窗口后就毫无用处。我无法将其交给队友。无法将其放在落地页上。如果不感觉像是从头再来,我就无法切换模型。

这基本上就是我开始构建 UUMuse 的原因。是的,名字就是这个。是的,我的朋友说它听起来像一个会发出“uwu”声音的缪斯女神。言归正传。

如果我在聚会上喝醉了,我会这样解释它是什么

你把文件扔进一个工作区。它会建立索引。你提出问题。答案会尝试显示小小的 [1][2] 引用标记,这样你就可以点击并确认:“好的,是的,这确实在第 4 页”,而不是基于模糊的感觉去信任它。

你可以在不同模型之间切换,而无需重新上传那份该死的 80 页 PDF。记忆是可以延续的——比如它学会了我不喜欢冗长的引言,更喜欢要点列表。你也可以进入设置,当它自信地记住了关于你的错误信息时,删除该条记忆(问我怎么知道的)。

当我懒惰时,可以使用代理模式——“总结这个文件夹并给我写一份备忘录”——还有一个多专家辩论模式(Spark),我构建它是因我有决策瘫痪症,希望人工智能利用我的文件自我辩论。说实话,这可能只是我个人的问题,而不是市场问题。

日常使用的实际感受

对我来说,第一个“哇塞”的时刻很平淡:我上传了一份杂乱的 PDF,问了一个具体问题,点击了 [1],高亮部分确实是正确的段落。我知道这在 2026 年听起来像是基本要求,但在情感上,这是我第一次停止将引用复制粘贴回聊天窗口以进行事实核查。

第二个时刻:我在对话中途切换了模型,它没有用“我无法访问你的文件”来误导我。小事一桩。但如释重负。

第三点:记忆。我曾告诉它我想要简洁的回答,它……大部分时候都听从了。当它没有做到时,我直接删除了那条记忆条目,而不是像在对待前任一样在聊天中与模型争执。

对我来说仍然感觉笨拙的地方:

首次上手引导试图提供帮助,但有时感觉像是在做作业。我已经第 800 次对其进行精简了。
当检索失败时,模型仍然可能听起来很自信。我们比“嵌入即祈祷”的 1.0 版本要好,但这并非魔法。
我肯定是在只有十个喜欢简单问答的人类用户之前,就构建了“发布文档页面/嵌入小部件/MCP 挂钩”功能。这是典型的副业项目病。如果你只尝试一件事,请尝试上传 → 提问 → 点击引用。在那套流程感觉良好之前,忽略其他所有功能。
我认为它适合谁(不是“所有人”)

如果你是一名学生/研究人员/产品经理/法律相关人士,手头有一堆文档,并且不想在每次更换模型时重新构建上下文——你可能会理解它的价值。

如果你想要一个干净的笔记应用,请使用黑曜石笔记(Obsidian)。如果你想要谷歌那种精致的文档聊天体验,请使用笔记本语言模型(NotebookLM)。我并不打算在第一天就赢得那场竞争。

我试图赢得的是“我足够信任它以据此采取行动”加上“我可以在其他地方重复使用同一个大脑”。

我们目前的状况

早期阶段。就像……没有什么用户数量可以炫耀。产品猎手(Product Hunt)上线在即。我在这里发帖是因为我上一次的尝试读起来像广告并被删帖了(公平)。

技术栈

Next.js · FastAPI · Postgres/pgvector · Redis/Celery · Stripe · Docker。人工智能通过常规渠道接入(OpenAI/Anthropic/DeepSeek/Google)。乐意闲聊关于

免责声明:本文内容来自互联网,该文观点不代表本站观点。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,请到页面底部单击反馈,一经查实,本站将立刻删除。

关于我们
热门推荐
合作伙伴
免责声明:本站部分资讯来源于网络,如有侵权请及时联系客服,我们将尽快处理
支持 反馈 订阅 数据
回到顶部