2025-W08

分类:
AI 总结

过去的一周非常忙碌,工作中的编码任务已基本交由AI处理,但在功能设计上AI仍难以介入,尤其是需要大量前置知识且文档不足的情况下。我正在考虑如何优化这一流程。在知识库方面,我对现有的RAG方法有些疑虑,尽管向量数据库可以进行语义匹配,但在背景复杂的问题上,可能无法提供完整的上下文。我认为RAG存在先天不足,类似于长上下文面临的成本和延时问题。目前,我倾向于以Agent为主线,整合多渠道信息,决定如何使用并判断上下文的完整性。

日常

  • 很忙碌的一周,不太有日常,工作上编码事项已经基本交由 AI 来接手,现在好像只在功能设计上 AI 还不好插手,特别是前置知识特别多然后文档不太够的情况下,我都不知道如何将功能机制设计等一系列工作内容交出来,还得考虑考虑这个流程,不然依然会比较难熬
  • 在知识库上面有了点想法,想要慢慢落地,好像现在见到的 RAG都是先去无意义地召回,尽管有了向量数据库能够做语义匹配,但是如果问题背后是有很多背景问题地话,那么一轮结果下来很可能是得不到完整的上下文的,再加上RAG 知识库里的切片方式和组织方式会天然阻碍全量知识的「复现」,所以我觉得 RAG 是有先天不足的,就像长上下文也会面临成本与延时以及搜索带来的问题一样,大概还会需要一段时间才能有「银弹」,现阶段我的想法还是以 Agent 为主线,它来负责所有资料的归集,知识库知识一个渠道,web search 也是一个渠道,它自己来决定使用哪些渠道以及如何使用还有判断上下文何时足够来回答某一个问题。