文章

deep-searcher 、deep-research对比

阅读了两个项目的源码deep-searcher 、deep-research

deep-searcher,git地址:https://github.com/zilliztech/deep-searcher

deep-research,git地址:https://github.com/dzhng/deep-research

相关的库还有huggingface的open_deep_research,不过还没研究,git地址:https://github.com/huggingface/smolagents/tree/main/examples/open_deep_research

简介

在对这两个项目的源码进行阅读后,两个项目的思路分别如下:

deep-searcher:(作者:国内向量数据库公司zilliztech)

一种效果优于graph rag,但复杂度更低的向量库搜索方式

# 流程
1. 用户输入问题
2. 如果问题可以拆分,使用大模型将问题转化为子问题
3. 从向量库中查找与问题匹配的内容
4. 交给大模型判断是否与问题有关联,如果有关联,则加入知识列表
5. 判断收集到的所有内容,交给大模型判断是否能够回答,如果不能回答再次生成一些问题,并继续执行步骤2
6. 当收集到了足够多的内容或者超过设置的迭代次数后,交给大模型进行回答

deep-research:(作者:国外做AI销售方案的公司aomni)

通过大模型+迭代思考+搜索实现

# 流程
1. 用户输入目标、广度、深度
2. 使用llm针对目标追问三个问题,并做为用户的需求
3. 使用llm针对用户的需求拆分为搜索的关键字,进行搜索
4. 针对问题将搜索结果总结为要点,

结论:

deep-searcher更加的偏向于从已有的知识库中进行检索信息(也提供了从文件、网页将信息加载到向量库的功能),将这些信息作为参考交给大模型去处理。相对于传统的rag优化了从向量库中获取相关信息的过程。

deep-research更偏向于针对某个问题的额研究,其通过将问题拆解,从互联网实时抓取数据进行分析,最后将分析结果进行合并,从而获取最终的结果。

许可协议:  CC BY 4.0