💡
原文英文,约3100词,阅读约需11分钟。
📝
内容提要
在DeepResearch中,生成多样化查询至关重要。本文探讨了利用句子嵌入和次模优化的方法,以根据用户输入生成网络搜索查询,并将原问题分解为子问题,强调相关性和多样性的重要性,提出了两种优化策略。
🎯
关键要点
- 在DeepResearch中,生成多样化查询至关重要。
- 生成网络搜索查询时,必须根据用户输入进行优化,而不是直接使用用户输入。
- DeepResearch系统通常包括一个研究规划器,将原问题分解为子问题并独立解决。
- 生成的查询必须与原始输入相关,并提供独特的视角。
- 大多数开源DeepResearch实现未认真对待查询生成优化。
- 通过实验比较简单提示和结构化提示的效果,发现结构化提示在相关性上稍优。
- 增加生成查询的数量可能会导致重复查询的增加。
- 将查询生成视为子集选择问题,可以有效提高查询的多样性。
- 引入次模优化的概念,帮助解决查询选择中的边际收益递减问题。
- 设计基于嵌入的次模函数以优化查询选择,确保覆盖和多样性。
- 使用贪婪算法和懒惰贪婪算法来高效选择查询,避免不必要的计算。
- 次模优化提供了理论保证和高效算法,确保选择的查询至少达到63%的最优解。
- 次模优化为查询生成提供了系统化的、数学基础的方法,便于调优和监控解决方案质量。
➡️