本研究探讨了FRIDA模型在灾难响应中的有效性,解决了小型语言模型在复杂常识知识上的不足。FRIDA通过结合专家知识生成合成数据,经过微调后表现优于基础模型,但在特定领域知识的检索能力上仍需改进。
本研究提出L2D-CD方法,优化不完全可靠的专家知识与数据驱动因果发现的结合,优于传统方法,并识别专家的强弱领域,为未来研究奠定基础。
本研究提出了一种符号Q网络(Sym-Q)框架,利用离线强化学习解决符号回归中整合专家知识和交互困难的问题。实验结果表明,Sym-Q在标准测试中优于现有方法,并在真实案例中通过互动设计机制提升了性能。
本文探讨了形式验证中对专家知识的需求,并提出了Rango工具,该工具能够自动识别相关前提和相似证明,从而优化合成过程。Rango显著提高了证明的有效性,在多个开源项目中成功合成了32.0%的定理,较之前工具提升了29%。
本文探讨了如何利用大型语言模型(LLMs)和专家知识提高因果推断的效率。研究表明,少量领域知识能显著提升A*方法的实用性,并提出了结合知识与数据驱动的因果分析新框架。实验结果显示,LLMs在因果推断中表现优越,能够自动生成更准确的因果图,推动因果研究的发展。
本文探讨了多种强化学习方法的改进,包括最大化信息增益、新探索策略的引入以及结合专家知识以加速学习。研究表明,这些方法在样本效率和性能上优于传统算法,适用于复杂任务和动态环境。
该文介绍了一种利用专家知识的农作物分类方法,将三级标签层次结构编码至卷积循环神经网络中,提高了细粒度分类的性能。实验表明,该模型在新的公共数据集上的分类性能至少提高了9.9个百分点。
完成下面两步后,将自动完成登录并继续当前操作。