本文介绍了一种用于XML文档的句子分割方法,通过引号和连字符提供了嵌套句子,并特别关注了由括号和冒号引入的插入情况。作者介绍了工具的工作原理,并与2019年的结果进行了比较,同时对系统在一个测试语料库上的性能进行了评估。
该文章介绍了一种表达性的文字动画技术,利用向量图形和优化框架实现了自动化的动态排版方案,有效生成连贯的文字动画。
该研究提出了一种具有检索增强生成能力的对话型问答系统方法,通过引入细粒度检索和自我验证等技术,实现了问题理解和相关信息获取。实验证明该方法在现有算法上具有巨大优势,并发布了一个中文对话型问答数据集,以促进对该方法的进一步研究。
应用偏差增强的一致性训练(BCT)在 GPT-3.5-Turbo 模型上,可以降低严重的偏差性推理达到 86%,平均减少 37% 的偏差性推理,并可以适应未知偏差领域和没有金标的任务。
该文章介绍了一种基于对话上下文和外部知识的知识驱动对话系统,通过引入主题转换框架来提供充足的主题发展知识。实验结果显示,该系统在知识选择方面具有更好的优势和泛化能力。
本文研究了大型语言模型(LLMs)的能力,特别关注于推进链式思维提示的理论理解。通过引入一个适用于自然语言生成的两级分层图模型,建立了一个具有吸引力的几何收敛率,用于衡量 LLMs 生成的思维链条与真实语言起源的思维链条之间的相似度。研究发现为 LLMs 能够产生正确的思维序列提供了理论上的证明。
完成下面两步后,将自动完成登录并继续当前操作。