本研究提出DisCoCirc框架,旨在提高传统混合量子-经典模型在处理大型文本时的效率。该方法通过将文档编码为参数化量子电路,并利用树状预组图实现高效转换,推动量子自然语言处理的发展。
本研究提出了一种基于多模态大型语言模型的超声报告生成框架,旨在解决报告生成中的多样性和标准化问题。通过模块化文本与影像数据对齐,并结合双语数据集,实现了不同器官和语言间的一致性和准确性。该方法在多个评分指标上优于传统方法,显示出在临床应用中的潜力。
本研究提出了多语言基准BRIDGE,评估大型语言模型(LLMs)在临床实践中的表现,涵盖87个任务。结果显示,开源LLMs的性能与专有模型相当,而基于旧架构的医学微调LLMs表现不佳,为新模型在理解临床文本的开发与评估提供了重要资源。
本研究提出了一种新型模型,旨在改善人工智能生成内容检测系统在短文本识别上的不足。该模型使用超过240万条标注数据进行训练,展现出良好的泛化能力和鲁棒性,推动了AI生成内容检测的进步。
本研究提出了一种新方法GRAPHTREX,用于临床文本中的时间关系提取。该方法结合了跨度实体关系提取和异构图变换器,显著提高了时间关系提取的F1分数,为改进诊断和预后模型奠定了基础。
本研究开发了Iffy-Or-Not(ION)浏览器扩展,旨在提升用户在社交平台上识别虚假内容的能力。研究发现,ION能够激发用户关注内容并提出启发性问题,但也存在用户适应性不足和潜在反效果的问题。
Automattic旗下的Beeper应用与Texts合并,推出新版本。Beeper的桌面和iOS应用将支持WhatsApp和Instagram等多平台消息,未来更新将包括设备端加密和多个账户支持。
本研究探讨了区分人类生成文本与大型语言模型(LLM)生成文本的挑战,提出了基于LLM的检测和解释方法。结果表明,LLM在检测自身生成文本时表现优于他人生成文本,但仍需改进。将二分类任务扩展为三分类任务显著提高了检测准确性和解释质量。
本文提出了一种新方法,通过CogWriter框架和认知写作理论,系统提升大型语言模型生成高质量长文本的能力,显著提高复杂指令的执行准确性。研究在LonGenBench基准测试中表现优异,为语言模型写作发展指明了新方向。
本研究提出了一种联合实体关系提取模型,针对中文医学文本中的复杂语义问题,开发了CH-DDI数据集和SEA模块。实验结果表明,该模型在实体识别和关系提取方面表现优异,F1得分分别为96.73%和78.43%。
本研究提出了“时间序列中的文本(TaTS)”框架,旨在有效整合多模态时间序列中的文本信息。实验结果表明,TaTS在时间序列预测和插补任务中显著提升了性能。
本研究解决了社交媒体上AI生成文本(AIGT)缺乏系统性评估的问题。通过构建数据集和检测器,发现Medium和Quora的AI归因率显著上升,表明AIGT可能对公众舆论产生影响。
本研究分析了小型语言模型在撰写儿童和大学生文本时面临的挑战,特别是在处理敏感话题和复杂词汇方面。提出的“元写作链”方法展示了这些模型如何模仿人类的写作规划和评估,从而提高生成文本的连贯性和一致性。
本研究提出了一种新颖的藏语对抗文本生成方法TSCheater,利用视觉相似音节的特点,建立了藏文音节视觉相似性数据库TSVSDB,从而提高了对抗攻击的有效性和文本质量,并构建了首个藏语对抗鲁棒性评估基准AdvTS。
本研究探讨法律文件因结构复杂和术语专业导致的可读性差问题,识别出常用的可读性指标,发现Flesch-Kincaid年级水平最为普遍,强调需在法律文档可读性评估上达成共识。
本研究探讨古典汉语在处理韩国和日本历史文档时的跨语言转移效用,质疑其有效性,发现支持作用有限,强调需进行实证验证。
本研究提出了一种新方法,利用随机化测试和变更点检测技术,解决了识别和分割不可信用户生成的水印文本的问题。实验结果表明,该方法在准确性和误差控制方面表现良好,具有实际应用潜力。
本研究探讨了互文性在文学研究中的不足,利用计算文学方法分析了12000部法语小说,揭示了子类型和经典对文本相似性及文学演变的重要影响。
研究探讨大型语言模型在差分隐私处理文本中的隐私泄露问题,提出两种攻击方法,显示模型能关联差分隐私文本与私人数据,揭示新安全风险。
本研究创建了首个古代希腊文本错误的数据集,填补了错误检测的空白。通过BERT生成数据集并提出新检测方法,准确率提高了5%。该数据集为学者开发更高效的错误检测算法提供了基准。
完成下面两步后,将自动完成登录并继续当前操作。