小红花·文摘

本研究提出DisCoCirc框架，旨在提高传统混合量子-经典模型在处理大型文本时的效率。该方法通过将文档编码为参数化量子电路，并利用树状预组图实现高效转换，推动量子自然语言处理的发展。

Efficient Generation of Parameterized Quantum Circuits from Large Texts

BriefGPT - AI 论文速递 ·

本研究提出了一种基于多模态大型语言模型的超声报告生成框架，旨在解决报告生成中的多样性和标准化问题。通过模块化文本与影像数据对齐，并结合双语数据集，实现了不同器官和语言间的一致性和准确性。该方法在多个评分指标上优于传统方法，显示出在临床应用中的潜力。

Ultrasound Report Generation with Multimodal Large Language Models for Standardized Texts

BriefGPT - AI 论文速递 ·

本研究提出了多语言基准BRIDGE，评估大型语言模型（LLMs）在临床实践中的表现，涵盖87个任务。结果显示，开源LLMs的性能与专有模型相当，而基于旧架构的医学微调LLMs表现不佳，为新模型在理解临床文本的开发与评估提供了重要资源。

BRIDGE: Benchmarking Large Language Models on Real-world Clinical Practice Texts

BriefGPT - AI 论文速递 ·

本研究提出了一种新型模型，旨在改善人工智能生成内容检测系统在短文本识别上的不足。该模型使用超过240万条标注数据进行训练，展现出良好的泛化能力和鲁棒性，推动了AI生成内容检测的进步。

Robust and Fine-Grained Detection of AI-Generated Texts

BriefGPT - AI 论文速递 ·

本研究提出了一种新方法GRAPHTREX，用于临床文本中的时间关系提取。该方法结合了跨度实体关系提取和异构图变换器，显著提高了时间关系提取的F1分数，为改进诊断和预后模型奠定了基础。

Temporal Relation Extraction in Clinical Texts: A Span-based Graph Transformer Approach

BriefGPT - AI 论文速递 ·

本研究开发了Iffy-Or-Not（ION）浏览器扩展，旨在提升用户在社交平台上识别虚假内容的能力。研究发现，ION能够激发用户关注内容并提出启发性问题，但也存在用户适应性不足和潜在反效果的问题。

Is There a Problem? Expanding the Web to Support Critical Evaluation of Fallacious Texts

BriefGPT - AI 论文速递 ·

新的Beeper应用整合了Automattic的所有消息系统

The Verge ·

本研究探讨了区分人类生成文本与大型语言模型（LLM）生成文本的挑战，提出了基于LLM的检测和解释方法。结果表明，LLM在检测自身生成文本时表现优于他人生成文本，但仍需改进。将二分类任务扩展为三分类任务显著提高了检测准确性和解释质量。

"I Know Myself, But Not Really Deeply": Using Large Language Models to Detect and Explain LLM-Generated Texts

BriefGPT - AI 论文速递 ·

本文提出了一种新方法，通过CogWriter框架和认知写作理论，系统提升大型语言模型生成高质量长文本的能力，显著提高复杂指令的执行准确性。研究在LonGenBench基准测试中表现优异，为语言模型写作发展指明了新方向。

Generating Constrained Long Texts from a Cognitive Writing Perspective

BriefGPT - AI 论文速递 ·

本研究提出了一种联合实体关系提取模型，针对中文医学文本中的复杂语义问题，开发了CH-DDI数据集和SEA模块。实验结果表明，该模型在实体识别和关系提取方面表现优异，F1得分分别为96.73%和78.43%。

Joint Entity-Relation Extraction Model Based on Span and Interactive Fusion Representation: Addressing Complex Semantics in Chinese Medical Texts

BriefGPT - AI 论文速递 ·

本研究提出了“时间序列中的文本（TaTS）”框架，旨在有效整合多模态时间序列中的文本信息。实验结果表明，TaTS在时间序列预测和插补任务中显著提升了性能。

Language in the Flow of Time: Weaving Time-Series-Paired Texts into a Unified Temporal Narrative

BriefGPT - AI 论文速递 ·

本研究解决了社交媒体上AI生成文本（AIGT）缺乏系统性评估的问题。通过构建数据集和检测器，发现Medium和Quora的AI归因率显著上升，表明AIGT可能对公众舆论产生影响。

Have We Entered the World of AI-Generated Texts? Quantifying and Monitoring AIGTs on Social Media

BriefGPT - AI 论文速递 ·

本研究分析了小型语言模型在撰写儿童和大学生文本时面临的挑战，特别是在处理敏感话题和复杂词汇方面。提出的“元写作链”方法展示了这些模型如何模仿人类的写作规划和评估，从而提高生成文本的连贯性和一致性。

Chain-of-MetaWriting: Linguistic and Textual Analysis of How Small Language Models Write Texts for Young Students

BriefGPT - AI 论文速递 ·

本研究提出了一种新颖的藏语对抗文本生成方法TSCheater，利用视觉相似音节的特点，建立了藏文音节视觉相似性数据库TSVSDB，从而提高了对抗攻击的有效性和文本质量，并构建了首个藏语对抗鲁棒性评估基准AdvTS。

TSCheater: Generating High-Quality Tibetan Adversarial Texts through Visual Similarity

BriefGPT - AI 论文速递 ·

本研究探讨法律文件因结构复杂和术语专业导致的可读性差问题，识别出常用的可读性指标，发现Flesch-Kincaid年级水平最为普遍，强调需在法律文档可读性评估上达成共识。

The Use of Readability Metrics in Legal Texts: A Systematic Literature Review

BriefGPT - AI 论文速递 ·

本研究探讨古典汉语在处理韩国和日本历史文档时的跨语言转移效用，质疑其有效性，发现支持作用有限，强调需进行实证验证。

When is Classical Chinese Effective? Quantifying Cross-Language Transfer in Chinese Characters and Texts

BriefGPT - AI 论文速递 ·

本研究提出了一种新方法，利用随机化测试和变更点检测技术，解决了识别和分割不可信用户生成的水印文本的问题。实验结果表明，该方法在准确性和误差控制方面表现良好，具有实际应用潜力。

Segmenting Watermarked Texts from Language Models

BriefGPT - AI 论文速递 ·

本研究探讨了互文性在文学研究中的不足，利用计算文学方法分析了12000部法语小说，揭示了子类型和经典对文本相似性及文学演变的重要影响。

The Potential Structures of Intertextuality in French Language Texts

BriefGPT - AI 论文速递 ·

研究探讨大型语言模型在差分隐私处理文本中的隐私泄露问题，提出两种攻击方法，显示模型能关联差分隐私文本与私人数据，揭示新安全风险。

Reconstructing De-identified Differentially Private Texts Using Large Language Models

BriefGPT - AI 论文速递 ·

本研究创建了首个古代希腊文本错误的数据集，填补了错误检测的空白。通过BERT生成数据集并提出新检测方法，准确率提高了5%。该数据集为学者开发更高效的错误检测算法提供了基准。

An Annotated Dataset of Errors in Ancient Greek Texts and Baselines for Detection

BriefGPT - AI 论文速递 ·