小红花·文摘

本研究提出了一种自我注意力机制，显著扩展了Transformer的上下文大小，同时控制内存和计算时间。在字符级语言建模任务中，使用8k字符实现了先进性能。研究分析了Transformer的注意力结构，发现其在不同层次关注不同词性和依赖关系。通过引入新的注意力机制，提升了模型的性能和可解释性，解决了无上下文语言建模的限制。

选择性注意力改善变压器模型

BriefGPT - AI 论文速递 ·

本文提出了一种新的分子联合表示学习框架，结合SMILES和分子图的多模态信息，改进自我注意力机制，并引入双向消息传递图神经网络以增强信息流。实验验证了该模型在分子属性预测中的有效性，展示了图神经网络在药物发现和生物系统分析中的应用潜力。

通过立体电子学增强分子图的分子机器（学习）表征

BriefGPT - AI 论文速递 ·

本文提出了一种新的神经联合抄录模型（EEND），适用于长篇音频，显著降低了说话人分离误差（DER）和计算复杂性。该模型结合自我注意力机制和多任务学习，提升了多说话人场景下的说话人识别和分离性能。实验结果表明，该方法在多个数据集上均取得了显著的性能提升。

在端到端神经语音分离中利用说话者嵌入识别双方讲话的情景

BriefGPT - AI 论文速递 ·

本文介绍了无需微调的图像生成和编辑方法，如MasaCtrl、TIC和RefDrop等。这些方法通过改进自我注意力机制，实现高质量的一致性图像生成和复杂编辑，尤其在多视图一致性和局部控制方面表现优异。实验结果表明，这些技术在图像定制和视频编辑任务中具有显著优势。

基于视图迭代自注意力控制的无调整视觉定制化

BriefGPT - AI 论文速递 ·

本文提出了一种基于多视图轴自注意力和局部ROI自注意力的3D物体检测方法MVDet，显著提升了自动驾驶系统的性能。该方法通过无Anchor盒聚合视图信息，在MultiviewX数据集上性能提高14.1%。研究还探讨了多传感器融合技术和自我注意力机制在3D检测中的应用，展示了在多个数据集上的优越表现。

多视角多视图 3D 物体检测的多视图关注上下文化

BriefGPT - AI 论文速递 ·

ChatGPT是一个基于自我注意力机制的变换器模型，它的训练可以分为三个阶段：有监督训练、训练奖赏模型和强化学习训练，具有3000亿单词的语料库预训练和1750亿参数的数据模型，但也带来了道德和法律问题，以及失业问题。

你真的了解ChatGPT吗？超全干货：ChatGPT调研分析与应用场域结合构想

京东科技开发者 ·