浙江大学的研究团队提出了一种名为InstructProtein的模型,通过知识指令对齐蛋白质语言和人类语言,实现了双向生成能力。该模型在蛋白质序列理解和设计方面优于现有的大语言模型。研究人员使用UniProtKB构建了蛋白质知识图谱,并通过指令数据集进行模型微调。InstructProtein能够准确预测蛋白质的功能和位置,对蛋白质工程和药物发现具有重要意义。该研究为蛋白质大模型的发展提供了新的思路和方法。
本文讨论了应对高温天气的措施,包括普及降温设备、改变城市设计、保护户外劳动者。同时介绍了ACL 2024论文分享会和科技动态。
本周泰国曼谷举行的ACL 2024顶会收到近5000篇论文投稿,录用940篇,字节跳动有5篇入选,其中一篇被评为Outstanding Paper。其他论文涵盖自然语言处理、语音处理、多模态学习、大模型推理等前沿研究领域。
2024年在泰国曼谷举办的ACL宣布了最佳论文、最佳主题论文、杰出论文、资源论文、社会影响奖和终身成就奖的获奖者。最佳论文包括《不可能任务的语言模型》和《为什么敏感函数对变压器来说很难?》。资源论文包括《Latxa:巴斯克语的开放语言模型和评估套件》和《Dolma:用于语言模型预训练研究的三万亿标记的开放语料库》。社会影响奖获奖者包括《约翰尼如何说服LLM解锁它们》和《DIALECTBENCH:方言、变体和密切相关语言的NLP基准》。终身成就奖授予了Ralph Grishman。
美团技术团队在ACL 2024收录的4篇论文涵盖了训练成本优化、投机解码、代码生成优化、指令微调等技术领域。这些论文是与高校、科研机构合作的成果,介绍了早期退出投机解码、图结构投机解码、DolphCoder和指令微调等方法。这些方法在提高文本生成速度和代码生成性能方面取得了显著成果。
介绍了一个新的多模态、多类型、多用途的视听学术演讲数据集(M3AV),包含367小时的视频,涵盖计算机科学、数学、医学和生物学主题。该数据集可用于视听识别和理解任务,具有高质量的人工标注。实验结果表明,M3AV是一个具有挑战性的数据集。该工作已被ACL 2024主会接收。
ACL 2024论文研究证明大型语言模型(LLM)不能作为基于文本的世界模拟器,GPT-4测试结果显示其模拟状态变化的准确率仅为60%。LLM在处理需要算术、常识或科学知识的复杂转换时表现不佳,研究结果强调了其局限性并建议进一步改进。
完成下面两步后,将自动完成登录并继续当前操作。