本研究探讨了蛋白质语言模型在生物信息学中的应用,提出了多种新方法以提高蛋白质序列预测和生成的准确性。研究表明,即使在数据有限的情况下,也能生成高质量的蛋白质结构,推动了蛋白质组学和结构生物学的发展。
本研究提出了一种高效的谱变换单元(STU)实现,解决了序列预测任务中效率低下的问题。STU及其变体在相同参数数量下超越了其他模型,具有显著的性能提升和广泛的应用潜力。
本文介绍了去噪扩散概率模型(DDPM)及其在图像生成、异常检测和序列预测等领域的应用。研究表明,过渡矩阵的选择对生成效果至关重要,新损失函数在文本生成中表现良好。此外,DDPM在半监督医学图像分割和无线通信中展现出优越性能,能够有效处理不确定性和硬件损伤问题。
本文介绍了一种解决自然语言处理中元学习问题的方法,通过将调整和预测转化为序列预测问题,并在两个文本分类任务上进行了测试。结果表明,该方法更好地利用了语言模型的归纳偏差,提高了绝对 AUC ROC 评分。与不调优的'in-context learning'相比,'in-context tuning'通过元训练从'in-context'中学习,提高了平均 AUC-ROC 分数,并减少了方差和示例选择。
完成下面两步后,将自动完成登录并继续当前操作。