Lyra是一种新型生物序列建模架构,结合状态空间模型和投影门控卷积,显著提升推理速度和计算效率。它在100多个生物任务中表现优异,参数减少至现有模型的1/120,000,训练时间仅需数小时。
本研究提出GROOT方法,通过邻域采样生成伪标签并进行标签传播,解决生物序列设计中的优化瓶颈。实验结果表明,GROOT在多项任务中优于现有方法,验证了其在标记数据有限情况下的有效性。
本研究提出了Bio-xLSTM,一种针对生物和化学序列的xLSTM变体,旨在解决现有转化器在处理长基因组序列时的时间复杂度问题。研究结果表明,Bio-xLSTM在生成模型和上下文学习方面表现优越。
本研究提出了一种新算法DRAKES,优化了离散扩散模型在生成生物序列时的性能。通过使不可微分轨迹可微分,实现了奖励的直接反向传播,提升了DNA和蛋白质序列的自然性和功能性,对基因和蛋白质治疗有重要意义。
本研究提出了一种新型混合模态生物序列基础模型BSM,解决了多种数据类型处理的局限性。BSM在学习效率和跨模态表示能力上优于单模态模型,尽管只有110M参数,其性能与更大型模型相当,显示出在多模态生物序列建模中的潜力。
完成下面两步后,将自动完成登录并继续当前操作。