本研究提出了DNAZEN框架,旨在解决传统基因序列表示方法未能充分利用不同粒度信息的问题。通过动态匹配小聚合物和G-grams组合,DNAZEN在多个下游任务中表现优异,展现出显著的应用潜力。
山东大学研究人员提出了一种无监督框架DNASimCLR,结合对比学习和卷积神经网络,能够高效提取微生物基因序列特征。在预训练和微调阶段,该方法实现了99%的分类准确率,拓展了对比学习在基因组学中的应用。
GenSLMs是一种大型语言模型,能够生成与SARS-CoV-2病毒相似的基因序列。该模型由Argonne国家实验室、NVIDIA和芝加哥大学等研究机构和商业合作伙伴开发。GenSLMs能够生成序列并对COVID基因组进行分类和聚类。该模型的研究团队去年在SC22超级计算会议上获得Gordon Bell特别奖。
完成下面两步后,将自动完成登录并继续当前操作。