本研究提出了多种基因组基础模型和评估工具,如DNABERT-2和Geneverse,旨在提高基因组学和蛋白质组学研究的效率与准确性。通过新的基准测试套件评估模型在基因组任务中的表现,揭示了现有模型的能力与局限性,推动了该领域的发展。
这项研究比较了循环神经网络和transformer在字符级转换任务中的表现,发现transformer在大批量下优于循环模型。提出了一种新方法处理特征导向的字符级转换,并在多个任务上取得了先进表现。同时,研究介绍了新的掩码算法和基因组模型,显著提高了预训练效率和下游任务性能。
完成下面两步后,将自动完成登录并继续当前操作。