研究人员提出了Nucleotide Transformer模型,通过预训练DNA序列,整合3202个人类基因组和850种物种的信息,能够在数据稀缺的情况下准确预测分子表型。该模型在基因组学应用中表现优异,微调成本低,适用于多种任务。研究表明,跨物种训练的模型在预测准确性上优于单一物种训练,未来可探索遗传变异的最佳采样方式。
完成下面两步后,将自动完成登录并继续当前操作。