使用生成对抗网络模拟现实短串联重复毛细管电泳信号
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
通过深度生成模型,特别是深度扩散模型,合成DNA序列在合成生物学领域有新前景。提出了潜在扩散模型(DiscDiff),通过嵌入离散DNA序列到潜在空间,使用自编码器生成离散数据。引入了度量标准FReD,衡量DNA序列生成结果的样本质量。DiscDiff模型能生成与真实DNA序列相符的合成DNA序列。贡献了15万个唯一启动子-基因序列的全面跨物种数据集。
🎯
关键要点
- 深度生成模型,特别是深度扩散模型,为合成DNA序列开辟了新前景。
- 提出了潜在扩散模型DiscDiff,通过将离散DNA序列嵌入潜在空间生成离散数据。
- 引入了度量标准FReD,用于衡量DNA序列生成结果的样本质量。
- DiscDiff模型能够生成与真实DNA序列在多个方面相符的合成DNA序列。
- 贡献了一个包含15个物种的15万个唯一启动子-基因序列的跨物种数据集。
- 未来将公开代码,为基因组学中的生成建模工作提供资源。
➡️