小红花·文摘

本文提出了一种新颖的紧凑视频自编码器VidTwin，通过解耦视频的结构和动态潜在向量，解决了视频生成中的压缩与质量平衡问题。实验表明，VidTwin在视频重建中实现了高达0.20%的压缩率，并在生成任务中表现优异，为未来研究奠定了基础。

VidTwin：具有解耦结构和动态的视频变分自编码器

BriefGPT - AI 论文速递 ·

该论文提出了一种潜在提示Transformer模型，用于解决分子设计等优化问题。该模型由潜在向量、分子生成模型和属性预测模型组成，实验证明其在分子设计任务上表现出最先进的性能。

双空间优化：潜在提示变换提升分子序列设计

BriefGPT - AI 论文速递 ·

本研究提出了一种基于潜在向量定义注意力的方法，将传统 transformer 模型中的时间复杂度降低为随序列长度线性增长。该方法可以在双向和单向任务中使用，并实现了记忆和时间高效的循环实现。与标准 transformer 相比，该方法只需常数时间计算下一个记号。实证表现相当，允许在标准 attention 不可行的背景窗口范围内进行扩展。

线性时间变压器的潜在注意力

BriefGPT - AI 论文速递 ·

Autoencoder学习

Sekyoro的博客小屋 ·