VisualRWKV:探索用于视觉语言模型的递归神经网络

BriefGPT - AI 论文速递 BriefGPT - AI 论文速递 ·

传统循环神经网络在时间序列任务中衰退,设计了高效的RWKV-TS模型,具有高计算效率和规模扩展性。实验发现,RWKV-TS模型与Transformer和卷积神经网络模型相比具有竞争力的性能,延迟和内存使用较低。

原文中文,约400字,阅读约需1分钟。
阅读原文