AIxiv专栏探讨了大语言模型(LLM)的创造力评估,提出了LoTbench方法,通过多轮交互评估LLM生成创新内容的能力,强调应关注生成能力而非选择能力。该方法在CVPR'24中扩展,利用日式冷吐槽游戏进行测评,结果表明当前LLM的创造力仍需提升。
中国团队在CVPR'24自动驾驶挑战赛中获得5个冠军和5个创新奖。朗歌科技、零一汽车和Wayve等初创企业也表现出色。长安汽车成为唯一获奖的传统车企,同时在电动化方面获得肯定。
该文章介绍了Flash-VStream,一种针对长视频流的在线理解多模态大模型。通过STAR记忆机制,Flash-VStream实现了对长视频的高效记忆和理解能力。模型在多个长视频理解benchmark上表现优秀,并在CVPR'24长视频问答竞赛中获得冠军。研究团队还构建了一个面向在线视频流问答场景的数据集VStream-QA,用于评价模型的在线视频流理解能力。Flash-VStream的性能在准确率和可信度分数上优于其他方法。
完成下面两步后,将自动完成登录并继续当前操作。