Runway新发布的Gen 4.5模型在视频生成方面表现出色,57.1%的人无法分辨生成视频的真实性。该模型在镜头控制、叙事能力和角色一致性上有显著提升,生成的视频更接近真实,连公司员工也难以辨别。整体上,视频的真实度和物理一致性增强,声画同步能力提升,未来可能需要AI来鉴别AI。
机器之心数据服务现已上线,提供高效稳定的数据获取服务,帮助用户轻松获取所需数据。
VBench-2.0是一个先进的视频生成评估框架,专注于视频模型的真实度,涵盖人类忠诚度、可控性和创造力等维度,推动电影制作、教育和游戏等领域的视频技术发展。
本研究提出了一种新方法PALATE,基于总期望法则,旨在改善深度生成模型的评估,解决生成样本的真实度、多样性和新颖性之间的平衡问题。实验结果表明,PALATE提高了评估的效率和全面性,对评估方法的发展具有重要影响。
本研究提出FLORAIN方法,通过非线性低秩映射干预语言模型的注意力头,解决生成文本中的不真实或有害内容问题。实验结果表明,该方法在提高文本真实度和生成质量方面优于多种基线方法。
Odyssey公司推出的Explorer生成式世界模型能够通过单张图片生成高质量3D世界,简化创作过程,提高电影和游戏制作效率。尽管处于早期阶段,Explorer已展现出巨大潜力,获得广泛赞誉。
本研究提出了一种基于信息论的统一视角,用于评估生成模型的输出。引入三维度评估指标,测量生成输出的真实度和多样性,以提供更清晰的分析和理解。
本研究针对大型语言模型(LLMs)在自然语言处理任务中出现的“幻觉”现象,提出了一种新颖的对比解码框架——LOL(底层至关重要)。通过将原模型与业余模型在最终层和底层的对比解码进行拼接,结合真实度聚焦模块,显著提升了事实编码能力。实验证明,该方法在减轻幻觉方面优于大多数现有基线,且在TruthfulQA的所有指标上平均提高了4.5分。
该研究提出了一种自动提示优化方法,用于以情绪为条件的文本生成。通过迭代的优化过程,改变提示中的标记,以实现情感条件。与手动设计的提示相比,优化的提示在实现情感条件方面表现更好。
完成下面两步后,将自动完成登录并继续当前操作。