抱歉,您提供的文本内容过于简短,无法进行有效的总结。请提供更详细的文章内容。
抱歉,提供的文本内容过于简短,无法进行有效总结。请提供更详细的文章内容。
中国联通研究团队在AAAI 2026上发布了HiMo-CLIP模型,解决了长文本图像检索中的语义层级和单调性问题。该模型通过动态特征提取和对齐机制,显著提高了长短文本的检索精度,性能优于现有模型。
AAAI 2026会议共录用4167篇论文,录取率为17.6%。火山引擎与北大合作的VQ-Insight论文获口头报告,提出了一种基于强化学习的视频质量理解方法,显著提升了AIGC视频生成质量,具备良好的泛化能力和解释性。
抱歉,您提供的文本内容过于简短,无法进行有效总结。请提供更多信息或更长的文章内容。
字节跳动的InfinityStar方法在视频生成方面超越了DiT,速度提升10倍,单GPU可在一分钟内生成5秒720p视频。其核心在于时空金字塔建模,结合静态与动态信息,提高了生成效率和质量。
机器之心数据服务已上线,提供高效稳定的数据获取,简化数据爬取流程。
机器之心数据服务现已上线,提供高效稳定的数据获取,简化数据爬取流程。
机器之心数据服务现已上线,提供高效稳定的数据获取服务,帮助用户轻松获取所需数据。
研究表明,AI在“组合创造力”方面逐渐超越普通人类,例如GPT-4在创意理解任务中表现优异。通过IEI框架,AI能够识别、解释和扩展概念,从而提升创意生成能力。尽管AI在某些领域表现出色,但仍不及专家水平。这项研究为评估和应用AI创造力提供了新方法。
清华大学研究组开发了ProfileBFN工具,专注于蛋白质家族特异性建模。该工具通过多序列比对优化蛋白质设计,有效捕捉家族结构特征,生成新型家族蛋白质的表现优异,相关成果入选ICLR 2025。
文章讨论了多模态大语言模型(MLLM)的发展,特别是在图文生成方面的挑战与进展。上海人工智能实验室提出了OpenING基准,包含5400个真实场景的图文实例,旨在提升模型的生成能力和评测准确性。新评估模型IntJudge通过人机协作标注,显著提高了评测一致性。研究表明,当前模型在图像生成质量上仍需改进,未来将继续扩展数据和优化模型。
完成下面两步后,将自动完成登录并继续当前操作。