小红花·文摘 - 小红花技术领袖俱乐部

HBI V2：一种灵活的 AI 框架，可通过多元合作游戏提升视频语言学习

HBI V2：一种灵活的 AI 框架，可通过多元合作游戏提升视频语言学习

实时互动网 ·

本研究提出了一种新的视频上下文关键词注意力模块，旨在提升视频时刻检索和高亮检测的上下文捕捉能力。实验结果表明，该方法在细粒度对齐方面显著优于现有技术。

Watch Video, Capture Keywords: Context-Aware Keyword Attention for Moment Retrieval and Highlight Detection

BriefGPT - AI 论文速递 ·

本文介绍了多模态大型语言模型AlignGPT及其在文本到图像生成中的应用。通过人类反馈和细粒度对齐方法，显著提升了模型性能。同时，研究提出了新的评估框架GenEval，以分析生成模型的能力和不足，推动文本到图像模型的发展。

EvalAlign: 通过监督微调人工注释的多模态大模型的精确定位评估文本到图像模型

BriefGPT - AI 论文速递 ·

该论文提出了TG-3DFace和M3Face等多种基于文本的3D人脸生成方法，利用对比学习和细粒度对齐技术，实现高质量、语义一致的人脸图像生成。研究展示了文本引导的三维人脸合成和编辑的优势，提升了几何与纹理的一致性，并引入新的生成框架和编辑策略，显著提高了人脸合成的精度和质量。

通过直接的跨模态映射和几何规则化进行快速的文本到 3D 感知人脸生成和操纵

BriefGPT - AI 论文速递 ·