谷歌的新算法TurboQuant将AI推理中的KV缓存压缩了6倍,且无损精度,导致美光和西部数据股价大跌。该算法通过极坐标量化和量化JL变换,显著降低内存需求并提升速度,可能会改变AI的内存使用方式。
美团开源的LongCat-Video-Avatar模型在虚拟人视频生成方面取得显著进展,支持多任务生成,提升了动作拟真度和长视频稳定性,解决了身份一致性问题,广泛应用于影视和教育等领域。
美团开源的LongCat-Video-Avatar模型在虚拟人视频生成方面取得显著进展,支持多任务生成,提升了动作拟真度和长视频稳定性,解决了身份一致性问题,广泛应用于影视娱乐等领域。
Zoom Quest 平台更新后,用户可通过 Meta Avatar 在虚拟现实中进行视频通话,替代传统摄像头。该应用兼容所有 Zoom 账户,支持多种 Quest 设备,提供沉浸式会议体验。
本文介绍了如何构建名为Vendy的AI数字销售助理,集成Dify、Azure、Trulience和Agora等平台,具备听、说、想、演的能力。用户可以通过逐步搭建,创建与客户互动的智能体,提升销售体验。
这篇文章介绍了一个名为“丑陋头像”的Docker项目,利用JavaScript算法随机生成手绘风格的头像。用户可以使用其他作者提供的Docker镜像,只需映射端口80即可启动容器,生成的头像风格多样,具有抽象艺术感。
本研究提出了一种基于神经辐射场的可维护虚拟头像模型(MaintaAvatar),旨在解决在更新外观和姿势时保持旧外观的问题。通过全球-局部联合存储模块和姿势蒸馏模块,有效避免了灾难性遗忘。实验结果表明,该模型在有限数据下能够快速微调。
本研究针对生成时间序列数据面临的特殊挑战,提出了AVATAR框架,该框架结合了对抗自编码器(AAE)和自回归学习,以同时获取真实数据分布的概率和时间步骤的条件分布。研究表明,该方法在生成数据的质量和实际应用价值上显著提升,能够更好地捕捉时间序列数据的内在动态特征。
谷歌推出Genie 2,一个能够生成丰富3D游戏世界的AI游戏引擎,支持玩家与AI NPC进行复杂互动。马斯克与DeepMind创始人合作开发AI游戏,旨在推动通用人工智能(AGI)研究。Genie 2利用扩散模型,展示智能体与环境的交互能力。
本研究提出了一种从单幅图像生成可动画人类化身的方法,解决了细节捕获不足和视点不一致的问题。通过生成模型和高效的3D建模技术,实现了实时渲染,实验表明该方法能够生成逼真的3D动画化身,具有良好的有效性和泛化能力。
TikTok意外发布了其AI数字头像工具的内部版本,允许用户创建不当内容。该工具已被下架,而预期版本仍然可用。TikTok已解决此问题,并添加了水印以标识AI生成的内容。
通过引入可扩展的工具集,研究将重点从全知问题解决者转变为工具使用者,以增加科学推理对LLMs的可行性。开发了名为MathFunc的工具增强训练语料库,并构建了SciAgent和SciToolBench来评估LLMs在科学问题中的能力。实验证实了SciAgent的有效性,特别是SciAgent-Mistral-7B在准确率上的优势。
Emo-Avatar是一种高效的视频风格化头像生成方法,利用延迟神经渲染技术增强了生成动态肖像视频的能力。该方法通过两阶段的延迟神经渲染流程,结合其他技术,实现了对风格化肖像视频的快速生成和编辑,具有高训练效率、渲染质量和可编辑性。
研究者提出了一种名为SplatArmor的新方法,通过在3D高斯函数中给人体模型添加装甲,恢复出详细的、可动画的人体模型。他们使用高斯函数来表示人体,通过扩展底层几何体的蒙皮来定义关节扭曲。他们还引入了一个SE(3)场来捕捉高斯函数的位置和各向异性。通过展示实验结果,证明了这种方法的有效性。
Story Because Boring.
完成下面两步后,将自动完成登录并继续当前操作。