最近,美国大学毕业生在毕业典礼上对提及人工智能的演讲者表示不满,甚至出现嘘声。微软副主席布拉德·史密斯对此回应,认为年轻人对AI的反感反映了社会对这一技术的广泛担忧。他强调毕业生应积极应对未来挑战,并提醒科技行业应以人为本,而非取代人类。
本研究解决了人本视频生成中运动控制的难题,尤其是相机运动与人类姿势的联合控制问题。论文提出了一种创新的TokenMotion框架,通过将相机轨迹和人类姿势表示为时空令牌,实现了精细化控制。实验结果表明,该方法在文本到视频和图像到视频的任务中表现优异,推动了可控视频生成的进步,尤其适用于创意生产应用。
本研究解决了关于人格凭证(PHC)的用户认知和偏好的研究空白。通过对23名美国和欧洲参与者的半结构化访谈,我们提出了切实可行的PHC设计建议,强调用户对隐私和安全的理解以及可信任发行者的影响。研究发现,用户偏好结合生物识别和政府监督的设计方案,以提高PHC的可用性和信任度。
联想CEO杨元庆在《中国网信》杂志中提出“人本智能”理念,强调人工智能应以人类需求为核心,推动技术安全、公平和普惠,解决社会挑战,促进可持续发展。
本研究探讨了人工智能的伦理与安全问题,提出了以人为本的共生人工智能设计原则框架,确定了四个设计原则,强调人类在AI系统中的核心地位,并识别当前趋势与挑战,以指导未来研究和符合AI法案的系统开发。
该研究提出了HumanVBench基准,旨在评估多模态大语言模型在视频理解中的表现。通过设计17个任务,衡量视频模型在情感、行为和语言复杂性方面的性能限制,推动该领域的发展。
本文探讨了生物识别技术中的偏见问题,特别是人脸识别算法的种族歧视。提出了新的偏见评估指标“组错误差之和(SEDG)”,并分析了现有指标的局限性。研究表明,新的综合公平指数(CEI)在评估面部识别系统的种族偏差方面有效,具有实际应用价值。
本文介绍了Street Scene数据集在视频异常检测中的应用,提出了新的评估标准PIMO,以解决现有度量的不足。同时,研究展示了多种无监督和上下文感知的异常检测算法,强调隐私保护与性能之间的平衡,推动了该领域的进展。
本文介绍了多模态扩散模型在音视频生成、深度图生成和图像编辑等方面的应用,提出了随机平移注意力块、UAMD-Net和IDM-VTON等新方法,以提升多模态数据处理的鲁棒性和生成质量。
本文介绍了多种社交机器人导航技术,包括基于对话历史的导航、社交动作潜空间学习和增强学习框架。研究表明,历史对话长度、个性化控制器和人类互动显著影响导航性能,并提出了新的评估标准和方法,以提升机器人在复杂环境中的导航能力。
本文探讨了文本生成系统的评估指标,提出了基于语义的MoverScore,并验证了其在多任务中的优越性。研究还介绍了无监督评估方法和Word Mover's Distance及其在图像字幕中的应用,强调了新度量标准与人类评估的相关性。
研究人员使用文本到图像合成框架提出了一种生成准确标签训练数据的新方法。他们将生成过程分为前景物体和背景生成,并在五个物体检测和分割数据集上验证了该方法的有效性。结果显示,使用合成数据训练的模型性能可以与使用真实数据训练的模型相媲美甚至更好。
完成下面两步后,将自动完成登录并继续当前操作。