长城汽车在2025年CES展示了ASL(空间语言智能体)技术,旨在无缝整合智能驾驶与智能座舱。CTO吴会肖指出,ASL能够根据乘客需求优化驾驶体验,提升智能化水平。长城汽车依托市场、人才和AI基因,致力于智能化转型,预计到2025年将实现更多功能应用。
本研究开发了一个基于大型语言模型的框架,实现美国手语与印度手语的实时翻译,显著提升了手语用户的可及性,消除了交流障碍。
本研究解决了聋人和听力受损学生在科学、技术、工程和数学(STEM)教育中面临的资源匮乏问题,特别是在手语资源方面。我们推出的ASL STEM Wiki是第一个专注于STEM的连续手语数据集,提供超过300小时的美国手语(ASL)解释,有助于开发用于STEM教育的人工智能资源,显著提升DHH学生的学习体验。
本研究通过引入美国手语知识图谱(ASLKG),提高了美国手语(ASL)语言模型的可及性和可解释性。结果表明,基于ASLKG训练的模型在手势识别和视频分类任务中表现优异。
本文提出了一种基于简单卷积层的神经网络架构,结合低成本的动态时间编码水库节点,实现了异步时间特征的高效处理。RN-Net 在 DVS128 手势数据集上取得了最高的 99.2% 的准确率,并在较小的网络规模下,在 DVS Lip 数据集上实现了达到 67.5% 的准确率。代码将公开发布。
该论文提出了一种自然语言辅助手语识别框架,通过利用语义信息降低手语识别中的视觉相似性问题。该方法使用了语言辅助标签平滑和交互式混合等技术,并引入了视频关键点网络作为骨干网络。实验结果表明,该方法在基准测试数据集上达到了最先进的性能。
GLOBO宣布收购LUNA,合并后将成为美国最大的ASL口译员团队。LUNA是美国领先的语言服务机构,提供250多种语言的全方位服务。GLOBO是一家患者沟通公司,通过云平台GLOBO HQ帮助组织进行跨语言沟通。
Google Research和聋人专业艺术网络发布了一个包含超过100名聋人签名者制作的超过3百万个手指拼写字符的美国手语(ASL)手势数据集。他们还推出了一个Kaggle ML竞赛,将奖励20万美元的奖金给开发使用MediaPipe和TensorFlow Lite开发最准确的ASL手指拼写识别模型的ML工程师。获胜的模型将开源,以帮助开发人员为他们的应用程序添加手指拼写支持。目标是解决聋人和听力有障碍的人的无障碍性差距,并使AI对他们更加可访问。
完成下面两步后,将自动完成登录并继续当前操作。