苹果正在测试一项新功能,允许用户通过Vision Pro耳机的眼动追踪进行滚动,适用于所有内置应用,未来可能扩展到第三方应用。具体操作方式尚不明确,预计将在6月的WWDC大会上公布更多信息。
本研究探讨了移动眼动追踪技术在课堂中自动化视觉关注检测的应用,提出了一种减少人工注释需求的流程。研究结果表明,该系统能够有效识别教师关注的学生,尤其在U形和小型教室中表现出较高的准确率,具有教育管理和师资培训的潜在价值。
本研究探讨了眼动在欺骗检测中的应用,利用机器学习模型分析注视、眼跳、眨眼和瞳孔大小。XGBoost模型在二分类任务中的准确率达到74%,识别出多个关键特征,为欺骗检测提供了新方法。
益普索推出的AI眼动预测工具“睿视EyeLogic”能够在60秒内预测产品包装和广告的注意力分布及情感反应,帮助品牌评估设计效果。消费者对包装的视觉识别仅需0.2-0.3秒,因此改版时需重视品牌熟悉度和信任感,以避免失败。该工具基于神经科学数据,提供注意力热点和聚焦度等关键指标,助力品牌提升视觉表现。
本研究分析了脉冲神经网络与视觉变换器的性能差距,提出了眼动脉冲自注意力机制,显著提升了SNN-ViT在视觉任务中的表现。
我们提出了一种新计算模型,通过分层主动推理模拟阅读和眼动,结合语言模型的文本预测能力,展示了对已知和未知词汇的理解,符合双重路径理论,可能为阅读障碍提供新见解。
苹果公司的Vision Pro混合现实头戴式设备存在安全漏洞,黑客可以通过分析虚拟化身的眼球运动来推断用户在虚拟键盘上输入的内容。该漏洞已被修复。黑客可以利用这一漏洞获取用户的敏感信息。这是首个利用注视信息远程执行按键推断的攻击方式。
本研究提出了一种新颖的面向用户的学习算法,通过眼动追踪、人机交互设计和心理学实现了在动态环境中快速适应和高效推理。实验证明该方法在性能上相较于固定训练/测试算法有显著改进,即使只用较小的标注样本进行训练。此外,在数据注释过程中也展现了卓越的效率。
基于脑电图的情绪识别引起了关注。研究开发了一个基于预训练模型的多模式情绪识别器,通过学习通用的脑电图表示,实现了卓越的性能。该模型提供了有价值的洞察。
本研究提出了一种新颖的面向用户的学习算法,通过结合移动眼动追踪系统、人机交互设计和心理学,实现了在动态环境中快速适应和高效推理的目的。实验证明,该方法在性能上相较于固定训练/测试算法有显著的改进,即使只用较小的标注样本进行训练。同时,在数据注释过程中也展现了卓越的效率。
利用点云作为事件表示来利用眼动任务中事件的高时间分辨率和稀疏特性,重新思考基于点的架构 PEPNet 并引入长期样本关系预处理的创新设计 FAPNet,以实现自适应跟踪和利用样本之间的时间相关性的频适应机制。在 SEET 合成数据集上,FAPNet 可以以仅消耗 PEPNet 计算资源的 10%的状态实现,并且其计算需求不依赖于传感器的空间分辨率,提高其在资源有限的边缘设备上的适用性。
本文介绍了MambaPupil网络,一种稳定的基于事件的眼动追踪系统。该网络利用多层卷积编码器从事件表示中提取特征,并采用双向门控循环单元和线性时变状态空间模块选择性地捕获上下文相关性。通过特定数据增强方法增强模型的稳健性。MambaPupil在基准测试中表现出卓越的性能,获得第一名。
本文介绍了一种多模态聚类算法的研究,提出了一种名为多模态多视图非负矩阵分解的新方法,通过分析多个局部 NMF 模型的协同作用来揭示数据集中的潜在模式。实验结果表明,该方法在多种数据集上获得了非常有前景的结果。
研究者使用卷积神经网络(CNN)来提高有丝分裂检测的准确性,证明了该方法的有效性。
Honor全球发布了Magic 6 Pro旗舰智能手机和Porsche Design Magic V2 RSR特别版。Magic 6 Pro售价1299欧元,配备12GB RAM和512GB存储空间,而Porsche Design Magic V2 RSR售价2699欧元,配备16GB RAM和1TB存储空间。两款手机都具备AI功能,并在欧洲市场上市。Magic 6 Pro采用骁龙8 Gen 3处理器,6.8英寸120Hz OLED显示屏和三摄像头设置。Porsche Design版本存储空间加倍,并配备一支触控笔。
苹果的Vision Pro头显采用空间计算技术,通过眼睛、手指和语音的交互实现操作。界面设计以眼动为重点,减少眼睛疲劳。观影效果惊艳,屏幕像素高,能呈现真实的景观。Vision Pro还有多种专业应用,如医疗软件和演唱会软件。总体来说,Vision Pro的空间计算技术为用户提供了沉浸式的体验。
本文研究了阅读文本时眼动的影响和多语言模型对跨语言转移的使用。作者使用眼动模式和多语言模型成功预测了13种语言的模式,并量化了模型对结构复杂性的敏感性。结果表明,模型整合了跨语言之间的差异,并捕捉到了更复杂的结构信息。
该研究提出了一种基于深度学习模型的帕金森病诊断方法,利用静息状态脑电图信号,通过提取复杂的隐藏非线性特征并展示其在未见数据上的泛化能力。该模型在三个公开数据集上评估,结果表明其能准确诊断帕金森病,即使输入信息部分缺失也能表现良好。该研究对患者治疗和帕金森病早期检测具有重要意义,该模型有望成为一种非侵入性且可靠的帕金森病早期检测技术。
本文提出一种基于点云的两人交互识别网络,通过时间间隔帧采样(IFS)高效选取视频帧,提取特征,并用transformer实现自注意力机制分类。在NTU RGB+D数据集上的实验结果优于现有方法。
该研究建立了基于SNN的视觉搜索模型,能够学习类似人类的凝视策略,具有高能效性和优于人类的搜索速度和准确性。该工作联系了神经科学和机器学习,为开发更高能效的计算机视觉算法提供了启示。
完成下面两步后,将自动完成登录并继续当前操作。