小红花·文摘

港股新贵押注物理AI，乐动机器人打造万亿市场空间的核心基础设施

量子位 ·

Vbot推出的家用机器人「大头」外观可爱，运动性能优秀，支持自主导航和跟随功能，具备强大的感知能力，续航3至6小时，充电便捷，能自主决策，带来愉悦体验。

丢掉遥控器，寻找生命感：这是我的 Vbot「大头」机器狗使用体验

少数派 ·

本研究探讨了视觉-语言模型（VLMs）与大型语言模型（LLMs）之间的感知与推理机制，提出了跨模态模型融合的方法。结果表明，模型融合有效地将LLMs的推理能力转移至VLMs，且感知能力主要集中在早期层，而推理能力在中后期层得到增强。

将推理引入视觉：通过模型融合理解感知和推理

BriefGPT - AI 论文速递 ·

扩展机器人感知能力

MIT News - Artificial intelligence ·

该研究提出了一种新型图形用户界面代理模型UI-TARS，增强了感知能力和统一行动建模，表现优异，减少了对人为干预的依赖。

UI-TARS: A New Paradigm for Automated Graphical User Interface Interaction

BriefGPT - AI 论文速递 ·

本研究提出了InternLM-XComposer2.5-OmniLive系统，旨在提升多模态大型语言模型在长期交互中的连续性和感知能力。该系统通过解耦的流媒体感知、推理和记忆机制，能够实时处理视频和音频输入，模拟人类认知，增强多模态交互的适应性和持续性。

InternLM-XComposer2.5-OmniLive: A Comprehensive Multimodal System for Long-term Streaming Video and Audio Interactions

BriefGPT - AI 论文速递 ·

本研究探讨了多模态大语言模型在视听理解中的感知能力不足，提出了具有解耦感知设计的ChatRex模型，并构建了Rexverse-2M数据集，实现感知与理解的联合训练，从而显著提升了感知能力。

ChatRex：驯服多模态大语言模型以实现联合感知与理解

BriefGPT - AI 论文速递 ·

DeepFusion提出了一种模块化的多模态架构，结合激光雷达、相机和雷达进行3D物体检测，实验表明其在远距离检测和激光点密度方面表现优异。研究显示雷达与相机的融合在低能见度条件下提升了自动驾驶的感知能力，RCBEVDet++框架进一步改善了融合性能，对自主驾驶系统的感知能力产生重要影响。

一种资源高效的融合网络用于鸟瞰视图中的目标检测，采用摄像头和原始雷达数据

BriefGPT - AI 论文速递 ·

别人刚上「端到端」，理想智驾却又迭代了

爱范儿 ·

本文探讨了车辆间通信（V2V）在自动驾驶中的应用，提出了多种框架和算法以提升感知和运动预测性能。研究表明，协同感知和信息共享能有效提高车辆在不利环境下的行人检测能力。新提出的自适应加权算法和SmartCooper框架显著降低了通信成本并提升了感知精度，推动了自动驾驶技术的发展。

面向合作数据融合的通道感知吞吐量最大化

BriefGPT - AI 论文速递 ·

本研究提出了一种新颖的室外机器人自定位方法，利用机载摄像头和卫星图像，克服视角变化的挑战。通过检测一致的关键点和深度特征，该方法在动态环境中提升了感知能力，并在多个数据集上验证了其优越性，准确性显著高于现有方法。

学习何时看向：使用几何信息的主动定位的自监督视点选择

BriefGPT - AI 论文速递 ·

该研究探讨了通过无监督目标发现和深度信息融合提升自动驾驶车辆的感知能力，解决遮挡问题。提出了多模3D物体检测器InfraDet3D，结合LiDAR和单目相机数据，提升检测效果。同时分析了多传感器融合在城市和高速公路环境中的定位准确性，展示了车路协同的优势，并提出了优化路侧单元部署的算法，以提升车辆网络效率。

利用激光雷达装备的路边基础设施实现准确的协同定位用于自动驾驶

BriefGPT - AI 论文速递 ·

本文探讨了在恶劣天气条件下，特别是大雨和浓雾中，激光雷达传感器的性能及探测方法。研究提出了新技术以提高自动驾驶安全性，包括基于能量的异常点检测、卷积神经网络滤波方法和物理模拟等，显著改善了在复杂气象条件下的感知能力。

利用汽车雷达和激光雷达传感器预测恶劣天气对行人检测的影响

BriefGPT - AI 论文速递 ·

本文探讨了多模态融合技术在自动驾驶中的应用，特别是通过TransFuser整合图像和LiDAR数据，以提升复杂场景下的感知能力。研究显示，该方法在减少碰撞和提高驾驶员监控准确性方面表现优异，尤其在疲劳检测和分心驾驶识别中，准确率达到96.8%。同时，文中总结了多模态融合的挑战与未来发展方向。

M2DA：多模态融合 Transformer 结合驾驶员注意力用于自动驾驶

BriefGPT - AI 论文速递 ·

智能无人机群体结合充电技术在智能城市中提供感知能力，如交通监控和灾害响应。通过分布式优化和深度强化学习，实现成本效益高、质量高的导航、感知和充电。新的渐进式方法包括基于分布式优化的规划和选择，以及基于DRL的飞行方向调度。实验结果表明，该解决方案在交通监控方面表现出色。

无人机的分散式交通管理

BriefGPT - AI 论文速递 ·

智能无人机群体结合充电技术可提供智能城市的感知能力，如交通监控和灾害响应。新方法通过分布式优化和深度强化学习实现无人机的高效导航、感知和充电。实验结果显示该解决方案在交通监控方面表现出色。

无人机的短期与长期协调：分布式优化与深度强化学习的结合

BriefGPT - AI 论文速递 ·

Chat 向左，Agent 向右

知乎每日精选 ·

互联网或者AI本质究竟是什么？

AI.News ·

本文提出了一种利用机载摄像头和卫星图像的细粒度室外机器人自定位方法，解决了跨视角定位方法的问题，提高了感知能力和准确性。实验证明该方法优于现有方法，实现了低误差的空间和方向准确性。

视图一致净化：实现准确的跨视图定位

BriefGPT - AI 论文速递 ·

该研究提出了一个机器人系统，模仿人类的感知和解释能力，实现自动化检测。该系统集成了传感器和数据处理，稳定导航工厂并提供关键操作条件信息。在废水处理设施中进行了广泛评估。

工业厂房监控的智能机器人系统

BriefGPT - AI 论文速递 ·