BriefGPT - AI 论文速递 ·

DME-Driver: 自主驾驶中融合人类决策逻辑与 3D 场景感知

💡 原文中文，约300字，阅读约需1分钟。

📝

内容提要

ADriver-I是一种基于多模态大语言模型和扩散技术的自主驾驶世界模型。通过预测当前帧的控制信号和历史的视觉-动作对，以及生成的控制信号来预测未来的帧，实现了自主驾驶。在nuScenes和私有数据集上的实验中，ADriver-I表现出卓越的性能。

🎯

🏷️

Ampere Skylark 微架构评测
Ampere Skylark 微架构评测显示其为早期 ARM 服务器核心，采用 16nm 工艺，具备 32KB L1 ICache/DCache、1024...
机器人视觉迎来新突破！蚂蚁灵波空间感知模型LingBot-Depth 2.0正式发布
蚂蚁集团旗下的灵波科技发布了空间感知模型LingBot-Depth 2.0，该模型基于1.5亿数据训练，显著提升了深度估计和物体识别能力，尤其在透明和反光...
Discord accidentally banned over 8,000 people for posting grids and other ‘benign’ images
Discord says a bug affecting its safety system caused it to mistakenly ban mo...
安克的噪音阻隔睡眠耳塞几乎打对折
You might have a great bed and a good sleepy time routine, but if you’re stil...
分布式 OLAP 查询引擎 — 系列规划
> 本文是写作规划，不是可发布正文。拆解对象分两层：查询优化与执行框架（Calcite / 规则与代价模型）与分布式 OLAP 引擎（Trino 主...
使用Gemma 4进行零样本本地文档解析：将PDF视为图像
Treating PDFs as images and feeding those images to Gemma 4 dissolves the sca...