Apple Machine Learning Research ·

叙事轨迹：超越画面的评估视频语言模型

💡 原文英文，约100词，阅读约需1分钟。

📝

内容提要

本文讨论了视频理解基准的局限性，指出现有基准未能有效区分知识性与图像性问题，从而影响模型的时间推理能力评估。

🎯

🏷️

Ψ0——人形全身VLA：先用800h人类自视角视频数据和30h的真实机器人交互数据预训练VLM，再后训练MM-DiT，最后用AMO做下肢RL跟踪
本文介绍了Ψ0模型，该模型结合大规模人类视频数据与真实机器人数据，训练出一种用于类人机器人灵巧运动的视觉-语言动作模型，能够有效提取运动先验，实现复杂的全身控制。
WAL + MemTable：崩溃了也不丢数据
LevelDB 通过 WriteBatch 将多条写入操作打包为一个批次，提高写入效率，减少 WAL 写入次数，并逐条应用到 MemTable。
看了 100 小时教程，你为什么依然写不好代码？扒开技术人的“成长环”真相
在技术快速发展的时代，许多程序员沉迷于学习而未能实际应用。文章强调，真正的成长在于走出舒适区，进入“拉伸区”，通过适度挑战提升技能。作者鼓励程序员设计实际...
Anthropic对在深圳引发排队热潮的AI工具的回应
苹果在人工智能软件方面进展有限，但其硬件（如Apple Silicon芯片）适合本地推理任务，推动了Mac Mini等产品的热销。
LP1：窒陬记
本月日志总结包括两次旅行、阅读记录转移、杂谈和未来规划，采用《尔雅·释天第八》中的月份别称命名。
为什么WebAssembly不会取代Kubernetes，但会使Helm更安全
WebAssembly通过Helm 4和Extism插件可安全地在Kubernetes上部署，增强系统的安全性和效率。