机器之心 ·

对话肖特特：从伯克利到PromptAI创业，发明创造下一代视觉智能

💡 原文中文，约10600字，阅读约需26分钟。

📝

内容提要

Meta AI推出的SAM模型通过交互方式实现物体分割，提升了空间信息理解。肖特特博士认为，未来AI需具备人类感知能力，以解决真实世界问题。PromptAI致力于创造类人视觉智能，推动AI与环境的互动，探索新一代视觉技术应用。

🎯

🔎

计算机视觉领域经历了从CV1.0到CV2.0的转变。CV1.0专注于特定任务，缺乏通用性，而CV2.0则致力于让AI具备人类感知能力，解决开放世界中的通用任务。这一转变不仅提升了AI的应用范围，也为未来的技术发展奠定了基础。

Meta AI推出的SAM模型通过交互方式实现物体分割，标志着计算机视觉技术的重大进步。它的零样本泛化能力使得AI能够在未见过的物体上进行有效识别，这为未来的视觉智能应用提供了新的可能性，尤其是在复杂环境中的应用。

肖特特博士强调，未来5-10年，计算机视觉需要解决真实世界的问题，特别是提升视频理解能力。这意味着AI不仅要识别静态图像，还需理解动态场景中的物体行为和空间关系，从而实现更高层次的智能交互。

❓

SAM模型通过交互方式实现物体分割，无需专门的类别标注，提升了空间信息理解能力。

肖特特博士认为未来AI需具备人类感知能力，以解决真实世界的问题。

PromptAI致力于创造类人视觉智能，推动AI与环境的互动，探索新一代视觉技术应用。

CV1.0解决特定任务，缺乏通用性；而CV2.0目标是让AI具备人类感知能力，解决开放世界中的通用任务。

未来5-10年，计算机视觉需要解决真实世界的问题，提升视频理解能力，理解时间和空间的连续性。

肖特特博士认为AI更像是生产工具，而非艺术家，AI难以感受艺术，因此生成的内容不等同于艺术。

🏷️