OpenClaw 2026.3.13：让 AI 原生操作你的浏览器，记住你的图片

凡人小北 · 转角处 ·

OpenClaw 2026.3.13：让 AI 原生操作你的浏览器，记住你的图片

💡 原文中文，约3700字，阅读约需9分钟。

📝

内容提要

OpenClaw 新增两个功能：一是通过 Chrome DevTools 让 AI 操作浏览器，支持点击、输入和截图；二是多模态记忆，能记住图片和音频，支持跨模态搜索。配置简单，适用于社交媒体自动化和数据采集等场景。

🎯

关键要点

OpenClaw 新增两个功能：通过 Chrome DevTools 让 AI 操作浏览器，支持点击、输入和截图；多模态记忆，能记住图片和音频，支持跨模态搜索。
AI 通过 Chrome DevTools 直接操作浏览器，能够看到页面元素、网络请求、控制台日志等。
基础操作包括点击、输入、导航、截图、滚动、表单填写、文件上传和发送快捷键。
高级功能包括性能审计、性能追踪、内存快照、网络监控和执行 JavaScript 代码。
配置步骤包括开启 Chrome 远程调试、安装 mcporter、配置 MCP 服务器、启动 daemon 和验证连接。
AI 可以用于社交媒体自动化、数据采集、自动化测试、调试助手、代填表单和监控页面变化。
OpenClaw 的多模态记忆功能可以记住图片和音频，支持用文字搜索相关内容。
配置多模态记忆需要创建目录、修改配置文件和重启 OpenClaw。
注意事项包括只有指定目录的文件会被索引、必须关闭 fallback 选项和换模型会重建索引。
支持的文件格式包括多种图片和音频格式，单文件最大 10MB。
新功能使得 AI 能直接操作浏览器，记忆能力从文字扩展到图文音频，搜索方式更加灵活。

❓

延伸问答

OpenClaw 的新功能是什么？

OpenClaw 新增了通过 Chrome DevTools 让 AI 操作浏览器的功能，以及多模态记忆功能，能记住图片和音频并支持跨模态搜索。

如何配置 OpenClaw 的多模态记忆功能？

配置多模态记忆需要创建目录、修改配置文件并重启 OpenClaw，确保指定目录的文件会被索引。

AI 如何通过 Chrome DevTools 操作浏览器？

AI 可以通过 Chrome DevTools 直接操作浏览器，执行点击、输入、导航、截图等基础操作，以及性能审计和网络监控等高级功能。

OpenClaw 的多模态记忆功能支持哪些文件格式？

支持的文件格式包括多种图片格式（如 jpg, png）和音频格式（如 mp3, wav），单文件最大为 10MB。

使用 OpenClaw 进行社交媒体自动化的场景有哪些？

可以用于定时发推、自动回复、监控竞品截图存档等社交媒体自动化场景。

配置 OpenClaw 时需要注意哪些事项？

注意事项包括只有指定目录的文件会被索引，必须关闭 fallback 选项，以及换模型会重建索引。

🏷️

继续阅读

使用OpenClaw的5个有趣项目
本文介绍如何在虚拟私人服务器（VPS）上安全部署OpenClaw，确保其24/7在线。重点在于系统运行、访问控制和安全性，适合初学者，帮助学习部署和操作安全技能。
OpenClaw+本地Gemma4+谷歌Turbo Quant架构全解析
OpenClaw与Gemma 4架构旨在提升本地模型的执行能力。Gemma 4作为高性能模型，能够独立完成复杂任务。系统优化聚焦于模型利用、量化压缩、接口...
AI 编程时代，我挖出了一本 1999 年的“删库跑路”指南
在AI主导的2026年，Tony Bai回顾1999年的《如何编写不可维护的代码》，探讨编程中的幽默与混乱。文章揭示了通过命名混淆和注释失真等手法制造难以...
OpenClaw如何在4个月内获得350K星标
2025年11月，开源项目OpenClaw在GitHub上线，迅速获得350K星标。它是一个个人AI助手，通过常用聊天应用与用户互动，成功打破了开发者圈子...
OpenClaw 为什么能 4 个月拿下 35 万 Star
OpenClaw是一个开源个人AI助手项目，2025年上线后迅速获得35万Star。它通过简化聊天工具接入，提供即时反馈，促进传播。其架构整合多个平台为一...
Linux内核维护者崩溃了！AI每天狂塞10份漏洞报告，想摸会鱼都难
Linux内核维护者面临AI生成漏洞报告激增，工作量显著增加。尽管被视为“幸福的烦恼”，但开发者们承受着巨大的压力，需适应AI快速发展以提升软件质量。