港科广×腾讯联手打造《我的世界》神操作,400张截图就能让AI挖矿通关,成本降至5%|EMNLP 2025
💡
原文中文,约2000字,阅读约需5分钟。
📝
内容提要
香港科技大学(广州)与腾讯合作开发的VistaWise框架,通过仅用471张截图和轻量化视觉微调,实现了《我的世界》中AI挖矿的高效决策,成功率提升至33%,成本降至5%。该系统在EMNLP 2025会议上被录用,标志着小数据驱动大模型的突破。
🎯
关键要点
- 香港科技大学(广州)与腾讯合作开发VistaWise框架,提升《我的世界》中AI挖矿的成功率至33%,成本降至5%。
- VistaWise框架结合了跨模态知识图谱和轻量化视觉微调,首次在开放世界智能体中应用。
- 实验结果显示,VistaWise在获取钻石的完整链条上刷新了非API类方法的成功率纪录。
- 该框架仅需471张截图和一张24GB显存的显卡,显著降低了训练成本和数据需求。
- VistaWise的核心创新包括图谱级知识外挂、视觉增强的轻量化检测和推理增强的检索式池化。
- 整套系统实现了感知、检索、推理和执行的闭环,能够在本地笔记本电脑上运行。
- 与多模态大模型相比,VistaWise在性能上更高效,同时减少了30.7%的tokens使用。
- 最终,VistaWise的推理开销仅为传统方法的5%。
❓
延伸问答
VistaWise框架的主要创新是什么?
VistaWise框架的主要创新包括图谱级知识外挂、视觉增强的轻量化检测和推理增强的检索式池化。
使用VistaWise框架进行AI挖矿的成功率是多少?
使用VistaWise框架进行AI挖矿的成功率提升至33%。
VistaWise框架如何降低训练成本?
VistaWise框架通过仅需471张截图和一张24GB显存的显卡,显著降低了训练成本和数据需求。
VistaWise框架在EMNLP 2025会议上有什么成就?
VistaWise框架的研究成果被EMNLP 2025会议正式录用。
VistaWise框架的推理开销与传统方法相比如何?
VistaWise的推理开销仅为传统方法的5%。
VistaWise框架如何实现感知、检索、推理和执行的闭环?
VistaWise框架通过YOLO检测环境,实时更新知识图谱,使用GPT-4o生成指令,并通过PyAutoGUI执行操作,实现闭环。
➡️