量子位 ·

谷歌北大联手学术版Banana爆火，论文图表100%精确生成

💡 原文中文，约3800字，阅读约需9分钟。

📝

内容提要

谷歌与北大合作开发的PaperBanana能够100%精确生成学术论文插图，效果优于传统方法。该工具通过五个智能体协作，提升图表的美观性和逻辑清晰度，已在GitHub上获得上千个star，受到研究者广泛认可。

🎯

🔎

PaperBanana的生成过程由五个智能体协作完成，分别负责检索、规划、风格优化、可视化和批判。这种分工明确的方式不仅提高了图表的美观性和逻辑清晰度，还参考了人类的插图制作流程，确保生成的插图更符合学术标准。

PaperBanana提供两种生成模式：代码生成模式和直接生图模式。前者保证了数值的绝对准确性，适合需要高精度的统计图表；而后者则在视觉效果上更具吸引力，但可能出现数值不准确的问题。用户应根据具体需求选择合适的模式。

尽管PaperBanana在生成插图方面表现优异，但仍存在无法编辑生成图和细节忠实度不足的问题。这意味着在某些情况下，人工干预仍然是必要的。未来的改进方向可能包括增强编辑功能和提升细节处理能力，以更好地满足研究者的需求。

❓

PaperBanana能够100%精确生成学术论文插图，效果优于传统方法。

PaperBanana通过五个智能体协作，优化图表的美观性和逻辑清晰度。

PaperBanana有代码生成模式和直接生图模式，各有优缺点。

实验结果表明，PaperBanana在所有评估维度上全面超越传统方法，总分相对基线提升了17.0%。

PaperBanana目前无法编辑生成的图，细节忠实度不及人类手工作业。

PaperBanana团队由来自北大和Google Cloud AI Research的研究人员组成，共有7人。

🏷️