本研究探讨了生成性人工智能时代用户模拟的关键应用,提出了一种通过智能代理模拟人类用户行为的新方法,旨在促进用户建模、合成数据生成及AI系统评估。研究表明,用户模拟在多个领域具有深远影响,为通用人工智能的探索提供重要支持。
本研究提出了VideoAutoArena,一个自动化基准,旨在通过用户模拟评估大型多模态模型在视频分析中的能力。该方法克服了传统评估的局限,能够生成开放式、适应性的问题,实验证明其有效性,并提供模型优势和改进空间的洞察。
完成下面两步后,将自动完成登录并继续当前操作。