评估聊天机器人在金融文献中的准确性

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本研究评估了ChatGPT和Gemini Advanced在金融文献参考中的可靠性,结果显示ChatGPT-4o的幻觉率为20.0%,而Gemini Advanced为76.7%。强调了验证聊天机器人提供的参考文献的重要性。

🎯

关键要点

  • 本研究评估了ChatGPT和Gemini Advanced在金融文献参考中的可靠性。
  • 研究填补了相关研究中的空白。
  • 采用了传统的二元方法与新开发的非二元方法进行评估。
  • ChatGPT-4o的幻觉率为20.0%。
  • Gemini Advanced的幻觉率高达76.7%。
  • 结果强调了验证聊天机器人提供的参考文献的重要性。
➡️

继续阅读