评估聊天机器人在金融文献中的准确性
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本研究评估了ChatGPT和Gemini Advanced在金融文献参考中的可靠性,结果显示ChatGPT-4o的幻觉率为20.0%,而Gemini Advanced为76.7%。强调了验证聊天机器人提供的参考文献的重要性。
🎯
关键要点
- 本研究评估了ChatGPT和Gemini Advanced在金融文献参考中的可靠性。
- 研究填补了相关研究中的空白。
- 采用了传统的二元方法与新开发的非二元方法进行评估。
- ChatGPT-4o的幻觉率为20.0%。
- Gemini Advanced的幻觉率高达76.7%。
- 结果强调了验证聊天机器人提供的参考文献的重要性。
➡️