评估聊天机器人在金融文献中的准确性
原文中文,约300字,阅读约需1分钟。发表于: 。本研究评估了ChatGPT和Gemini Advanced两款聊天机器人在提供金融文献参考时的可靠性,填补了相关研究中的空白。研究采用了传统的二元方法与新开发的非二元方法,发现ChatGPT-4o的幻觉率为20.0%,而Gemini Advanced的幻觉率高达76.7%。结果强调了在快速发展的领域中验证聊天机器人提供的参考文献的重要性。
本研究评估了ChatGPT和Gemini Advanced在金融文献参考中的可靠性,结果显示ChatGPT-4o的幻觉率为20.0%,而Gemini Advanced为76.7%。强调了验证聊天机器人提供的参考文献的重要性。