MCC-KD: 多 CoT 一致知识蒸馏
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
该研究提出了一种多模态的CoT框架,将语言和视觉信息相结合,提高了答案推断的准确性,比先前最先进的LLM(GPT-3.5)高出16个百分点,甚至超过了人类表现,在ScienceQA基准测试中表现出色。
🎯
关键要点
- 该研究提出了一种多模态的CoT框架,结合语言和视觉信息。
- 该框架提高了答案推断的准确性,超过了先前最先进的LLM(GPT-3.5)16个百分点。
- 在ScienceQA基准测试中,该框架的准确度达到91.68%,超过了人类表现。
➡️