国产模型指令跟随全球第一!来自LeCun亲推的「最难作弊」大模型新榜单

💡 原文中文,约3900字,阅读约需10分钟。
📝

内容提要

国内初创公司阶跃星辰的Step-2大模型在LeCun推出的LiveBench榜单中获得全球第一和国产第一,展现出其在指令跟随和语言生成方面的强大能力。该模型采用自主研发的MoE架构,参数量达到万亿级,体现了卓越的技术实力和创新潜力。

🎯

关键要点

  • 阶跃星辰的Step-2大模型在LiveBench榜单中获得全球第一和国产第一。

  • Step-2采用自主研发的MoE架构,参数量达到万亿级。

  • LiveBench是由图灵奖得主杨立昆推出的全球首个无法作弊的LLM基准测试。

  • Step-2在指令跟随任务中以86.57分获得全球第一,展现出强大的语言生成能力。

  • Step-2的训练过程中突破了多项关键技术,确保高效训练。

  • 阶跃星辰的多模态模型Step-1.5V在感知、推理和视频理解方面表现突出。

  • 阶跃星辰的目标是开发出能够实现AGI的多模态大模型。

  • Step-2已接入阶跃星辰的C端智能生活助手「跃问」,并支持API接入。

  • 阶跃星辰在大模型领域快速迭代,持续推进技术创新。

延伸问答

阶跃星辰的Step-2大模型在LiveBench榜单中获得了什么成绩?

Step-2在LiveBench榜单中获得全球第一和国产第一,指令跟随任务得分为86.57分。

Step-2大模型采用了什么架构?

Step-2采用了自主研发的MoE架构,参数量达到万亿级。

LiveBench榜单的特点是什么?

LiveBench是全球首个无法作弊的LLM基准测试,由杨立昆推出,旨在确保评估的公平性和准确性。

阶跃星辰的目标是什么?

阶跃星辰的目标是开发出能够实现AGI的多模态大模型。

Step-2大模型在语言生成方面有什么优势?

Step-2在语言生成上对细节有强控制力,能够精准理解和遵循人类指令。

阶跃星辰的多模态模型Step-1.5V有哪些突出表现?

Step-1.5V在感知、推理和视频理解方面表现突出,能够处理复杂图表和视频内容。

➡️

继续阅读