小红花·文摘

本文介绍了新型语言模型的进展，包括Phi-1、Phi-2和BTLM-3B-8K。Phi-1在多个基准测试中表现优异，参数较少；Phi-2在电信领域应用中与大型模型的准确性相当；BTLM-3B-8K在长上下文任务中表现突出，超越现有模型。此外，研究探讨了小型模型的优化策略和新评估方法，推动了语言模型的发展。

Phi-3 技術報告：在您的手機上本地運行的功能強大的語言模型

BriefGPT - AI 论文速递 ·

Phi-1是一种新的大型代码语言模型，使用60亿个标记的数据和GPT-3.5合成生成的教材进行了为期4天的训练，具有13亿个参数。Phi-1在HumanEval和MBPP上的准确率分别为50.6％和55.5％，并展示了令人惊讶的emergent属性。

教科书是你所需的唯一 II: phi-1.5 技术报告

BriefGPT - AI 论文速递 ·