BriefGPT - AI 论文速递 ·

Phi-3 技術報告：在您的手機上本地運行的功能強大的語言模型

💡 原文中文，约400字，阅读约需1分钟。

📝

内容提要

phi-3-mini是一个38亿参数的语言模型，使用33万亿标记进行训练。该模型在学术基准和内部测试中表现出色，足够小可以在手机上运行。训练数据集是phi-2数据集的扩大版本，由经过过滤的网络数据和合成数据组成。文章还提到了模型的鲁棒性、安全性和聊天格式，并提供了7B和14B模型的初始参数缩放结果。

🎯

关键要点

phi-3-mini是一个38亿参数的语言模型，使用33万亿标记进行训练。
该模型在学术基准和内部测试中表现出色，能够与Mixtral 8x7B和GPT-3.5等大型模型相媲美。
phi-3-mini模型足够小，可以在手机上运行。
训练数据集是phi-2数据集的扩大版本，由经过过滤的网络数据和合成数据组成。
模型的鲁棒性、安全性和聊天格式得到了说明。
提供了7B和14B模型的初始参数缩放结果，分别训练了48万亿的标记。
7B和14B模型相比phi-3-mini更加强大，MMLU分别为75%和78%，MT-bench分别为8.7和8.9。

🏷️

继续阅读

语言模型的集体意识
语言模型的“集体意识”现象导致不同模型在开放性问题上给出相似答案。研究表明，模型间输出高度重叠，可能是由于训练数据和奖励模型的重叠。长期使用同质化工具可能...
语言模型的蜂巢思维
论文探讨了语言模型的“蜂巢思维”现象，指出不同模型在开放式问题上的回答高度相似，导致输出同质化。研究构建了Infinity-Chat数据集，分析了模型间的...
B-tree 深度解剖：从磁盘 I/O 模型到 boltdb 源码
自1972年提出以来，B-tree成为数据库和文件系统的核心数据结构，因其与磁盘I/O模型的契合而减少随机读次数，查找效率高，适合大规模数据。B+tree...
【2026 AI硬件开发学习必看系列】通过MCP给AI语音助手加上温湿度测量播报功能
本文介绍了如何使用MCP工具为AI语音助手添加温湿度测量功能。以LS26开发板为例，教程指导用户通过语音指令控制I2C通信，读取AHT10传感器数据，并实...
把 OpenClaw 从个人助手变成客服：一次信任模型的翻转
本文探讨如何将OpenClaw从个人助手转型为客服Agent，重点在会话隔离、多渠道接入、安全模型、知识库注入及客户记忆的局限。通过AWS架构实现安全隔离...
借助mediabunny纯JS实现视频水印、剪裁、合成等功能
本文介绍了mediabunny，一个基于WebCodecs API的音视频处理框架，支持视频格式转换、添加水印和剪裁视频等功能。通过示例代码，展示了视频水...

Phi-3 技術報告：在您的手機上本地運行的功能強大的語言模型

内容提要

关键要点

标签

继续阅读