苹果发布驱动Apple Intelligence的Apple Foundation Models
原文英文,约600词,阅读约需2分钟。发表于: 。Apple published the details of their new Apple Foundation Models (AFM), a family of large language models (LLM) that power several features in their Apple Intelligence suite. AFM comes in two...
苹果发布了新的Apple Foundation Models (AFM),这是一系列大型语言模型(LLM),用于驱动其Apple Intelligence套件中的多个功能。AFM有两种尺寸:一个3B参数的设备上模型和一个更大的云端模型。苹果公布了这两个模型的开发细节,它们都基于Transformer解码器架构,在6.3T个标记的数据上进行了预训练。苹果在多个基准测试中评估了这两个模型,并发现它们在某些情况下超过了类似规模的模型,如Llama 3或GPT-4。苹果表示:我们的模型旨在帮助用户在其苹果产品上进行日常活动,并在每个阶段都负责任地开发,以苹果的核心价值观为指导。