小红花·文摘

本文介绍了大语言模型LLaMA的底层架构和注意力机制优化方法，包括前置层归一化、RMSNorm归一化函数、SwiGLU激活函数和旋转位置嵌入等改进。同时介绍了稀疏注意力机制、FlashAttention算法和多查询注意力的优化方法。这些改进和优化能够提高大语言模型的计算效率和性能。

华为云官方博客 ·

本研究综合调查和分析了使用卷积神经网络的交通信号灯识别方法，重点关注数据集和CNN架构。根据底层架构分为三个主要群组：修改通用目标检测器的方法、利用规则和CNN组件的多阶段方法以及特定任务的单阶段方法。讨论了每个群组中最重要的工作，数据集的使用情况，并确定了研究的空白点。

BriefGPT - AI 论文速递 ·

本文介绍了如何构建前端工具库，解决常用工具方法的冗余和规范不统一问题，包括构建工具库的主流方案、底层架构设计、代码冲突和颗粒度问题的解决方案，以及添加本地开发调试系统、工具库文档系统和单元测试。最后，讲解了工具库包的发布。

京东科技开发者 ·