小红花·文摘

Apple Machine Learning Research ·

本研究探讨了语言模型中参数数量与计算量之间的关系，重点分析了稀疏混合专家模型的稀疏性对性能的影响。研究表明，优化稀疏性能够提升训练效率和模型性能，为设计更高效的架构提供了新视角。

BriefGPT - AI 论文速递 ·

FLOPs（每秒浮点运算次数）是指每秒执行的浮点运算次数。32位数字使用单精度，64位数字使用双精度。常见的单位有MFLOPS，GFLOPS，TFLOPS，PFLOPS和EFLOPS。GeForce RTX 4090的单精度计算能力为82.58 TFLOPS。

陈少文的博客 ·

本研究提出了一种新型生成模型，利用逐步生长学习扩展视野，应用于组织分类和癌症诊断。实验结果表明，该模型在数字病理学中表现优异，尤其是NLP模型在小数据集和大数据集上的表现相当。研究还综述了计算病理学的发展，强调自监督学习和数据多样性对模型性能的重要性，推动了病理学图像分析的进步。

BriefGPT - AI 论文速递 ·

泠泫凝的异次元空间 ·