小红花·文摘

本研究提出了一种高效推导编程语言特定子模型的方法，通过无结构修剪技术降低大型语言模型的计算需求。研究表明，适当的校准数据集能够有效提取子模型，同时保持准确性，增强其在编程任务中的可及性。

Deriving Coding-Specific Sub-Models from Large Language Models using Resource-Efficient Pruning

BriefGPT - AI 论文速递 ·

SortedNet是一种高效动态推断的深度神经网络解决方案，考虑了子模型的嵌套架构和共享参数，并以排序和概率的方式一起训练主模型和子模型。在推断过程中，无需搜索即可选择子网络，并且生成的子网络具有最小的存储要求和高效的切换能力。实验证明该方法的有效性，并演示了在同时训练多达160个不同子模型的广泛可扩展性。

SortNet: 通过基于神经网络的排序算法学习排序

BriefGPT - AI 论文速递 ·

具有无误差可微交换函数的广义神经排序网络

BriefGPT - AI 论文速递 ·

SortedNet是一种利用深度神经网络的内在模块化性质实现高效动态推断的模型。它通过排序和概率的方式一起训练主模型和子模型，并具有最小的存储要求和高效的切换能力。实验证明了该方法的有效性，并展示了其在同时训练多达160个不同子模型的广泛可扩展性。

SortedNet：为每个网络提供位置，为每个网络找到合适位置：面向广义解决方案的训练多对一神经网络

BriefGPT - AI 论文速递 ·