小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究提出了一种高效推导编程语言特定子模型的方法,通过无结构修剪技术降低大型语言模型的计算需求。研究表明,适当的校准数据集能够有效提取子模型,同时保持准确性,增强其在编程任务中的可及性。

Deriving Coding-Specific Sub-Models from Large Language Models using Resource-Efficient Pruning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-09T00:00:00Z

SortedNet是一种高效动态推断的深度神经网络解决方案,考虑了子模型的嵌套架构和共享参数,并以排序和概率的方式一起训练主模型和子模型。在推断过程中,无需搜索即可选择子网络,并且生成的子网络具有最小的存储要求和高效的切换能力。实验证明该方法的有效性,并演示了在同时训练多达160个不同子模型的广泛可扩展性。

SortNet: 通过基于神经网络的排序算法学习排序

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-03T00:00:00Z

SortedNet是一种高效动态推断的深度神经网络解决方案,考虑了子模型的嵌套架构和共享参数,并以排序和概率的方式一起训练主模型和子模型。在推断过程中,无需搜索即可选择子网络,并且生成的子网络具有最小的存储要求和高效的切换能力。实验证明该方法的有效性,并演示了在同时训练多达160个不同子模型的广泛可扩展性。

具有无误差可微交换函数的广义神经排序网络

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-11T00:00:00Z

SortedNet是一种利用深度神经网络的内在模块化性质实现高效动态推断的模型。它通过排序和概率的方式一起训练主模型和子模型,并具有最小的存储要求和高效的切换能力。实验证明了该方法的有效性,并展示了其在同时训练多达160个不同子模型的广泛可扩展性。

SortedNet:为每个网络提供位置,为每个网络找到合适位置:面向广义解决方案的训练多对一神经网络

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-01T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码