小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

机器之心数据服务现已上线,提供高效稳定的数据获取,简化数据爬取流程。

复旦大学/上海创智学院邱锡鹏:Context Scaling,通往AGI的下一幕

机器之心
机器之心 · 2025-06-15T12:00:24Z

DeepSeek-R1通过多头潜在注意力机制(MLA)实现模型迁移,仅需原始数据的0.3%-0.6%。该研究由复旦大学等机构联合提出,MHA2MLA方法有效降低推理成本,同时保持模型性能,适用于多种大语言模型。

DeepSeek-R1秘籍轻松迁移,只需原始数据0.3% | 邱锡鹏团队联合出品

量子位
量子位 · 2025-02-24T08:16:59Z

MOSS是复旦大学邱锡鹏团队开源的对话语言模型,参数量为160亿,包括基座模型、微调模型和插件增强模型。MOSS还有量化版本,占用显存较少。baichuan-7B是百川智能开发的开源预训练语言模型,基于Transformer结构,训练数据量为1.2万亿,上下文窗口长度为4096。baichuan-7B在分词和数据集方面进行了优化,采用了多种方法提升模型效果和训练吞吐。

baichuan7B/13B的原理与微调:从baichuan的SFT实现到baichuan2的RLHF实现

结构之法 算法之道
结构之法 算法之道 · 2023-07-05T03:34:45Z
复旦邱锡鹏:深度剖析 ChatGPT 类大语言模型的关键技术

内容来源:ChatGPT 及大模型专题研讨会分享嘉宾:复旦大教授 邱锡鹏分享主题:《对话式大型语言模型》转载自 […]

复旦邱锡鹏:深度剖析 ChatGPT 类大语言模型的关键技术

我爱自然语言处理
我爱自然语言处理 · 2023-03-16T08:42:14Z

上周,复旦大学邱锡鹏教授团队推出了国内版的ChatGPT——MOSS,但由于访问量太大,暂时关闭,预计3月底开源。MOSS可以进行多轮交互,还可以生成表格、生成代码等,但中文水平不够高,清洗难度大。

复旦大学邱锡鹏教授团队称如果优化顺利MOSS将在下月底开源

蓝点网
蓝点网 · 2023-02-27T03:09:12Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码