小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
QwQ-32B: 领略强化学习之力

大规模强化学习显著提升了语言模型的性能。新模型QwQ-32B拥有320亿参数,性能与6710亿参数的DeepSeek-R1相当。通过冷启动数据和多阶段训练,QwQ-32B在数学和编程等任务上持续提升,展示了强化学习在预训练模型中的有效性。

QwQ-32B: 领略强化学习之力

Blog on Qwen
Blog on Qwen · 2025-03-05T16:00:04Z

本研究提出了一种高效的一周期结构剪枝框架,旨在解决多阶段训练中的高计算成本和性能下降问题。通过优化子网络搜索,该方法在多个数据集上实现了先进的准确率,并提高了训练效率。

One-Cycle Structured Pruning with Stability-Driven Structure Search

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-23T00:00:00Z

本研究提出了DeepSeek-R1及其无监督预训练版本DeepSeek-R1-Zero,旨在提升大型语言模型的推理能力。通过多阶段训练,DeepSeek-R1在推理任务上表现优异,解决了可读性和语言混合等问题。

DeepSeek-R1: Incentivizing Reasoning Capability in Large Language Models via Reinforcement Learning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-22T00:00:00Z

大型语言模型(LLMs)在医疗领域具有巨大潜力,但也面临挑战。研究提出了一种多阶段训练方法,结合持续预训练和微调,显著提升了医学LLM的性能。新开发的开源医学语言模型MEDITRON在多个医学测试中表现优异,尤其在多语言医学问答基准上,展现了与GPT-4相当的能力。这些研究强调了数据集质量和多样性对模型性能的重要性。

面向医疗的多语言大语言模型民主化:通过两阶段指令微调方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-09T00:00:00Z

本研究探讨了不同平衡策略对长尾识别的影响,发现简单的实例平衡抽样能有效提升分类器性能。提出的多阶段训练方案和提示调整方法在长尾分类中表现优异,尤其在多个数据集上取得了先进结果。此外,研究构建了统一框架,结合文本和图像,显著提高了小类别的识别能力。

长尾多标签图像分类的类别提示精炼特征学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-15T00:00:00Z

本文介绍了为医学应用优化的数据集,探讨了微调对模型性能的影响。开发的多语言医学语言模型MMedLM 2表现优异,接近GPT-4。提出的多阶段训练方法显著提升了医学LLMs的性能,促进了医疗领域的研究与应用。同时,评估了开源LLMs在医疗摘要任务中的表现,推动了数字健康领域的发展。

Aqulia-Med LLM:全过程开源医疗语言模型的开创性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-18T00:00:00Z

本文介绍了多语言神经机器翻译(NMT)系统的研究进展,包括构建大规模多语言模型、提高低资源语言翻译质量,以及采用数据扩增和多阶段训练策略等新技术。这些方法在多种语言翻译任务中显著提升了NMT的效率和实用性。

MAMMOTH:赫尔辛基的大规模多语言模块化开放翻译

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-12T00:00:00Z

本文介绍了一种通过多阶段训练扩大双编码器模型规模的方法,解决了双编码器在不同域上的推广问题。该方法在域外泛化和检索性能方面取得了显著提高,优于现有的检索模型。消融研究还发现该方法在数据效率方面非常高效。

回归基础:提升密集编码器领域外检索的简单方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-16T00:00:00Z

该文介绍了一种将大型语言模型整合到医疗保健中的多阶段训练方法,通过专业域持续预训练、监督微调和直接偏好优化,以及一个包含医疗问答、纯文本、知识图谱和对话的 3Gb 中医数据集,医学 LLM(Qilin-Med)在性能上有了显著提升。

医学问题回答中领域特定语言模型的持续训练和微调

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-01T00:00:00Z

该文介绍了一种将大型语言模型整合到医疗保健中的多阶段训练方法,通过预训练、微调和优化等方式,提高了医学LLM的性能表现。该方法在测试集上表现优异,达到了16.66和27.44的BLEU-1和ROUGE1分数。

Qilin-Med-VL: 面向通用医疗的中文大规模视觉语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-27T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码