小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
原生多模态模型的规模法则

构建通用的多模态信号感知模型是研究目标。研究表明,早融合架构在低参数下具有更强的性能和更高的训练效率,引入专家混合(MoEs)进一步提升了效果。

原生多模态模型的规模法则

Apple Machine Learning Research
Apple Machine Learning Research · 2025-04-16T00:00:00Z
Meta AI推出两款新模型,正式发布Llama 4

Meta发布了最新的AI模型Llama 4,包括Llama 4 Scout和Llama 4 Maverick,其性能超过Google和OpenAI的同类产品。Llama 4 Behemoth拥有2880亿活跃参数,在多个STEM基准测试中表现优异。Meta采用“专家混合”架构以节省资源,并计划在4月29日的LlamaCon上讨论未来计划。

Meta AI推出两款新模型,正式发布Llama 4

The Verge
The Verge · 2025-04-05T23:05:05Z

研究发现,专家混合(MoE)大语言模型在嵌入任务中无需调整即可表现优异。提出的MoEE方法结合路由权重和隐藏状态,显著提升了性能,为嵌入任务提供了新方法。

你的专家混合大语言模型实际上是一个免费的嵌入模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-14T00:00:00Z

本研究提出了一种基于专家混合(MoE)的新框架,解决视频摘要中资源密集的微调问题。该方法整合多种视频大语言模型,实现无微调的视频摘要,生成更具语义意义的总结,提升下游任务表现。

Video Summarization through Language Semantic Understanding

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-06T00:00:00Z

本研究提出了一种专家混合框架,解决交通超出分布场景数据集不足的问题。该方法能有效学习和适应新的空间关系,提高模型在空间分布变化时的鲁棒性,优于现有技术。

抵御年份间空间变化的稳健交通预测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-01T00:00:00Z

本文介绍了基于专家混合(MoE)的个性化大型语言模型P-tailor,用于建模五大人格特征,并通过个性特化损失提高模型参数利用效率。作者构建了高质量的人格塑造数据集(PCD),实验证明了P-tailor在细粒度人格特征操作方面的出色性能和有效性。

P-Tailor: 通过专业 LoRA 专家的混合来定制语言模型的个性特质

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-18T00:00:00Z

通过PESC方法,结合稀疏模型和专家混合,能够在指令调整阶段提高性能、降低计算成本和GPU内存要求。实验证明,PESC稀疏模型在功能上优于其他开源稀疏模型,并比GPT3.5具有更优秀的整体性能。

通过稀疏插值专家释放元调优的强大力量,以实现少样本泛化

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-13T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码