小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

2025全球人工智能技术大会在杭州召开,京东零售与清华大学合作推出xLLM端云一体大模型推理架构,以提升AI推理性能,解决电商技术挑战。京东未来将加大对国产AI基础设施的投入,探索多智能体自进化和分布式推理等方向。

我在618主场,和3位顶尖技术博士聊了聊

京东科技开发者
京东科技开发者 · 2025-06-25T06:49:49Z

本研究提出了一种多层融合与推理架构(MFRA),旨在解决视觉与语言导航中的复杂多模态交互问题。MFRA通过层次化机制显著提高了代理在导航场景中的决策准确性,优于现有方法。

Hierarchical Thinking and Dynamic Action: Hierarchical Multi-modal Fusion and Reasoning for Vision-and-Language Navigation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-23T00:00:00Z

Kimi与清华大学等机构联合开源了大模型推理架构Mooncake,旨在提升推理性能和用户体验。该架构采用分离式设计,优化资源利用,已在GitHub获得1.2k星。Mooncake通过预测负载和早期拒绝策略处理高并发请求,显著提高吞吐量,支持Kimi线上80%以上的流量。

刚刚,Kimi开源底层推理框架,1小时GitHub揽星1.2k

量子位
量子位 · 2024-11-28T08:01:56Z
官宣开源 阿里云与清华大学共建AI大模型推理项目Mooncake

2024年6月,Kimi与清华大学联合发布了以KVCache为核心的大模型推理架构Mooncake,旨在提升推理性能、降低成本并促进高性能推理框架的生态建设。该项目已开源,阿里云参与了关键组件的开发,未来将与更多机构合作推动模型推理系统的创新。

官宣开源 阿里云与清华大学共建AI大模型推理项目Mooncake

机器之心
机器之心 · 2024-11-28T07:51:29Z
Leaked Technical Details of GPT-4

GPT-4是一个泄露的模型,据信拥有1.8万亿个参数和120个层。它采用了16个专家的混合模型,每次前向推理只使用2800亿个参数和560 TFLOPs。GPT-4训练时使用了约13万亿个标记,批量大小为6000万,通过将其除以序列长度来计算实际批量大小。OpenAI使用了张量并行和流水线并行等并行策略。GPT-4的训练成本估计约为6300万美元。GPT-4有一个独立的视觉编码器,并使用额外的标记进行微调。GPT-4的推理中可能使用了推测解码。推理架构在128个GPU的集群上运行。OpenAI在获取高质量数据方面面临挑战。

Leaked Technical Details of GPT-4

Enderfga's blog
Enderfga's blog · 2023-07-11T01:12:24Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码