小红花·文摘
首页
广场
排行榜
🏆
直播
FAQ
首页
详情
钟意博客
·
2026-02-07T02:00:00Z
大语言模型的不确定性
📝
内容提要
即使 temperature=0、seed=0 也无法保证相同输出
🏷️
标签
大语言模型
阅读原文
生成长图
分享链接
已复制链接
➡️
继续阅读
Inception Labs表示其扩散大语言模型的速度比Claude、ChatGPT和Gemini快10倍
Ermon在斯坦福大学提出了图像扩散模型,并在ICML 2024获得最佳论文。他认为,尽管Mercury 2的质量与Claude Haiku和Google...
开源大语言模型背后的架构
npx workos推出了一款AI代理,能够将身份验证直接集成到现有代码中。DeepSeek V3及其他模型采用混合专家架构,优化了计算效率和内存使用,推...
大语言模型时代的数据工程
本文探讨了数据角色的演变、支持训练和推理的关键流程,以及新架构(如RAG)在应用程序构建中的定义,适合初学者数据科学家理解其在新范式中的定位。
HRM 架构突破:用仅 2700 万参数和 1000 个训练样本超越最先进的大语言模型
新加坡Sapient Intelligence公司提出的分层推理模型(HRM)仅用2700万参数和1000个样本,在复杂推理任务中超越大型模型,表明更优的...
DeepSeek-R1:用纯强化学习解锁大语言模型的推理能力
DeepSeek R1 是中国 AI 公司推出的模型,采用纯强化学习实现自主推理,突破传统监督学习模式。R1-Zero 模型无需人类标注,展现出链式推理能...
早报|苹果发布iPhone 17e,4499起支持eSIM/vivo X300 Ultra将搭载双2亿像素三摄/豆瓣回应运营失误商品被薅空:无法承受损失
苹果发布iPhone 17e和M4 iPad Air,起售价4499元。小米机器人在汽车工厂完成自主作业测试,成功率达到90.2%。vivo X300 U...
👤 个人中心
在公众号发送验证码完成验证
去登录
登录验证
在本设备完成一次验证即可继续使用
×
完成下面两步后,将自动完成登录并继续当前操作。
1
关注公众号
小红花技术领袖
如果当前 App 无法识别二维码,请在
微信
搜索并关注该公众号
2
发送验证码
在公众号对话中发送下面 4 位验证码