小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
新款Claude Haiku 4.5模型承诺以三分之一的成本提供更快的性能

Anthropic发布了Claude Haiku 4.5,定位为小型快速模型,性能与Claude Sonnet 4相当,但成本仅为其三分之一,速度超过两倍。该模型具备混合推理能力,支持快速回答和扩展思考,用户可查看推理过程。经过多种数据清洗和过滤训练,确保安全性和准确性,开发者可通过多个平台访问该模型。

新款Claude Haiku 4.5模型承诺以三分之一的成本提供更快的性能

InfoQ
InfoQ · 2025-11-12T03:15:00Z
Nous Research 发布 Hermes 4:具有混合推理能力的开放权重 AI 模型系列

Nous Research发布的Hermes 4是一个开放权重模型系列,采用后训练技术,具备混合推理能力。核心组件DataForge通过有向无环图生成合成数据,显著提升推理样本质量。Hermes 4在多个基准测试中表现优异,展现了开源AI的潜力与中立性。

Nous Research 发布 Hermes 4:具有混合推理能力的开放权重 AI 模型系列

实时互动网
实时互动网 · 2025-08-29T02:42:52Z
Claude 4现已在Polite AI上推出

Anthropic推出Claude 4系列,包括适合复杂任务的Claude Opus 4和经济实惠的Claude Sonnet 4。两者支持混合推理和改进的记忆能力,提升用户体验。

Claude 4现已在Polite AI上推出

DEV Community
DEV Community · 2025-05-23T18:05:56Z
亚马逊云科技在Amazon Bedrock推出Anthropic最新一代模型

亚马逊云科技推出了Anthropic的Claude Opus 4和Claude Sonnet 4模型,具备快速响应与深度思考的混合推理能力。Claude Opus 4适合复杂任务和编码,Claude Sonnet 4在性能与成本上取得平衡,适用于高吞吐量业务,支持多任务处理。两者均具备“扩展思考”功能。

亚马逊云科技在Amazon Bedrock推出Anthropic最新一代模型

全球TMT-美通国际
全球TMT-美通国际 · 2025-05-23T06:18:05Z
Qwen 3:阿里巴巴在开源AI领域的飞跃

阿里巴巴Qwen团队于2025年4月29日发布了最新的大型语言模型Qwen 3,拥有2350亿参数,支持多种应用场景,具备混合推理能力,能够在复杂任务与快速对话间灵活切换。Qwen 3在多个基准测试中表现优异,提供高效的多语言支持,推动了AI的可及性与创新。

Qwen 3:阿里巴巴在开源AI领域的飞跃

DEV Community
DEV Community · 2025-04-30T20:07:30Z
我在通义 APP 体验了全球最强开源模型 Qwen 3,它改变了我对国产 AI 的期待

阿里推出的Qwen 3模型在通义APP中表现优异,超越其他开源模型,具备混合推理能力,能够快速准确解答复杂问题,支持编程生成代码,展现出强大的逻辑性与创造力。

我在通义 APP 体验了全球最强开源模型 Qwen 3,它改变了我对国产 AI 的期待

爱范儿
爱范儿 · 2025-04-29T05:05:09Z
Qwen3来了,全尺寸开源,性能拉满!附最新一手实测!

阿里发布了开源模型Qwen3,具备混合推理能力,支持119种语言,训练数据量达到36万亿token。旗舰模型Qwen3-235B-A22B在核心测试中表现优异,开源六款Dense和两款MoE模型,适合不同设备部署。Qwen3通过动态切换机制和多模态协作协议,推动AI模型从生成答案向完成任务转变。

Qwen3来了,全尺寸开源,性能拉满!附最新一手实测!

我爱自然语言处理
我爱自然语言处理 · 2025-04-29T01:19:47Z
Anthropic 的 Claude 3.7 Sonnet 混合推理模型现已在 Amazon Bedrock 上线

Amazon Bedrock上线了Anthropic的Claude 3.7 Sonnet模型,具备混合推理能力,支持标准和深度思考模式,特别在编码和复杂问题解决方面表现优异,最大支持128K令牌,帮助企业提升客户互动和工作效率。

Anthropic 的 Claude 3.7 Sonnet 混合推理模型现已在 Amazon Bedrock 上线

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2025-02-25T10:07:30Z
Anthropic首款混合推理模型在Amazon Bedrock上线

亚马逊云科技推出Anthropic的Claude 3.7 Sonnet模型,支持在标准与深度思维模式间切换,生成最长128K token的响应,适合复杂代码生成与内容创作,用户可控制推理预算,实现速度与成本的平衡。

Anthropic首款混合推理模型在Amazon Bedrock上线

全球TMT-美通国际
全球TMT-美通国际 · 2025-02-25T07:31:22Z

本研究提出Jakiro方法,通过专家组合生成多样化预测,解决模型容量有限导致的准确性不足问题。引入混合推理策略,结合自回归与并行解码,提高了预测的准确性和速度,推动了推测解码研究的进展。

Jakiro: Enhancing Inference Decoding through Expert Ensemble

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-10T00:00:00Z

本文介绍了一种名为Crayon的方法,用于在移动设备上定制大型语言模型。通过构建多样化的基础适配器并融合成定制化适配器,无需额外训练即可实现定制化。还开发了设备-服务器混合推理策略,提高复杂查询处理能力。新基准测试集验证了该方法的有效性。

动态设备上大型语言模型的自适应自监督学习策略

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-25T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码