小红花·文摘 - 小红花技术领袖俱乐部

新款Claude Haiku 4.5模型承诺以三分之一的成本提供更快的性能

新款Claude Haiku 4.5模型承诺以三分之一的成本提供更快的性能

InfoQ ·

Nous Research 发布 Hermes 4：具有混合推理能力的开放权重 AI 模型系列

Nous Research 发布 Hermes 4：具有混合推理能力的开放权重 AI 模型系列

实时互动网 ·

Claude 4现已在Polite AI上推出

Claude 4现已在Polite AI上推出

DEV Community ·

亚马逊云科技在Amazon Bedrock推出Anthropic最新一代模型

亚马逊云科技在Amazon Bedrock推出Anthropic最新一代模型

全球TMT-美通国际 ·

Qwen 3：阿里巴巴在开源AI领域的飞跃

Qwen 3：阿里巴巴在开源AI领域的飞跃

DEV Community ·

我在通义 APP 体验了全球最强开源模型 Qwen 3，它改变了我对国产 AI 的期待

我在通义 APP 体验了全球最强开源模型 Qwen 3，它改变了我对国产 AI 的期待

爱范儿 ·

Qwen3来了，全尺寸开源，性能拉满！附最新一手实测！

Qwen3来了，全尺寸开源，性能拉满！附最新一手实测！

我爱自然语言处理 ·

Anthropic 的 Claude 3.7 Sonnet 混合推理模型现已在 Amazon Bedrock 上线

Anthropic 的 Claude 3.7 Sonnet 混合推理模型现已在 Amazon Bedrock 上线

亚马逊AWS官方博客 ·

Anthropic首款混合推理模型在Amazon Bedrock上线

Anthropic首款混合推理模型在Amazon Bedrock上线

全球TMT-美通国际 ·

本研究提出Jakiro方法，通过专家组合生成多样化预测，解决模型容量有限导致的准确性不足问题。引入混合推理策略，结合自回归与并行解码，提高了预测的准确性和速度，推动了推测解码研究的进展。

Jakiro: Enhancing Inference Decoding through Expert Ensemble

BriefGPT - AI 论文速递 ·

本文提出了一种系统化的分类方法，分析了大型语言模型（LLMs）的技术及应用前景，强调提高模型效率的必要性，并介绍了多语言模型框架、工具增强和混合推理方法等创新，以推动LLMs的发展和应用。

PolyRouter：一个多大型语言模型查询系统

BriefGPT - AI 论文速递 ·