小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
Mistral AI 发布 Mistral Small 4:一款拥有 1190 亿参数的 MoE 模型

Mistral AI 发布了 Mistral Small 4,具备指令执行、推理和多模态理解功能,支持256k上下文窗口,具有可配置推理强度,提升了推理效率和经济性,适合通用聊天和复杂推理。

Mistral AI 发布 Mistral Small 4:一款拥有 1190 亿参数的 MoE 模型

实时互动网
实时互动网 · 2026-03-17T02:21:52Z
Anthropic推出Claude Sonnet 4.5

Anthropic推出Claude Sonnet 4.5,称其为“世界最佳编码模型”。新版本在指令执行和代码重构方面更可靠,得分显著提高。同时,Claude Code也更新,增加了VS Code扩展和实时修改功能。新实验“Imagine with Claude”展示了实时生成软件的能力,目前仅限Claude Max用户使用。

Anthropic推出Claude Sonnet 4.5

The New Stack
The New Stack · 2025-09-29T17:00:15Z
OpenAI的旗舰模型GPT-4.1现已在ChatGPT中上线

OpenAI推出了GPT-4.1和GPT-4.1 mini模型,现已在ChatGPT中可用。所有付费用户均可访问,免费用户暂时无法使用。新模型在编码任务和指令执行方面表现更佳,支持更大的上下文窗口,速度也有所提升。GPT-4.1 mini成为所有用户的默认选项。

OpenAI的旗舰模型GPT-4.1现已在ChatGPT中上线

The Verge
The Verge · 2025-05-15T11:47:25Z
GPT-4.1与Claude 3.7 Sonnet及Gemini 2.5 Pro的比较

OpenAI推出了GPT-4.1系列模型,包括标准版、迷你版和纳米版,支持高达100万个上下文标记,提升了长文本理解能力。与Claude 3.7 Sonnet和Gemini 2.5 Pro相比,GPT-4.1在编码和指令执行方面表现优异,但在某些任务上仍需改进。

GPT-4.1与Claude 3.7 Sonnet及Gemini 2.5 Pro的比较

DEV Community
DEV Community · 2025-04-15T14:41:02Z

本研究提出了MultiChallenge基准,旨在评估大型语言模型在多轮对话中的能力。该基准识别了四类挑战,要求模型在执行指令和上下文推理方面表现出色。目前,尽管现有模型在其他评估中得分较高,但在MultiChallenge上的准确率均低于50%。

MultiChallenge: A Realistic Multi-Turn Conversation Evaluation Benchmark Challenging Frontier Large Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-29T00:00:00Z
AMD Zen 5 微架构评测

AMD Zen 5 微架构评测显示其性能显著提升,采用宏操作与微操作分解,优化指令执行。Op Cache 的动态测试表明其对性能影响显著,解码宽度限制和指令融合技术提升了 IPC,L1 和 L2 缓存容量测试验证了设计有效性。整体而言,Zen 5 在多线程和浮点性能上表现优异。

AMD Zen 5 微架构评测

杰哥的小笔记
杰哥的小笔记 · 2024-11-11T00:00:00Z

本研究提出了Multi-IF基准,解决现有基准无法全面反映多轮多语种交互复杂性的问题。通过结合大型语言模型和人类注释,评估模型在多轮多语种指令执行中的能力。研究发现,最新的语言模型在多轮指令执行中失败率增加,尤其在非拉丁文字语言中,显示出多语种能力的局限性。

Multi-IF:多轮和多语种指令遵循的LLMs基准评估

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-21T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码