小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

英伟达机器人主管Jim Fan表示,机器人领域仍处于初级阶段,硬件进步快于软件,缺乏统一评测标准。尽管VLA模型受到关注,但与物理操作不一致,未来需整合物理世界模型。同时,数据和硬件的可靠性也至关重要,行业需提升评测标准和数据利用效率。

具身智能机器人年度总结,来自英伟达机器人主管

量子位
量子位 · 2026-01-05T05:08:26Z
美团 LongCat 发布 AMO-Bench:突破 AIME 评测饱和困境,重新定义 LLM 数学上限

美团LongCat团队推出AMO-Bench,包含50道高难度原创数学推理题,旨在提升大模型的推理能力。目前顶尖模型在该评测中的表现仍未及格,显示出其在复杂推理任务上的局限性。AMO-Bench为行业提供了新的评测标准,未来将持续更新。

美团 LongCat 发布 AMO-Bench:突破 AIME 评测饱和困境,重新定义 LLM 数学上限

美团技术团队
美团技术团队 · 2025-11-27T00:00:00Z

上海交通大学洪亮教授团队推出了VenusMutHub,这是首个针对真实应用场景的蛋白质突变小样本数据集,并提出了评测标准。该研究克服了现有高通量数据集的局限性,为蛋白质工程提供实用指导,推动了蛋白质功能预测的发展。

蛋白质突变工程 AI 模型评测新基准,上海交大洪亮教授团队发布 VenusMutHub

HyperAI超神经
HyperAI超神经 · 2025-03-18T09:12:33Z
哈佛、英特尔等60+顶尖机构联手打造:NeuroBench定义神经形态计算评测新范式

在人工智能快速发展的背景下,神经形态计算面临评测标准缺乏的问题。哈佛大学等机构提出了NeuroBench框架,通过算法与系统的双轨评测,为该领域提供统一的评估标准,促进技术创新与比较,推动神经形态计算的健康发展。

哈佛、英特尔等60+顶尖机构联手打造:NeuroBench定义神经形态计算评测新范式

机器之心
机器之心 · 2025-02-17T07:01:28Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码