小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
18家具身顶尖势力集结,RoboChallenge 打造全球最大具身模型竞技场

RoboChallenge完成第二批生态扩容,吸引8家顶尖企业入驻,推动具身智能产业发展。平台通过标准化真机测试提升评测体系,促进技术落地。新伙伴将提供硬件支持,构建公允评测体系,助力具身智能在家庭和商业场景的应用。RoboChallenge致力于降低验证门槛,推动技术进步,欢迎更多参与者加入。

18家具身顶尖势力集结,RoboChallenge 打造全球最大具身模型竞技场

量子位
量子位 · 2026-04-17T05:52:13Z
谷歌可能很快就会推出Gemini 3.1 Pro模型 相关竞技场已经出现该模型的引用

谷歌即将推出Gemini 3.1系列模型,目前已有Gemini 3.1 Pro Preview的引用,但具体发布时间和特性尚未确定。智谱已开源GLM-5,谷歌的Gemini 3.1可能会有类似版本,具体情况需等待官方发布。

谷歌可能很快就会推出Gemini 3.1 Pro模型 相关竞技场已经出现该模型的引用

蓝点网
蓝点网 · 2026-02-12T03:47:30Z
红包大战,不适合AI的“竞技场”

2015年,微信红包大战激活了移动支付。如今,腾讯和百度再次推出春节红包活动以吸引用户,但效果减弱,用户留存率低。尽管春节流量高峰,吸引用户的关键在于信任和核心场景,而非单纯的红包刺激。

红包大战,不适合AI的“竞技场”

TechWeb 全站精华
TechWeb 全站精华 · 2026-02-03T02:58:52Z

谷歌DeepMind与Kaggle合作推出Game Arena,旨在测试AI在棋类、狼人和扑克等游戏中的推理与社交能力。该基准评估AI在不确定环境中的表现,促进AI助手的软技能发展。

通过游戏竞技场推动人工智能基准测试

The Keyword
The Keyword · 2026-02-02T17:00:00Z
当AI裁判,赢爆款好礼!星河Arena大模型竞技场开放!

PaddleFormers将降低多模态模型的训练和应用门槛,帮助开发者提升业务能力,推动多模态模型在更多场景中的应用。

当AI裁判,赢爆款好礼!星河Arena大模型竞技场开放!

百度大脑
百度大脑 · 2025-11-21T10:06:34Z

马斯克发布的Grok 4.1在大模型竞技场中表现优异,思考模式和非思考模式分别排名第一和第二。该模型在情感、创造性和互动性方面显著提升,强化学习算法得到改进,减少了信息检索中的事实性幻觉。Grok 4.1现已向所有用户开放。

马斯克悄然发布Grok 4.1,霸榜大模型竞技场所有排行榜

量子位
量子位 · 2025-11-18T07:01:25Z
开发者生产力AI竞技场的推出:一个用于基准测试AI编码代理的开放平台

JetBrains推出开发者生产力AI竞技场(DPAI Arena),旨在评估AI辅助工具对软件开发的影响。该平台提供开放的基准测试框架,支持多语言和多工作流,促进透明度和信任,帮助开发者和企业衡量AI工具的生产力提升。

开发者生产力AI竞技场的推出:一个用于基准测试AI编码代理的开放平台

The JetBrains Blog
The JetBrains Blog · 2025-10-28T21:14:20Z
推出开发者生产力AI竞技场:一个开放的AI编码代理基准测试平台

DPAI Arena是一个开放的基准测试平台,旨在评估AI辅助开发工具的生产力,支持多语言和多工作流,解决现有基准的局限性,促进社区合作,推动AI在软件开发中的应用。

推出开发者生产力AI竞技场:一个开放的AI编码代理基准测试平台

The JetBrains Blog
The JetBrains Blog · 2025-10-28T21:01:28Z
Kaggle推出游戏竞技场以基准测试AI模型在策略游戏中的表现

Kaggle与Google DeepMind合作推出Kaggle Game Arena,旨在评估AI模型在策略游戏中的表现。该平台提供公平的全对全比赛环境,确保结果的可靠性。初期包括八个领先的AI模型,未来将扩展到多种游戏,以测试战略推理能力,为AI评估设定新标准。

Kaggle推出游戏竞技场以基准测试AI模型在策略游戏中的表现

InfoQ
InfoQ · 2025-09-16T11:18:00Z

上海AI实验室推出OpenDataArena平台,旨在科学评估数据价值,涵盖多个领域和基准测试。该平台提供公平透明的数据评测,帮助研究者识别高质量数据,降低试错成本,促进数据生成与应用。

告别“炼丹玄学”:上海AI实验室推出首个大模型数据竞技场OpenDataArena

量子位
量子位 · 2025-08-24T06:31:18Z

机器之心数据服务现已上线,提供高效稳定的数据获取,简化数据爬取流程。

赛奖综述|Hi! WAIC带你领略全球 AI 竞技场:WAIC 赛奖矩阵的人才孵化全景

机器之心
机器之心 · 2025-07-21T03:39:21Z

DeepSeek-R2模型引发猜测,神秘模型steve自称来自DeepSeek,但身份不明,智力测试表现一般,可能不是R2。R2因CEO不满表现再次延期,研发进展缓慢。

DeepSeek-R2!?神秘模型惊现竞技场,真实身份引网友猜测

量子位
量子位 · 2025-07-03T06:56:50Z

谷歌发布的Gemini 2.5 Pro在“人类最后的考试”中以21.6%的成绩超越o3,成为大模型竞技场第一名。尽管表现优异,但发布后两小时内即被越狱,安全性引发关注。

Gemini新版蝉联竞技场榜一,但刚发布就被越狱了

量子位
量子位 · 2025-06-06T04:11:12Z
战斗坦克竞技场:一款竞技坦克战斗游戏

《战斗坦克竞技场》是一款双人坦克战斗游戏,使用Python和Pygame开发。玩家可以选择不同类型的坦克,利用多种武器在可破坏的环境中进行战斗,游戏特点包括多样的坦克、武器、可破坏环境和增益道具,玩家通过键盘控制坦克的移动和射击。

战斗坦克竞技场:一款竞技坦克战斗游戏

DEV Community
DEV Community · 2025-05-25T07:45:12Z

腾讯挖走微软的WizardLM团队,核心成员来自北大,推出的新模型Hunyuan-Turbos已进入大模型前十。该团队曾因开源问题受挫,现加入腾讯后发展迅速。国内大厂人才竞争激烈,未来竞争将更加激烈。

腾讯混元挖走微软明星大模型团队!一作全员出走,新成果已跻身大模型竞技场TOP 10

量子位
量子位 · 2025-05-14T09:29:53Z

了解Blur Studio如何从零开始为Amazon Prime剧集《秘密关卡》中的“虚幻竞技场”一集创建实时动画管线,并利用MetaHumans和特效生成电影质量的视觉体验。

<p>与Blur Studio一同探秘《秘密关卡》中的“虚幻竞技场”一集</p>

Unreal Engine
Unreal Engine · 2025-05-08T00:00:00Z

本研究提出了一种新颖的稳定竞技场框架am-ELO,旨在解决ELO评分系统在大语言模型评估中的不稳定性问题。实验结果表明,该评估方法更准确且稳定。

am-ELO: 基于竞技场的 LLM 评估稳定框架

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-06T00:00:00Z

论文《排行榜幻觉》揭示了大模型竞技场的可信度问题,指出少数大厂通过私下测试和选择性报告数据,导致排行榜不公。研究显示,专有模型的数据远超开源模型,且有205个模型被静默弃用。官方回应称排行榜反映真实用户偏好,但质疑仍在。AI社区需警惕,不能仅依赖单一榜单。

大模型竞技场再被锤!Llama4私下测试27个版本,只取最佳成绩

量子位
量子位 · 2025-05-02T05:25:59Z
Cody的云竞技场

Cody's Cloud Arena是一款未来主义机器人构建游戏,玩家可以使用阿里云服务的部件构建自定义机器人,与AI对手战斗,并通过实时排行榜进行全球竞争。游戏利用阿里云技术,确保高效的资产托管和自动化部署,提供99.9%的正常运行时间和40%的加载速度提升。未来计划包括多人对战和机器学习对手。

Cody的云竞技场

DEV Community
DEV Community · 2025-04-26T21:15:10Z
NoSQL战士竞技场:数据巨头之战

在NoSQL领域,各种数据库如MongoDB、Cassandra、Redis等各具特色。MongoDB灵活,Cassandra适合高写入量,Redis提供快速缓存,Neo4j擅长关系导航,Couchbase支持移动同步,DynamoDB具备自动扩展,Elasticsearch专注全文搜索,HBase处理大规模数据。选择合适的数据库需根据具体需求。

NoSQL战士竞技场:数据巨头之战

DEV Community
DEV Community · 2025-04-24T22:38:38Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码