小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究探讨大型语言模型在特定领域本体生成中的应用,评估DeepSeek和o1-preview模型的表现,发现它们在本体构建方面具有良好的泛化能力,为自动推理和知识表示技术的改进提供了基础。

Evaluating the Capabilities of Large Language Models in Domain-Specific Ontology Generation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-24T00:00:00Z
研究表明,人工智能在医疗诊断中与医生相匹配,但在紧急决策方面仍显不足

研究表明,OpenAI的o1-preview模型在医疗诊断任务中优于人类医生,但在紧急决策方面仍存在不足。模型在诊断和推理上有所提升,但概率评估需进一步加强,强调了改进临床测试方法的必要性。

研究表明,人工智能在医疗诊断中与医生相匹配,但在紧急决策方面仍显不足

DEV Community
DEV Community · 2024-12-18T07:33:40Z

李飞飞和吴佳俊团队推出了具身智能决策能力的评估基准EAI,全面评估了18款主流模型。测试结果显示,o1-preview在BEHAVIOR和VirtualHome环境中均获第一,促进了对大模型优缺点的深入理解。

李飞飞吴佳俊团队推出具身智能决策能力评价基准,o1-preview登顶

量子位
量子位 · 2024-11-14T09:31:46Z
280页PDF,全方位评估OpenAI o1,Leetcode刷题准确率竟这么高

OpenAI 的 o1-preview 模型在多个领域表现出色,尤其在复杂推理任务如编程、放射学报告生成和数学推理等方面。尽管偶尔在简单问题上出错,但在通用人工智能发展中取得了显著进展。未来发展重点包括多模态集成和伦理考虑。

280页PDF,全方位评估OpenAI o1,Leetcode刷题准确率竟这么高

机器之心
机器之心 · 2024-10-01T06:23:00Z

亚利桑那州立大学的研究表明,o1-preview在复杂规划任务中表现优于o1-mini,尤其在Blockworlds任务中准确率达到98%,而mini仅为56.6%。尽管o1-preview在规划能力上表现出色,但在识别不可解问题和处理长任务时仍有不足,且成本较高,需权衡性能与成本。

o1规划能力首测!已超越语言模型范畴,preview终于赢mini一回

量子位
量子位 · 2024-09-28T05:40:16Z
Sam Altman:新发布的推理模型 o1 preview 相当于 GPT-2 时刻,但是升级曲线会很陡峭,意味着很快就会达到它的 GPT-4 时刻 [译]

OpenAI首席执行官Sam Altman在2024年T-Mobile资本市场日上介绍了新推理模型o1 preview,称其相当于GPT-2的阶段,未来将迅速升级至GPT-4水平。该模型具备快速解决复杂问题的能力,预计将在医疗、教育和科学研究等领域带来重大贡献。Altman强调OpenAI将专注于深度学习,推动通用人工智能的发展,并确保用户数据安全。

Sam Altman:新发布的推理模型 o1 preview 相当于 GPT-2 时刻,但是升级曲线会很陡峭,意味着很快就会达到它的 GPT-4 时刻 [译]

宝玉的分享
宝玉的分享 · 2024-09-19T22:04:00Z
在GitHub Copilot和Models中试用OpenAI o1

OpenAI在Azure上提供了o1-preview和o1-mini的AI模型预览。这些模型具有先进的推理能力,可用于GitHub Copilot和Models。它们能更深入地理解代码约束并产生更高质量的结果。开发者可以选择在对话中使用o1-preview或o1-mini来替代当前默认模型GPT-4o,并在模型之间切换。这些模型还可以在GitHub Models的playground中进行测试。OpenAI很高兴将这些进展带给开发者,并鼓励他们注册以获取访问权限。

在GitHub Copilot和Models中试用OpenAI o1

The GitHub Blog
The GitHub Blog · 2024-09-19T19:44:59Z

OpenAI推出了一系列新的推理模型,名为o1-preview和o1-mini。然而,这些模型在Aider基准测试中表现不佳,仅略高于先前的模型。与GPT-4o和GPT-4o-mini相比,o1模型更慢且更昂贵。OpenAI在推理时利用增加的计算能力改进了完成度,但在解决语言模型的挑战方面仍然缺乏进展。该行业仍然严重依赖人工干预,人工智能和人类之间的任务分配存在不平衡。o1模型的改进可能是微小的,较慢的响应时间可能会影响互动性。在推理过程中增加计算能力的趋势可能是该行业的一个趋势。

OpenAI o1 发布让人联想到苹果发布会——这只是一次渐进式更新

DEV Community
DEV Community · 2024-09-13T18:08:49Z
入门指南:OpenAI o1推理模型

OpenAI发布了o1-preview和o1-mini推理模型,展示了类似于博士生的智能。这些模型可用于决策、编码和构建机器学习项目。o1-preview模型可以解决复杂的金融问题并提供逐步解释,而o1-mini模型擅长编码和数学。这两个模型在细节和解释方面优于GPT-4o。o1模型可以通过ChatGPT Pro和You.com访问。它们快速且提供复杂问题的详细解决方案。然而,它们目前处于测试阶段,无法执行代码。o1模型代表了人工智能解决方案的重大进展。

入门指南:OpenAI o1推理模型

KDnuggets
KDnuggets · 2024-09-13T16:35:25Z
介绍OpenAI o1

o1-preview的查询限制为每周50次,o1-mini的查询限制为每天50次。

介绍OpenAI o1

OpenAI
OpenAI · 2024-09-12T10:03:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码