小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
Cursor以十倍低的成本超越Opus,Meta的代理人失控,以及300页的特朗普美国AI法案

文章讨论了人工智能领域的最新动态,包括Cursor发布的新编码模型Composer 2、OpenAI的应用程序合并,以及国会提出的特朗普美国AI法案。各大公司通过战略整合增强竞争力,AI工具成本迅速下降,但安全性和代码质量问题日益突出。法案旨在统一AI监管,要求开发者报告因AI导致的裁员,标志着AI行业规则的逐步建立。

Cursor以十倍低的成本超越Opus,Meta的代理人失控,以及300页的特朗普美国AI法案

The New Stack
The New Stack · 2026-03-21T12:52:00Z
Cursor的Composer 2在编码基准测试中超越Opus 4.6,成本却低得多

Cursor公司发布了Composer 2,这是其第三代编码模型,性能超越Anthropic的Opus 4.6,成本更低。在Terminal-Bench 2.0基准测试中得分61.7%,尽管仍落后于OpenAI的GPT-5.4,但显示出Cursor迅速追赶的能力。Composer 2采用自我总结的训练技术,显著提高了长任务表现,减少了50%的压缩错误。

Cursor的Composer 2在编码基准测试中超越Opus 4.6,成本却低得多

The New Stack
The New Stack · 2026-03-19T15:39:18Z
Cursor的Composer 2在编码基准测试中超越Opus 4.6,成本却低得多

Cursor公司发布了Composer 2,这是其第三代编码模型,性能超越Anthropic的Opus 4.6,成本更低。在Terminal-Bench 2.0基准测试中得分61.7%,虽然仍落后于OpenAI的GPT-5.4(75.1%),但显示出快速追赶的潜力。Composer 2采用自我总结的训练技术,显著提高了长任务表现,减少了50%的压缩错误。

Cursor的Composer 2在编码基准测试中超越Opus 4.6,成本却低得多

The New Stack
The New Stack · 2026-03-19T15:39:18Z
OpenAI的GPT-5.3-Codex自我构建

OpenAI推出的GPT-5.3-Codex模型是其最强大的编码模型,具备编码和推理能力,速度提升25%。该模型能够构建复杂的游戏和应用,理解用户意图,并处理网络安全任务。尽管在编码基准测试中表现优异,OpenAI强调其在实际应用中的进步,标志着向通用智能体的迈进。

OpenAI的GPT-5.3-Codex自我构建

The New Stack
The New Stack · 2026-02-05T18:58:56Z
介绍GPT-5.3-Codex

GPT-5.3-Codex是最新的编码模型,性能提升25%,支持复杂任务和实时交互,表现优异,能够生成高质量代码和网页,覆盖软件开发全生命周期,并增强网络安全能力以防止滥用。

介绍GPT-5.3-Codex

OpenAI
OpenAI · 2026-02-05T00:00:00Z
GPT-5.3-Codex系统卡

GPT-5.3-Codex是最新的编码模型,结合了GPT-5.2的编码性能和推理能力,能够处理复杂任务。该模型在生物学和网络安全领域表现出色,并已采取相应的安全措施。尽管尚无确凿证据证明其达到高能力阈值,但出于谨慎考虑,已启动保护措施。

GPT-5.3-Codex系统卡

OpenAI
OpenAI · 2026-02-05T00:00:00Z

英国警方因调查“非法动漫艺术作品”引发言论自由担忧。文章指出本地编码模型在成本和隐私上有优势,但无法完全替代云端服务。同时,传统日志在分布式系统中失效,需改进为结构化日志。微软被指强制推销Windows 11,剥夺用户选择。此外,文章探讨职业生涯设计的重要性,强调寻找生命意义以重建动力。Flock AI摄像头存在隐私风险,迪士尼发布新机器人奥拉夫。

2025 12 23 HackerNews

介绍 on SuperTechFans
介绍 on SuperTechFans · 2025-12-23T00:26:43Z
介绍GPT-5.2-Codex

GPT-5.2-Codex是最新的编码模型,优化了复杂软件工程,尤其在网络安全方面表现更佳。它在长时间任务、代码重构和迁移中表现突出,并更好地适应Windows环境。尽管网络能力尚未达到“高”水平,但其增强的安全功能和逐步部署策略旨在平衡可访问性与安全性。

介绍GPT-5.2-Codex

OpenAI
OpenAI · 2025-12-18T00:00:00Z
介绍GPT-5.2-Codex

今天发布的GPT-5.2-Codex是最先进的编码模型,优化了复杂软件工程能力,尤其在网络安全方面表现突出。它在长时间任务、代码重构和迁移中更为强大,特别适用于Windows环境。尽管网络能力尚未达到“高”水平,但未来的能力增长将被纳入部署考虑,以确保安全性与可及性并重。

介绍GPT-5.2-Codex

OpenAI
OpenAI · 2025-12-18T00:00:00Z
GPT-5.2系统卡的附录:GPT-5.2-Codex

GPT-5.2-Codex是最新的编码模型,优化了复杂软件工程,提升了长时间任务和Windows环境的性能,并增强了网络安全能力。该模型实施了全面的安全措施,针对有害任务进行训练和网络访问配置。尽管在网络安全领域表现良好,但能力尚未达到顶尖水平。

GPT-5.2系统卡的附录:GPT-5.2-Codex

OpenAI
OpenAI · 2025-12-18T00:00:00Z
使用GPT-5.1-Codex-Max构建更多

GPT-5.1-Codex-Max是新一代编码模型,具备更快、更智能和更高的令牌效率,适合长时间复杂任务,尤其在代码审查和开发中表现优异,提升开发者生产力,预计带来实际节省。

使用GPT-5.1-Codex-Max构建更多

OpenAI
OpenAI · 2025-11-19T00:00:00Z
GPT-5.1-Codex-Max系统卡

GPT-5.1-Codex-Max是新一代编码模型,专注于多任务处理,经过安全性培训,具备一定的网络安全能力,但尚未达到高水平。

GPT-5.1-Codex-Max系统卡

OpenAI
OpenAI · 2025-11-19T00:00:00Z
Claude Sonnet 4.5 在SWE-Bench验证中表现出色,编码专注时间延长至30小时以上

Anthropic发布了Claude Sonnet 4.5,这是其最新的编码模型,显著提升了代理任务和计算机使用能力。该模型在安全性和训练方法上有显著改进,减少了谄媚和欺骗倾向,安全评分达到98.7%。用户反馈表明编码工作流显著提升,建议所有用户升级。

Claude Sonnet 4.5 在SWE-Bench验证中表现出色,编码专注时间延长至30小时以上

InfoQ
InfoQ · 2025-10-11T20:00:00Z
Anthropic推出Claude Sonnet 4.5

Anthropic推出Claude Sonnet 4.5,称其为“世界最佳编码模型”。新版本在指令执行和代码重构方面更可靠,得分显著提高。同时,Claude Code也更新,增加了VS Code扩展和实时修改功能。新实验“Imagine with Claude”展示了实时生成软件的能力,目前仅限Claude Max用户使用。

Anthropic推出Claude Sonnet 4.5

The New Stack
The New Stack · 2025-09-29T17:00:15Z
您可以自行运行的最佳本地编码大型语言模型

本文探讨了适合本地工作流程的编码大型语言模型(LLMs),如GLM-4、DeepSeekCoder V2和Qwen3-Coder。这些模型通过增强数据隐私和降低API成本,成为开发者的个人编码助手,支持代码生成、调试和推理等功能,帮助提高工作效率。

您可以自行运行的最佳本地编码大型语言模型

KDnuggets
KDnuggets · 2025-09-17T12:24:34Z
xAI推出编码模型Grok Code Fast 1帮助开发者辅助编写代码 每百万输出仅1.5美元

埃隆·马斯克的 xAI 推出了编码模型 Grok Code Fast 1,旨在帮助开发者编写和检查代码。该模型支持多种编程语言,价格具有竞争力,目前通过多个平台限时免费提供。Grok Code Fast 1 在基准测试中准确率达到 70.8%,未来将推出新版本。

xAI推出编码模型Grok Code Fast 1帮助开发者辅助编写代码 每百万输出仅1.5美元

蓝点网
蓝点网 · 2025-08-30T03:54:12Z
Anthropic发布全球最强编码模型Claude 4,可7小时连续编码,网友:离失业又近一步

Anthropic发布了Claude Opus 4和Claude Sonnet 4,称其为最佳编码模型,具备卓越的编码和推理能力,支持复杂任务、扩展思考和工具使用,提升自主性和记忆能力。同时,Claude Code编程助手也已开放,集成新模型,支持多种开发环境。

Anthropic发布全球最强编码模型Claude 4,可7小时连续编码,网友:离失业又近一步

TechWeb 全站精华
TechWeb 全站精华 · 2025-05-23T03:50:31Z
Anthropic的Claude 4 AI模型在编码和推理方面表现更佳

Anthropic推出了Claude Opus 4和Claude Sonnet 4两款新AI模型。Claude Opus 4是最强大的编码模型,能持续数小时工作,表现优于竞争对手;Sonnet 4则更经济,适合一般任务。两者具备更高的准确性和长效存储能力,并引入了“思维摘要”和“扩展思维”功能。

Anthropic的Claude 4 AI模型在编码和推理方面表现更佳

The Verge
The Verge · 2025-05-22T16:45:00Z
Claude 3.7 Sonnet与Grok 3和o3-mini-high的编码比较

技术界推出新AI模型,Claude 3.7 Sonnet被认为是最佳编码模型,其代码质量优于Grok 3和o3-mini-high,准确性和成本表现出色,适合高质量代码生成。

Claude 3.7 Sonnet与Grok 3和o3-mini-high的编码比较

DEV Community
DEV Community · 2025-02-27T15:22:32Z

本研究通过自动化生成测试用例,提升了编码模型中强化学习的应用。我们设计了生成(问题,测试用例)对的流程,并利用这些测试用例培训奖励模型,显著提高了编码模型的表现,展示了强化学习在该领域的潜力。

ACECODER: Enhancing Encoder Reinforcement Learning Performance through Automated Test Case Synthesis

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-03T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码