小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
《GPT 图解》笔记:Transformer

这篇文章介绍了Transformer模型的结构和关键概念。Transformer通过注意力机制替代RNN,解决了序列建模中的上下文依赖问题。引入位置编码使模型能够感知token的位置信息,注意力机制包括自注意力和交叉注意力。编码器和解码器结构相似,但解码器使用因果掩码以确保生成序列的自回归特性。整体上,Transformer实现了高效的并行计算和长距离依赖处理。

《GPT 图解》笔记:Transformer

Ying’s Blog
Ying’s Blog · 2026-06-07T07:18:45Z
开始在 Amazon Bedrock 上使用 OpenAI GPT-5.5、GPT-5.4 模型和 Codex

OpenAI的GPT-5.5和GPT-5.4模型以及Codex已在Amazon Bedrock平台上线。这些模型专注于代码编写和复杂工作流程,支持开发者通过Responses API调用。Codex每周有超过400万开发者使用,优化了开发流程。用户按token付费,无需购买席位许可,模型在美国东部和西部区域可用,用户可通过OpenAI SDK或curl访问。

开始在 Amazon Bedrock 上使用 OpenAI GPT-5.5、GPT-5.4 模型和 Codex

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2026-06-05T04:07:41Z
一个GPT Plus会员的钱,够机器人跑一个月世界模型了

智在无界推出的Being-H-Flash隐式世界模型,月算力成本仅150元,能够在百TOPS级芯片上实现实时运行。该模型通过潜空间推理,降低了计算开销,提升了机器人在动态环境中的预测能力,推动了机器人在生产线上的高效运作和商业化进程。

一个GPT Plus会员的钱,够机器人跑一个月世界模型了

量子位
量子位 · 2026-06-04T03:10:23Z
为GPT-Rosalind引入新功能

GPT-Rosalind系列模型更新,专为生命科学研究设计,提升了药物发现智能和工具使用能力。该模型在生物学、药物化学和基因组学等领域表现出显著提升,通过LifeSciBench基准测试在科学证据处理、分析和优化等任务中表现优异。现已向全球合格组织开放,旨在加速科学发现和药物研发。

为GPT-Rosalind引入新功能

OpenAI
OpenAI · 2026-06-03T13:15:00Z

亚马逊云科技宣布,GPT-5.5、GPT-5.4和Codex已在Amazon Bedrock上线,企业可直接调用这些大模型以支持复杂任务,计费标准与OpenAI一致,无额外费用。Codex可通过多种IDE插件使用,推理计算符合数据合规要求。亚马逊将持续扩展OpenAI的能力。

GPT-5.5、GPT-5.4和Codex已在Amazon Bedrock上正式可用

全球TMT-美通国际
全球TMT-美通国际 · 2026-06-02T06:07:22Z
GPT Realtime 2.0实时语音模型17个创业方向

GPT Realtime 2.0模型实现了边听边思考的实时智能应用,提供了17个创业机会,如实时合同谈判助手、语音控制交易终端和多语种活动主持人。这些应用通过高效的数据处理和实时反馈,提升了工作效率,适合创业者和产品经理使用。

GPT Realtime 2.0实时语音模型17个创业方向

极道
极道 · 2026-06-02T03:35:00Z

DeepSWE测试显示,GPT-5.5在编程能力上超越Claude Opus 4.8,表现出更高的效率和可靠性。新考试更真实,反映了AI在实际工作中的能力,用户普遍认为GPT-5.5更实用。

DeepSWE结果发布:GPT-5.5把Claude Opus 4.8比下去了

极道
极道 · 2026-06-01T02:38:00Z

OpenAI 宣布将逐步弃用使用率低的 o3 和 GPT-4.5 模型,o3 将在 90 天后弃用,GPT-4.5 在 30 天后弃用。新推出的 GPT-5.5 Instant 模型将提供更易读的输出和改善的对话节奏。旧版模型的 Canvas 功能将不再支持,付费用户可在有限时间内继续使用。API 端将继续支持这些模型。

o3和GPT-4.5模型将被陆续从ChatGPT中删除 不过API端继续提供调用

蓝点网
蓝点网 · 2026-05-31T07:07:13Z
为什么GPT-5.4、Claude和Gemini在基本的现实世界事实上无法达成一致

近期研究显示,五种大型语言模型在处理真实世界声明时,67%的情况下存在意见分歧,尤其在判断“真实”与“虚假”时表现不一致。研究强调开发团队需谨慎验证AI生成内容,以避免法律和声誉风险。

为什么GPT-5.4、Claude和Gemini在基本的现实世界事实上无法达成一致

The New Stack
The New Stack · 2026-05-30T13:11:27Z
《GPT 图解》笔记:QKV、多头注意力及掩码

本文探讨了注意力机制中的QKV、多头注意力和掩码。QKV分别代表查询、键和值,通过矩阵变换提取特征。多头注意力将输入分为多个子空间,从不同角度学习特征。掩码用于将不重要的信息权重设为接近“0”,以优化注意力计算。

《GPT 图解》笔记:QKV、多头注意力及掩码

Ying’s Blog
Ying’s Blog · 2026-05-30T01:09:06Z
7B打败o3、GPT-5!医学AI智能体让模型学会“看哪里、怎么看”

医学AI正在经历重要转型,Ophiuchus和MedScope提出了“以图像/视频思考”的新范式。模型不再被动接收视觉信息,而是主动调用视觉工具,实时修正推理过程。Ophiuchus专注于图像,MedScope处理长视频,强调证据驱动的推理,提升医学AI的可解释性和准确性。这一转变使模型能够在临床推理中主动寻找和验证视觉证据,推动医学AI向更高水平发展。

7B打败o3、GPT-5!医学AI智能体让模型学会“看哪里、怎么看”

量子位
量子位 · 2026-05-28T08:01:57Z

OpenAI 将于6月2日起下线 GPT-5.2 和 GPT-5.3-Codex 模型,因 GPT-5.5 存在降智问题,开发者可选择 GPT-5.4。付费用户可继续使用 GPT-5.4 和 GPT-5.5,而免费用户默认使用 GPT-5.5,无法切换。特殊模型如 GPT-5.3-Codex-Spark 仍可使用。

Codex将从6月2日起下线GPT-5.2/5.3-Codex模型 但GPT-5.5降智问题仍未解决

蓝点网
蓝点网 · 2026-05-28T03:12:51Z
人工智能论文评审:GPT-4技术报告(GPT-4)

GPT-4标志着大型语言模型从实验研究转向实际应用,具备多模态能力,能够同时处理文本和图像,提升推理和安全性。报告强调用户意图对齐和安全性的重要性,展示了GPT-4在多项学术和专业考试中的优异表现,显示其在实际应用中的潜力。

人工智能论文评审:GPT-4技术报告(GPT-4)

freeCodeCamp.org
freeCodeCamp.org · 2026-05-27T21:42:20Z
Warp在GPT-5.5下对开源构建的重大投资

Warp是一款现代终端,因其速度和协作功能受到开发者喜爱。它推出了开放代理开发模式,允许人类设定目标,代理负责编码和测试。引入GPT-5.5后,代理的效率显著提高,Warp开发团队中约90%的拉取请求由代理共同创建。Warp旨在通过代理协作提升软件开发的效率和一致性,并将继续与社区合作,推动代理开发的演进。

Warp在GPT-5.5下对开源构建的重大投资

OpenAI
OpenAI · 2026-05-27T00:00:00Z
《GPT 图解》笔记:Seq2Seq及点积注意力

本文介绍了Seq2Seq模型及其点积注意力机制。Seq2Seq用于机器翻译,通过编码器将输入序列转换为上下文表示,解码器生成输出序列。点积注意力计算输入矩阵的相似度,帮助解码器关注输入序列中的重要部分,从而提高上下文捕捉能力,增强翻译效果。

《GPT 图解》笔记:Seq2Seq及点积注意力

Ying’s Blog
Ying’s Blog · 2026-05-24T11:10:44Z
谷歌现在允许开发者在Android Studio中使用GPT和Claude

谷歌在年度I/O开发者大会上推出了多款以AI为中心的工具,帮助开发者构建Android应用。新功能包括在AI Studio原型环境中构建本地应用,以及Android Studio的更新。开发者可以选择使用Gemini、OpenAI的GPT或Anthropic的Claude进行开发。此外,谷歌还推出了Android CLI 1.0版本,提升AI代理的Android开发能力。

谷歌现在允许开发者在Android Studio中使用GPT和Claude

The New Stack
The New Stack · 2026-05-19T17:45:00Z
人工智能论文评审:语言模型是少量学习者(GPT-3)

GPT-3的论文展示了大型语言模型如何通过上下文学习新任务,而无需特定的微调。它能够通过示例直接从提示中学习,标志着AI系统交互方式的重大转变。这种“少量学习”方法使模型能够根据指令和示例动态适应,推动了现代AI研究的发展。尽管GPT-3在许多任务上表现出色,但在逻辑推理和一致性方面仍存在局限性。

人工智能论文评审:语言模型是少量学习者(GPT-3)

freeCodeCamp.org
freeCodeCamp.org · 2026-05-18T20:29:20Z
词元token中转站如何把GPT与Claude算力压缩到3%成本?

本文探讨了中转站如何通过拆解高价AI模型的访问权限,提供低成本算力服务。中转站利用闲置资源重构API调用方式,降低开发者成本,但也带来数据隐私和安全风险。随着市场演变,中转站逐渐向平台化服务发展,面临不确定性。

词元token中转站如何把GPT与Claude算力压缩到3%成本?

极道
极道 · 2026-05-17T02:22:00Z
Opus 4.7与GPT 5.5开发者对比:别选边站队,有钱就两个都用

Opus 4.7适合计划与创意,而GPT 5.5在执行与代码修复上更强。结合使用可以提高效率,Claude在复杂推理上表现更好,GPT在处理无结构代码时更有效。根据任务类型灵活切换工具,能更好地完成工作。两者互补,最佳策略是同时使用。

Opus 4.7与GPT 5.5开发者对比:别选边站队,有钱就两个都用

极道
极道 · 2026-05-16T22:24:00Z
8×8 AI Studio 新增 OpenAI 的 GPT Realtime 2,以支持生产环境中的语音代理

8×8公司宣布其AI Studio支持OpenAI的GPT Realtime 2,提升实时语音客服的可靠性和对话转录准确性。新模式增强推理能力,优化多步骤请求处理,确保客户交互记录清晰可用。现有代理自动适应新功能,提升客户体验并保护数据安全。

8×8 AI Studio 新增 OpenAI 的 GPT Realtime 2,以支持生产环境中的语音代理

实时互动网
实时互动网 · 2026-05-15T03:22:09Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码