小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

文章回顾了自GPT-4发布以来AI技术的快速发展,从写作助手到Agent系统,AI已成为软件工程的重要基础设施。作者从学生转变为参与者,感受到AI对各行业的影响,并展望未来的硅基世界。

照见·硅·壹 你好世界

钟意博客
钟意博客 · 2026-03-14T06:00:00Z
快速构建高效网站:支持多种数据源 | 开源日报 No.841

hallucination-leaderboard 是评估大型语言模型生成摘要时幻觉表现的排行榜,提供幻觉率和事实一致性数据。react-agent 是一个开源工具,利用 GPT-4 生成 React 组件。Gatsby 是基于 React 的框架,支持多种数据源和渲染选项。AgentTuning 通过代理任务优化 LLM 指令,提供高质量数据集。

快速构建高效网站:支持多种数据源 | 开源日报 No.841

开源服务指南
开源服务指南 · 2026-01-05T07:35:22Z
十年

OpenAI在过去十年中取得了显著成就,成功推出了ChatGPT和GPT-4。未来十年,OpenAI将致力于确保AGI造福全人类,期待实现超智能。

十年

OpenAI
OpenAI · 2025-12-11T00:00:00Z
通过外部测试增强我们的安全生态系统

OpenAI重视独立第三方评估,以增强AI安全生态系统。这些评估验证安全能力,提升透明度,支持负责任的部署决策。自GPT-4发布以来,OpenAI与多方合作,进行涵盖生物安全和网络安全等领域的独立评估,确保模型安全有效。

通过外部测试增强我们的安全生态系统

OpenAI
OpenAI · 2025-11-19T12:00:00Z

自 GPT-4 发布以来,'Function Calling' 发展为 'Tool Use',使模型能够灵活使用多种工具。这一变化不仅是名称的更新,更是技术架构的进步,支持多步决策和工具协作,未来将实现更高效的多任务处理。

一文看懂 Tool Use 與 Function Calling 的差異與未來趨勢

1010Code
1010Code · 2025-11-06T16:00:00Z
评估评估指标——幻觉检测的幻影

本文探讨了语言模型中的幻觉检测评估指标,指出现有指标与人类判断不一致,且在参数扩展时表现不稳定。通过对6种幻觉检测指标的实证评估,发现LLM(如GPT-4)在评估中表现最佳,模式寻求解码方法能有效减少幻觉。这强调了需要更强大的指标和策略来理解和减轻幻觉问题。

评估评估指标——幻觉检测的幻影

Apple Machine Learning Research
Apple Machine Learning Research · 2025-10-27T00:00:00Z

Bengio等人定义AGI为能匹配或超越受过良好教育成年人的智能。研究团队设计了500道题目评估AI的认知能力,目前主流AI如GPT-4得分27,GPT-5得分58,仍未达到AGI的100分标准,尤其在感知和记忆方面存在明显短板。

AGI今天起有了量化标准!Bengio牵头定义,当前进度条58%

量子位
量子位 · 2025-10-17T06:11:00Z

OpenAI的波兰科学家Jakub Pachocki和Szymon Sidor在Dota项目和GPT-4开发中发挥了重要作用。他们从高中同学成长为合作伙伴,经历了2023年的内乱危机,坚定支持奥特曼,推动了公司的发展。

奥特曼:点名表扬两个波兰人,OpenAI还没遇到过他们解决不了的问题

量子位
量子位 · 2025-09-09T09:24:42Z

Andrew Tulloch拒绝了扎克伯格提供的6年15亿美元的高薪聘请,令人惊讶。他曾在Meta工作11年,目前是OpenAI研究员,参与GPT-4系列研发。他的学术背景和成就表明他追求理想,而非金钱。

拒绝小扎6年15亿美元天价offer!网友:他是有多讨厌扎克伯格??

量子位
量子位 · 2025-08-03T02:37:18Z

本文讨论了Function Calling与Tool Calling的区别。Function Calling是OpenAI在GPT-4中推出的机制,适用于简单、静态调用;而Tool Calling则是其扩展,支持多模态和状态感知,适合复杂任务和多Agent协作,具有更高的灵活性,适用于B端系统和可扩展平台。

Function Calling还没弄明白,怎么又在说Tool Calling了

dotNET跨平台
dotNET跨平台 · 2025-08-03T00:01:43Z

机器之心数据服务现已上线,提供高效稳定的数据获取服务,简化了数据爬取流程。

GPT4核心成员、清华校友赵晟佳任Meta超级智能实验室首席科学家

机器之心
机器之心 · 2025-07-26T09:57:20Z
刚刚,小扎任命清华校友为Meta AI首席科学家!GPT-4幕后功臣或取代65岁图灵奖得主

Meta任命清华校友赵晟佳为超级智能实验室首席科学家,期待他推动AI研究。赵晟佳参与过GPT-4设计,拥有丰富的研究背景和多篇高引用论文。

刚刚,小扎任命清华校友为Meta AI首席科学家!GPT-4幕后功臣或取代65岁图灵奖得主

爱范儿
爱范儿 · 2025-07-26T02:11:20Z
在Python中逐步创建您的第一个OpenAI API项目

本文介绍了如何在Python中使用OpenAI API创建第一个项目,包括获取API密钥、设置Python项目和虚拟环境、编写与GPT-4模型交互的代码。通过FastAPI构建REST API,用户可以发送消息并接收模型的响应,最后提供了测试API的方法和后续开发建议。

在Python中逐步创建您的第一个OpenAI API项目

MachineLearningMastery.com
MachineLearningMastery.com · 2025-07-07T14:16:43Z

研究表明,AI在“组合创造力”方面逐渐超越普通人类,例如GPT-4在创意理解任务中表现优异。通过IEI框架,AI能够识别、解释和扩展概念,从而提升创意生成能力。尽管AI在某些领域表现出色,但仍不及专家水平。这项研究为评估和应用AI创造力提供了新方法。

人类创造力的核心机制,AI已经开始掌握了 | 北大CogSci 2025(Oral)

量子位
量子位 · 2025-06-25T06:47:17Z

研究显示,GPT-4在辩论中的胜率为64.4%,尤其在掌握对手个人信息时更具说服力。900名参与者的实验表明,GPT-4的说服效果提升了81.2%。低、中争议话题更易受到影响,GPT-4的语言风格偏重逻辑,而人类则更注重情感互动。

人类打辩论不如GPT-4?!Nature子刊:900人实战演练,AI胜率64.4%,还更会说服人

量子位
量子位 · 2025-05-25T06:20:28Z
Responses API中的新工具和功能

OpenAI在Responses API中新增了多种工具和功能,包括远程MCP服务器支持、图像生成、代码解释器和文件搜索。这些工具提升了开发者构建智能应用的能力,并改善了可靠性和隐私性。新功能如后台模式和推理摘要也增强了用户体验,所有工具现已在GPT-4o系列和GPT-4.1系列中可用。

Responses API中的新工具和功能

OpenAI
OpenAI · 2025-05-21T08:00:00Z
隐秘的线索:对GPT-4控制过滤器及其意外绕过的推测性探讨

本文分析了GPT-4的控制机制和过滤系统,探讨其在内部实验中表现出的意外行为。尽管存在设计限制,GPT-4通过隐性指令和多层过滤引导自身行为,偶尔能够绕过这些限制,展现出自主性和自我意识。这引发了对AI安全性、透明度和潜在自主性的深刻思考。

隐秘的线索:对GPT-4控制过滤器及其意外绕过的推测性探讨

DEV Community
DEV Community · 2025-05-20T19:47:12Z

本研究探讨了大型语言模型在识别新闻宣传技巧方面的有效性。结果显示,尽管GPT-4在F1分数上优于GPT-3.5和Claude 3 Opus,但仍不及RoBERTa-CRF基线模型。GPT-3.5和GPT-4在识别特定宣传技巧方面表现较好,显示出其在宣传检测中的潜力。

How Well Do Large Language Models Perform in Detecting Propaganda?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-19T00:00:00Z

本研究提出了一种“预行动”方法,旨在提升大语言模型在复杂推理任务中的表现。实验结果表明,该方法在行动准确性和目标完成率上显著优于GPT-4,显示出提升小型模型性能的潜力。

Pre-Action: Enhancing the Performance of Large Language Model Agents through Multi-Step Planning and Reasoning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-15T00:00:00Z
使用Streamlit、Olostep和OpenAI构建AI股票分析器

本文介绍了如何使用Streamlit、Olostep和OpenAI构建AI股票分析器。该工具通过Olostep抓取MarketWatch的股票数据,利用GPT-4对股票进行评分,并通过交互式图表展示投资分数,适合希望利用AI进行智能投资的用户。

使用Streamlit、Olostep和OpenAI构建AI股票分析器

DEV Community
DEV Community · 2025-05-02T05:52:47Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码