小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
TPU开发者中心:高性能AI平台的技术评审

谷歌推出TPU开发者中心,旨在简化机器学习从业者与专用加速硬件的互动。该中心整合了文档、迁移指南和开发环境,目标是将模型训练时间从数周缩短至数小时,尤其适用于参数超过70亿的语言模型,显著降低训练成本和时间。

TPU开发者中心:高性能AI平台的技术评审

mongona news
mongona news · 2026-06-23T21:52:06Z
九位评审,两个有效投票:相关错误削弱大型语言模型评估小组

研究发现,九个大型语言模型(LLM)组成的评审小组仅提供约两个独立投票的信息。由于模型在相同项目上犯相同错误,评审小组的准确性比独立投票低8-22个百分点。增加评审人数或使用更智能的聚合算法未显著改善结果,表明评审小组的相关性是主要瓶颈,无法替代真正独立的评估。

九位评审,两个有效投票:相关错误削弱大型语言模型评估小组

Apple Machine Learning Research
Apple Machine Learning Research · 2026-06-23T00:00:00Z
如何赢得黑客马拉松:评审桌上的笔记

在黑客马拉松中,成功的关键是清晰阐述问题并展示有效解决方案。团队应专注于一个功能,避免过度扩展,确保演示简洁明了。提前准备、了解评委期望、模拟用户体验和练习演示都是重要步骤。保持热情和享受过程也能提升成功机会。

如何赢得黑客马拉松:评审桌上的笔记

The JetBrains Blog
The JetBrains Blog · 2026-06-22T15:41:03Z
人工智能论文评审:链式思维提示激发大型语言模型的推理能力

大型语言模型在多步推理任务中的表现有限。研究提出了“链式思维提示”,鼓励模型展示推理过程后再给出答案,从而显著提升推理能力。这一方法无需额外训练,适用于算术、常识和符号推理任务,尤其在大型模型中效果显著。研究表明,适当的提示可以激发推理能力,改变了对语言模型推理的理解。

人工智能论文评审:链式思维提示激发大型语言模型的推理能力

freeCodeCamp.org
freeCodeCamp.org · 2026-06-15T22:43:25Z
阿里开源Open Code Review:一款AI代码评审命令行工具

阿里巴巴开源的Open Code Review(OCR)是一款AI代码审查工具,能够自动审查Git提交和代码变更。它通过分析代码库,识别潜在的空指针、线程安全和SQL注入等问题,并提供精准的审查建议。OCR结合工程规则与AI,确保审查结果的稳定性和一致性,适合大型团队和复杂项目。

阿里开源Open Code Review:一款AI代码评审命令行工具

极道
极道 · 2026-06-05T11:38:00Z
人工智能论文评审:通过人类反馈训练语言模型以遵循指令(InstructGPT)

GPT-3在自然语言处理上取得了重大突破,但未能有效转化为助手。为此,OpenAI推出了InstructGPT,通过人类反馈训练模型更好地遵循指令,强调模型的对齐和实用性比规模更重要,推动了现代AI的发展,最终形成了更具人性化的对话系统如ChatGPT。

人工智能论文评审:通过人类反馈训练语言模型以遵循指令(InstructGPT)

freeCodeCamp.org
freeCodeCamp.org · 2026-06-03T18:01:27Z
人工智能论文评审:GPT-4技术报告(GPT-4)

GPT-4标志着大型语言模型从实验研究转向实际应用,具备多模态能力,能够同时处理文本和图像,提升推理和安全性。报告强调用户意图对齐和安全性的重要性,展示了GPT-4在多项学术和专业考试中的优异表现,显示其在实际应用中的潜力。

人工智能论文评审:GPT-4技术报告(GPT-4)

freeCodeCamp.org
freeCodeCamp.org · 2026-05-27T21:42:20Z
人工智能论文评审:语言模型是少量学习者(GPT-3)

GPT-3的论文展示了大型语言模型如何通过上下文学习新任务,而无需特定的微调。它能够通过示例直接从提示中学习,标志着AI系统交互方式的重大转变。这种“少量学习”方法使模型能够根据指令和示例动态适应,推动了现代AI研究的发展。尽管GPT-3在许多任务上表现出色,但在逻辑推理和一致性方面仍存在局限性。

人工智能论文评审:语言模型是少量学习者(GPT-3)

freeCodeCamp.org
freeCodeCamp.org · 2026-05-18T20:29:20Z
人工智能论文评审:语言模型是无监督的多任务学习者(GPT-2)

GPT-2模型通过在大量文本上训练,仅预测下一个单词,展现出多任务能力,无需特定任务训练。这一方法标志着从监督学习向零-shot学习的转变,使模型能够在不同任务中进行泛化。研究表明,模型规模和数据量的增加有助于提升性能,推动了现代语言模型的发展。

人工智能论文评审:语言模型是无监督的多任务学习者(GPT-2)

freeCodeCamp.org
freeCodeCamp.org · 2026-05-11T15:55:27Z
AI论文评审:通过生成预训练(GPT-1)提升语言理解

本文介绍了AI语言理解的进展,特别是生成预训练(GPT)模型的创新。通过在大量未标记文本上进行预训练,再利用小规模标记数据进行微调,模型能够适应多种任务。这种方法减少了对标记数据的依赖,提升了模型的通用性和性能,成为现代语言模型的基础。

AI论文评审:通过生成预训练(GPT-1)提升语言理解

freeCodeCamp.org
freeCodeCamp.org · 2026-05-06T18:13:01Z
把AI写代码当编译器输出:代码评审消失背后的流程重构

文章探讨将AI生成的代码视为编译器输出,强调通过测试和流程替代人工代码评审。核心在于建立可靠的验证体系,确保代码质量。AI的快速生成要求团队关注运行结果而非代码本身。为此,需要强化规范、增强测试体系、引入AI审查和敏感监控,最终将信任转移至流程而非个体,以提升工程效率。

把AI写代码当编译器输出:代码评审消失背后的流程重构

极道
极道 · 2026-05-02T22:47:00Z
架构决策怎么做:RFC和ADR流程、异步评审优先级排序、团队对齐实战指南

本文介绍了企业架构决策的RFC和ADR流程,强调优先级排序和异步评审,以避免无效会议。架构决策复杂,需团队协作,流程包括撰写RFC、异步评论、决策会议和撰写ADR,确保决策高效透明。

架构决策怎么做:RFC和ADR流程、异步评审优先级排序、团队对齐实战指南

极道
极道 · 2026-04-03T22:20:00Z
宣布2026年Built-On Databricks创业挑战赛

Databricks启动了第三届“Built-On Databricks Startup Challenge”,为成立不超过五年的早期创业公司提供超过100万美元的奖金。评审将根据对Databricks的利用、市场潜力和创始团队的实力进行评估,参赛者可获得投资、产品信用和全球曝光机会。

宣布2026年Built-On Databricks创业挑战赛

Databricks
Databricks · 2026-04-01T14:11:01Z

谷歌的设备屏保照片主要来自员工而非专业摄影师。自2020年起,谷歌每年征集员工提交最佳照片,经过评审后选出适合的作品,评审标准关注照片的适宜性与和谐性,避免刺激或误解的图像。

谷歌屏保背后的惊人摄影师

The Keyword
The Keyword · 2026-03-26T19:00:00Z
基于知识工程&JoyAgent双RAG的智能代码评审系统的探索与实践

双十一大促期间,代码评审面临效率与质量的挑战。研发组探索双RAG架构,结合知识检索与AI评审,提升代码评审的准确性和效率。通过识别项目类型和智能分块处理,系统能更好地理解代码上下文,预防潜在缺陷,确保系统稳定性。未来将扩展至多模态理解和全域业务知识库,提升评审的全面性与准确性。

基于知识工程&JoyAgent双RAG的智能代码评审系统的探索与实践

京东科技开发者
京东科技开发者 · 2026-01-21T09:47:30Z
基于知识工程&JoyAgent双RAG的智能代码评审系统的探索与实践

双十一大促期间,代码评审面临效率与质量的挑战。传统评审模式效率低,AI工具误报率高。为此,商家导入研发组探索双RAG架构,结合知识检索与AI评审,提升代码评审的准确性和效率。通过识别项目类型和智能分块处理,系统能更好地理解代码上下文,预防潜在缺陷。

基于知识工程&JoyAgent双RAG的智能代码评审系统的探索与实践

京东科技开发者
京东科技开发者 · 2026-01-15T06:17:59Z
“全网最忙5人组”真相:我们被一个荒诞网络梗忽悠了多久?背后是程序正义的公开嘲讽与彻底崩坏|ghost names scandal、Ghana National Service、system failure、fake lists

最近出现的“全网最忙五人组”指的是在招投标和评审过程中频繁出现的五个名字,揭示了造假现象。这些名字源自《一万中国普通人名大全》,反映了制度漏洞和公信力危机,引发公众关注,显示出流程和规则的崩溃。

“全网最忙5人组”真相:我们被一个荒诞网络梗忽悠了多久?背后是程序正义的公开嘲讽与彻底崩坏|ghost names scandal、Ghana National Service、system failure、fake lists

硕鼠的博客站
硕鼠的博客站 · 2025-12-08T00:49:44Z

ICLR 2026的评审中,21%的论文被发现完全由AI生成,许多论文也有AI参与。研究表明,AI生成的评审内容冗长且缺乏深度,可能影响学术信任。为确保遵循道德规范,ICLR开始使用自动化工具检测AI参与情况。

居然有21%的ICLR 2026评审纯用AI生成…

量子位
量子位 · 2025-11-30T06:57:21Z

吴恩达为一名投稿六次全被拒的学生开发了AI论文评审系统,该系统与人类评审的相关性为0.42,能够快速提供修改建议,帮助科研人员提升论文质量。尽管AI评审速度较快,但准确率仍低于人类评审。

学生3年投稿6次被拒,于是吴恩达亲手搓了个评审Agent

量子位
量子位 · 2025-11-25T06:48:56Z

arXiv宣布将对计算机领域的综述和立场论文实施新审核政策,要求这些文章在提交前必须经过期刊或会议的同行评审,以应对AI生成内容的激增和质量下降问题,旨在提高文章质量,确保学术标准。

派早报:arXiv 因 AI 泛滥拒收未经同行评审的计算机领域综述文章

少数派
少数派 · 2025-11-03T00:57:15Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码