小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

苹果一篇AI论文因高达30%的错误率引发程序员Lei Yang的不满。他发现论文中的基准测试存在代码错误和数据质量问题,最终导致作者撤稿并道歉。这一事件引发了学术界对数据质量的关注。

苹果AI论文太坑了!用GPT写的GT,导致北京程序员通宵加班

量子位
量子位 · 2025-11-28T09:07:43Z

Cloudflare于2025年11月18日经历服务降级,影响多个应用服务。尽管部分服务逐步恢复,用户仍面临较高的错误率。Cloudflare正在积极修复问题,并与第三方服务提供商合作解决影响。

Another Memorable Cloudflare Outage

晓空blog
晓空blog · 2025-11-18T14:13:13Z
在增强检索生成(RAG)语义缓存中减少假阳性:银行案例研究

语义缓存是一种通过存储查询和响应的向量嵌入来增强检索的技术。本文记录了从失败到成功的过程,测试了七种双编码器模型,并优化了缓存设计,显著降低了错误率。最终,系统的假阳性率从99%降至3.8%,证明了缓存设计的重要性。

在增强检索生成(RAG)语义缓存中减少假阳性:银行案例研究

InfoQ
InfoQ · 2025-11-14T09:00:00Z

机器之心数据服务现已上线,提供高效稳定的数据获取服务,简化数据爬取流程。

谷歌开源DeepPolisher,基因组组装错误率减半,Jeff Dean:令人振奋!

机器之心
机器之心 · 2025-08-07T07:17:07Z
自我反思的不确定性:大型语言模型是否了解其内部答案分布?

本文探讨了通过双向长短期记忆网络(bi-LSTM)提高语言识别准确性的方法。研究表明,该方法在字符级别处理语言识别,错误率降低15%至60%,模型大小减少40%至80%。这改善了苹果平台的多语言输入体验,提升了自动纠正和预测功能。

自我反思的不确定性:大型语言模型是否了解其内部答案分布?

Apple Machine Learning Research
Apple Machine Learning Research · 2025-07-11T00:00:00Z

研究表明,添加与猫相关的语句会显著提高大模型的数学错误率,错误率增加300%。DeepSeek和OpenAI的模型均受到影响,推理能力下降,Token消耗增加,猫的干扰分散了模型的注意力,导致频繁出错。

数学题干带猫AI就不会了!错误率翻300%,DeepSeek、o1都不能幸免

量子位
量子位 · 2025-07-05T11:06:03Z
语音搜索错误纠正的音素增强判别重评分

本文提出了一种针对E2E自动语音识别模型在新电影标题识别中不足的音素纠正方法。该方法通过音素搜索生成替代选项,并结合ASR模型的识别结果,显著提高了识别准确率,错误率降低了4.4%至7.6%。

语音搜索错误纠正的音素增强判别重评分

Apple Machine Learning Research
Apple Machine Learning Research · 2025-06-27T00:00:00Z
服务水平目标:停止以烧钱率思考

服务水平目标(SLO)的整合方式多样,部分公司使用统一的SLO进行警报和系统健康报告,而另一些则根据不同用例定制。SLO应关注用户体验,考虑系统对业务的影响,而非单纯的错误率或复杂计算。

服务水平目标:停止以烧钱率思考

The New Stack
The New Stack · 2025-06-17T16:00:51Z

机器之心数据服务现已上线,提供高效、稳定的数据获取,简化数据爬取流程。

错误率下降44.66%,给AI神经元装上三个突触,灵活的生物启发模块来了

机器之心
机器之心 · 2025-06-06T06:07:17Z
AI编码助手让开发者感到困扰,并提交了错误代码

过去一年,AI编码助手发展迅速,但未能如预期替代开发者。AI工具常引发困扰,增加错误率和降低成功率。AI应辅助设计、故障排除和代码审查,而非直接生成代码。开发者需主动审核AI输出,保持人机合作。

AI编码助手让开发者感到困扰,并提交了错误代码

DEV Community
DEV Community · 2025-05-30T14:27:28Z
打印机错误

在工厂中,打印机为箱子打印标签,使用字母a到m表示颜色。如果控制字符串中出现n到z的字母,则需计算错误率。函数printer_error返回错误数量与控制字符串长度的比值。

打印机错误

DEV Community
DEV Community · 2025-05-29T19:33:24Z

本研究提出了一种新的自监督正样本采样技术(SSPS),有效克服了传统说话人验证方法的局限性。SSPS显著提高了验证性能,SimCLR-SSPS的错误率降低了58%,与DINO-SSPS表现相当。

Self-Supervised Positive Sample Sampling for Robust Self-Supervised Speaker Verification

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-20T00:00:00Z

本研究探讨重放攻击对音频深伪造检测的影响。通过不同扬声器和麦克风播放及重新录制深伪音频,伪造样本在检测模型中表现得更为真实。引入ReplayDF数据集,分析六个开源检测模型的脆弱性,发现顶级模型的错误率从4.7%上升至18.2%。

Replay Attacks on Audio Deepfake Detection

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-20T00:00:00Z
🚀通过基于模型的测试修复AI代码:一位开发者的故事

文章讲述了作者作为软件开发者与AI编码工具的经历,指出AI生成代码的错误率和安全隐患。尽管AI加速了开发,但也带来了技术债务和生产错误。作者通过使用基于模型的测试工具Provengo,显著减少了调试时间和生产错误,增强了对AI代码的信心,认为应与AI合作而非对抗。

🚀通过基于模型的测试修复AI代码:一位开发者的故事

DEV Community
DEV Community · 2025-05-08T12:04:01Z
为什么每个项目都应该从团队沟通计划开始?

制定团队沟通计划对项目成功至关重要。该计划明确沟通目标、工具和责任,减少误解,提升协作,确保信息一致,降低错误率,提高成功率。

为什么每个项目都应该从团队沟通计划开始?

DEV Community
DEV Community · 2025-05-08T11:03:23Z

本研究针对ChatGPT在各领域及软件开发生命周期中存在的错误率进行综合量化,旨在揭示其可靠性问题。研究表明,不同领域和任务下的错误率差异显著,尤其是在医疗和编程任务中,仍需警惕其非忽略的错误可能性。尽管GPT-4在可靠性上有所提升,但仍需保持人工监督,确保在关键场景中的应用安全。

为何不应完全信任ChatGPT:对该人工智能工具在各学科和软件工程生命周期中的错误率的综合分析

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-26T00:00:00Z
使用LangSmith警报及早捕捉生产故障

LangSmith推出实时监控警报功能,帮助用户监测LLM应用的错误率、延迟和反馈分数,从而快速识别外部服务依赖和输出质量问题,提升用户体验。

使用LangSmith警报及早捕捉生产故障

LangChain Blog
LangChain Blog · 2025-04-22T15:58:23Z
通过LangSmith警报及早捕捉生产故障

LangSmith推出实时监控功能,支持基于错误率、延迟和反馈分数设置警报,帮助快速识别LLM应用中的问题,提升用户体验和应用质量。

通过LangSmith警报及早捕捉生产故障

LangChain Blog
LangChain Blog · 2025-04-22T15:58:23Z

本研究建立了多类型深度伪造音频检测基准,采用波形提示调优的自监督学习方法,优化检测效果,平均错误率为3.58%。

Detecting All Types of Deepfake Audio: Wavelet Prompt Tuning for Enhanced Auditory Perception

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-09T00:00:00Z

本研究提出了一种名为图编辑网络(GEN)的新型学习方法,旨在解决现有图编辑距离计算在可变操作成本下的不足。实验结果表明,GEN在实际和合成数据集上显著降低了错误率和推理时间,证明了其有效性和适应性。

Flexible Graph Similarity Computation with Proactive Optimization Strategy

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-09T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码