小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

在FAANG公司面试中,考官重视候选人的数据分析能力,特别是识别统计陷阱,如辛普森悖论、选择偏差、p-hacking、多重测试和混杂变量。候选人需质疑数据来源、分组及实验设计,以避免错误决策。

FAANG面试中最常见的统计陷阱

KDnuggets
KDnuggets · 2026-04-03T14:50:18Z
BED-LLM:基于贝叶斯实验设计的大型语言模型智能信息收集

本文提出了一种名为BED-LLM的方法,通过贝叶斯实验设计提升大型语言模型(LLMs)在信息收集中的能力。该方法通过选择最大化预期信息增益的问题,使LLMs能够有效进行多轮对话并与外部环境互动。研究表明,BED-LLM在多项测试中表现优异,显著提高了性能。

BED-LLM:基于贝叶斯实验设计的大型语言模型智能信息收集

Apple Machine Learning Research
Apple Machine Learning Research · 2025-12-19T00:00:00Z
【原理到实战】实验异质性分析

实验的异质性(HTE)指同一处理对不同样本的效果差异。主要概念包括平均处理效应(ATE)、条件平均处理效应(CATE)和个体处理效应(ITE)。异质性分析有助于理解策略对不同用户的影响,优化实验设计,并挖掘业务逻辑。通过分析,发现某些子人群在实验中表现出显著的正向或负向效果,为后续策略调整提供依据。

【原理到实战】实验异质性分析

京东科技开发者
京东科技开发者 · 2025-11-12T08:10:45Z
数据科学面试的隐性课程:公司真正考察的内容

技术面试不仅考察候选人的技术知识,还评估其商业理解、数据处理、实验设计、应对模糊情况的能力、务实性和团队合作能力,这些技能影响候选人的工作成功。

数据科学面试的隐性课程:公司真正考察的内容

KDnuggets
KDnuggets · 2025-10-23T15:55:25Z
Agent设计模式——第 21 章:探索和发现

本章探讨智能代理在复杂环境中主动探索新信息和未知因素的重要性。通过多代理框架,代理能够生成假设、设计实验并推动创新,从而提高科学研究的效率。

Agent设计模式——第 21 章:探索和发现

XINDOO的博客
XINDOO的博客 · 2025-10-04T16:00:09Z

Virtuous Machines AI系统花费17小时和114美元完成了一篇30页的认知心理学论文,涵盖实验设计和数据分析,符合APA格式。该系统通过模拟人类认知机制自动化科研过程,尽管效率高,但在理论深度和创新思维上仍显不足。

AI花17小时写了篇30页论文!自主选题,包含实验,还符合APA格式

量子位
量子位 · 2025-10-04T04:20:44Z
可信实验白皮书系列08:开放式分析引擎 | 附PDF合集

本文介绍了美团的AB实验分析方法库,旨在简化可信、高效实验的实施。该库支持实验设计、评估和诊断,解决了实验分析的复杂性问题。分析引擎已向美团内部开放,促进跨团队知识共享,提升整体实验能力。

可信实验白皮书系列08:开放式分析引擎 | 附PDF合集

美团技术团队
美团技术团队 · 2025-08-22T00:00:00Z

机器之心数据服务现已上线,提供高效稳定的数据获取服务,帮助用户轻松获取所需数据。

怪异却奏效的实验设计,AI:我寻思这样可行

机器之心
机器之心 · 2025-07-22T08:04:38Z
如何更高效地研究复杂治疗相互作用

麻省理工学院的研究人员开发了一种新框架,用于高效测试多种治疗组合,帮助科学家理解疾病机制并开发新药。该方法通过随机分配治疗组合,减少实验偏差,优化实验设计,降低成本,未来有望应用于实际实验中。

如何更高效地研究复杂治疗相互作用

MIT News - Artificial intelligence
MIT News - Artificial intelligence · 2025-07-16T04:00:00Z
基于 Amazon Q Developer CLI 进行智能混沌工程实验

混沌工程通过受控实验识别系统弱点,增强系统韧性。AWS结合生成式AI,简化实验设计与执行,降低技术门槛,提高效率,使更多团队能够利用混沌工程构建可靠系统。

基于 Amazon Q Developer CLI 进行智能混沌工程实验

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2025-07-16T03:13:54Z

苹果团队的研究引发了关于大模型推理崩溃的讨论。最初认为高复杂度任务导致崩溃,后续文章则指出是实验设计问题。最新研究确认,尽管修正了测试设计,模型在长推理和复杂任务中仍存在追踪能力不足的问题。

大模型参与推理崩溃论战!从「思维错觉」到「错觉的错觉」再到「错觉的错觉的错觉」

量子位
量子位 · 2025-06-20T09:08:01Z

本研究利用轻量级随机结构神经网络和保形分位回归,解决科学成像中高质量数据获取时间长和噪声增加的问题。该方法有效去噪,揭示可解释的空间和化学特征,支持资源受限情况下的实验设计。

Behind the Noise: Conformal Quantile Regression Reveals Emergent Representations

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-13T00:00:00Z

本研究分析了大型语言模型(LLM)在网络安全渗透测试工具中的评估方法,提出了改进的研究方法,包括扩展测试平台和完善分析指标。研究表明,现有CTF挑战未能全面反映真实的渗透测试场景。

基于大型语言模型的进攻性安全基准实践:测试平台、指标与实验设计

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-14T00:00:00Z

本研究提出了一种基于强化学习的动态角度选择方法,以满足工业X射线CT快速在线检测的需求。通过动态最优停止和序贯最优实验设计的引入,提升了CT操作的灵活性和适用性。

Application of Dynamic Angle Selection in X-Ray CT: An Optimal Stopping Method Based on Reinforcement Learning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-16T00:00:00Z

本研究评估了Sakana.ai的AI科学家在自主研究中的能力,探讨其是否能实现人工通用研究智能(AGRI)。尽管在研究自动化方面有所进展,但在文献综述和实验可靠性上仍存在不足,用户需参与实验设计,限制了其自主性。学术界和AI社区需对此进行紧急讨论。

对Sakana.ai自主研究AI科学家的评估:美好的愿望还是朝向“人工通用研究智能”(AGRI)的新现实?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-20T00:00:00Z

本研究通过游戏Codenames评估大型语言模型的语言和认知能力,设计实验控制词语选择和对手速度,以揭示LLMs的策略、挑战和局限性。

Evaluating the Emergent Concept Formation of Large Language Models through the Game Codenames

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-17T00:00:00Z

本研究提出了一种蒸馏规模法则,以解决大规模蒸馏模型的性能估计问题。合理的资源分配显著提升了学生模型的性能,并提供了优化蒸馏的方案,促进了实验设计与蒸馏过程的理解。

Distillation Scale Law

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-12T00:00:00Z

本文解决了大规模语言模型(LLM)在科学模型提出、实验数据收集及基于新数据修订模型方面缺乏系统性基准的问题。提出的BoxingGym基准通过10个环境对实验设计与模型发现进行系统评估,并发现当前的LLM在这两个领域的表现均不佳,增强LLM-agent与显式统计模型的结合并未有效改善其结果。

BoxingGym: 自动实验设计与模型发现的基准进展

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-02T00:00:00Z

本研究提出了一种非短视的多目标优化实验设计方法,通过超体积改进提升多目标贝叶斯优化的获取函数性能,从而优化资源使用和目标达成潜力。

Non-myopic Multi-objective Bayesian Optimization

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-11T00:00:00Z

在《我的世界》中,数学研究成功估算了多个数学常数,如欧拉数e,误差仅为0.00766%。两位数学博士利用游戏机制,通过实验设计近似计算√2、π和阿佩里常数,激发人们以有趣的方式探索复杂数学问题。

《我的世界》搞数学研究,估算欧拉数误差仅0.00766%!

量子位
量子位 · 2024-12-08T04:48:25Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码