小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

Discord 将实验指标从约50个减少到15个,提升了真阳性检出率约45%。通过多重比较问题和 BH 校正,发现指标过多导致真实效果难以检测。使用相关性分析和主成分分析(PCA)识别冗余指标,最终实现有效减法。

读:为什么 Discord 把实验指标从 50 个砍到 15 个

暗无天日
暗无天日 · 2026-06-07T00:00:00Z

卧底当久了,就没人能分清你的阵营了。两周前,一款叫做《种植园模拟器》的游戏在Steam平台上架,售价1美元。如果光看画面:这是个再普通不过的低成本农场模拟游戏。玩家雇佣工人采摘作物,再贩卖作物升级农场设施,达成种田流游戏的循环。但仅从这个游戏名,也不难猜到它是没那么安分的游戏。游戏里的工人全都是黑人种植工。游戏里,玩家要扮演白人庄园主用皮鞭抽打黑人,以此提高他们的工作效率,如果抽打过度,黑人...

发售两周就下架的《种植园模拟器》,一场“找骂”的社会实验

游戏研究社
游戏研究社 · 2026-05-31T16:00:00Z

TeaQL-RS 是一个工具,旨在提升 Rust 开发者在复杂业务逻辑编写中的体验。它通过领域模型自动生成强类型的 Rust API,简化数据库操作,减少手动编写的胶水代码。开发者只需声明模型,即可快速生成代码,享受流式查询和安全链式访问,从而提升开发效率。TeaQL-RS 使 CRUD 操作变得优雅,帮助开发者专注于业务逻辑。

给 Rust 开发者的一个实验:彻底告别手写 JOIN 和 Optional 地狱

Rust.cc
Rust.cc · 2026-05-29T23:41:24Z
长期吃可可碱改善老人记忆衰退的动物实验

研究表明,长期摄入可可碱可改善老年痴呆老鼠的短期记忆力。可可碱通过促进神经营养因子BDNF的生成、减少脑内炎症和增强抗氧化能力,改善神经细胞连接,从而减缓记忆衰退。这为中老年人提供了低成本、低风险的改善记忆的饮食建议。

长期吃可可碱改善老人记忆衰退的动物实验

极道
极道 · 2026-05-25T23:03:00Z
协作AI功能的产品实验:基于Python的LLM工具中的集群随机化

在协作环境中,用户之间的相互影响会使传统的用户级A/B测试失效。文章探讨了通过集群随机化来解决这一问题,确保整个团队共同接受或拒绝AI功能,从而减少干扰。通过分析50,000用户的合成数据集,展示了如何估计直接效果和溢出效果,并强调了在协作产品实验中采用集群随机化的重要性。

协作AI功能的产品实验:基于Python的LLM工具中的集群随机化

freeCodeCamp.org
freeCodeCamp.org · 2026-05-22T19:15:56Z
专注动漫风格,全新生图模型Anima V1已开源;哈佛大学发布机器学习系统教学平台MLSysBook,含33个可交互实验

Anima V1 是 CircleStone Labs 于 2026 年发布的动漫风格图像生成模型,用户可以通过文本描述生成精美图像,适用于角色立绘和插画,并支持在线调节参数以提升创作效率。

专注动漫风格,全新生图模型Anima V1已开源;哈佛大学发布机器学习系统教学平台MLSysBook,含33个可交互实验

HyperAI超神经
HyperAI超神经 · 2026-05-22T03:39:41Z
命名即误诊:世界上不存在衰老与癌细胞 | 皮肤实验炸出新赛道

研究者提出了一种“衰老适应治疗”,通过调节GPX4来管理衰老细胞,清除危险细胞并修复可恢复细胞。新药RLS-1496显示出安全性和疗效,改善银屑病和湿疹患者的症状,可能对多种年龄相关疾病有效。GPX4有望成为抗衰老和癌症预防的关键。

命名即误诊:世界上不存在衰老与癌细胞 | 皮肤实验炸出新赛道

极道
极道 · 2026-05-21T00:38:00Z

Google Beam是一种真实感视频通信平台,旨在改善远程会议体验。通过HP Dimension的沉浸式显示,参与者以真实大小呈现,结合空间音频,使交流更自然,增强社交连接感和参与感。此外,Google Beam与Google Workspace和Zoom合作,提升会议质量。

一项新实验为Google Beam带来更好的团队会议

The Keyword
The Keyword · 2026-05-20T16:45:00Z

谷歌推出了“科学双子星”工具,旨在加速科学研究。该工具利用AI提供假设生成、计算发现和文献洞察等功能,帮助科学家更高效地处理数据和文献,促进创新与发现。谷歌与多家机构合作,确保工具的有效性,并计划逐步开放访问。

科学双子星:为新发现时代而设计的AI实验与工具

The Keyword
The Keyword · 2026-05-19T17:45:00Z
小样本生物医学研究新突破,德国团队基于生成式AI模型实现数据增强,或减少30-50%实验动物用量

研究表明,传统小样本生物医学研究存在统计效力不足的问题。德国法兰克福大学研发的genESOM生成式AI模型,通过分离结构学习与数据生成,有效恢复小样本中的生物学信号,降低假阳性率。在多发性硬化研究中,该模型表现优异,能减少动物用量30%-50%,为小样本研究提供了新方案。

小样本生物医学研究新突破,德国团队基于生成式AI模型实现数据增强,或减少30-50%实验动物用量

HyperAI超神经
HyperAI超神经 · 2026-05-19T10:23:31Z

本文探讨了将大模型视为电子元件的思维实验,分析其性能与极限。通过类比电子工程中的放大器和阻抗匹配,提出差分、级联和反馈等方法来优化模型性能。文章指出,组合现有模型设计可以在许多任务上超越更大模型,标志着大模型的“分立元件时代”结束,进入“集成电路设计”阶段。

把大模型当成晶体管:从阻抗匹配到集成运放的思维实验

Guyskk的博客
Guyskk的博客 · 2026-05-19T08:00:00Z
从AI实验到企业平台:为何大多数AI概念验证无法进入生产阶段——以及该如何应对

企业AI项目常因从概念到生产的转变失败,称为“生产鸿沟”。主要原因包括缺乏文档、业务需求变化、IT审核不足和输出不一致。成功的组织建立可操作的平台,确保业务逻辑与技术实现分离,并在上线前建立监控机制。持续改进和知识管理是将AI实验转化为可靠生产系统的关键。

从AI实验到企业平台:为何大多数AI概念验证无法进入生产阶段——以及该如何应对

Dify AI
Dify AI · 2026-05-19T00:00:00Z
通过LLM评估优化实验——一个漏斗,而非分叉

LLM评估是一种新工具,能够快速、低成本地评估内容的相关性和质量。Spotify的实验表明,评估与实验应结合使用,评估帮助筛选候选项,实验验证用户反应。通过不断调整评估,提升其与在线结果的匹配度,确保系统的有效性和用户体验。

通过LLM评估优化实验——一个漏斗,而非分叉

Spotify Engineering
Spotify Engineering · 2026-05-18T13:27:23Z
8B模型做生物实验:实验步骤顺序不乱、剂量无幻觉|ICLR 2026

上海人工智能实验室与复旦、上海交通大学团队提出了Thoth模型,旨在生成可执行的生物实验protocol。该模型通过结构化推理,确保实验步骤的合理性和准确性。团队构建的SciRecipe数据集涵盖27个生物学领域,提升了实验方案生成的可靠性。Thoth在多个评估中表现优异,标志着AI在生命科学研究中的新应用方向。

8B模型做生物实验:实验步骤顺序不乱、剂量无幻觉|ICLR 2026

量子位
量子位 · 2026-05-18T06:52:11Z

谷歌推出了“Gemini for Science”,一系列旨在加速科学研究的AI工具,包括假设生成、计算发现和文献洞察。这些工具帮助科学家更高效地处理数据,识别研究空白,推动科学进步。谷歌与多家机构合作,确保AI生成见解的可靠性,致力于通过AI解决社会挑战。

科学的Gemini:为新发现时代的AI实验与工具

Google DeepMind Blog
Google DeepMind Blog · 2026-05-17T13:50:34Z
红帽押注于AgentOps,以缩小AI实验与生产之间的差距

红帽在亚特兰大峰会上宣布RHAI 3.4的重大进展,推出“模型即服务”(MaaS),允许按需访问预训练的AI模型,并提供统一接口。新版本增强了分布式推理能力,支持自主代理的操作管理,确保安全性和性能评估。红帽致力于为企业提供高效的AI解决方案,推动智能系统的发展。

红帽押注于AgentOps,以缩小AI实验与生产之间的差距

The New Stack
The New Stack · 2026-05-12T15:23:52Z
使用合成控制进行产品实验:Python中全球LLM发布的因果推断

在产品实验中,全球发布模型升级可能导致测量陷阱,缺乏对照组。合成控制方法通过构建未处理单位的加权组合,帮助数据科学家在没有对照组的情况下进行因果推断。本文介绍了如何使用Python实现合成控制,验证其有效性,并讨论常见的失败模式及应对策略。

使用合成控制进行产品实验:Python中全球LLM发布的因果推断

freeCodeCamp.org
freeCodeCamp.org · 2026-05-12T04:55:04Z
回归不连续性下的产品实验:LLM置信度阈值如何在Python中创造自然实验

本文探讨了如何使用回归不连续性设计(RDD)评估基于置信度的路由模型的因果效应。通过分析在0.85阈值附近的查询,作者展示了利用Python进行数据分析,验证高置信度查询是否能提高任务完成率。文章强调了选择带宽和模型规格的重要性,并提供了多种检验方法以确保结果的稳健性,最终证明RDD是分析AI特征的有效工具,尤其在存在明确阈值的情况下。

回归不连续性下的产品实验:LLM置信度阈值如何在Python中创造自然实验

freeCodeCamp.org
freeCodeCamp.org · 2026-05-08T15:33:41Z
Native Instruments Komplete 26新增奇特合成器和实验钢琴音色

Native Instruments发布了Komplete 26音乐制作套件,新增62个音源,包括Absynth 6。该套件有多种版本,价格从99美元到1949美元不等,标准版包含Kontakt 8等工具,升级版提供更多采样乐器,收藏版下载大小达到1.6TB。

Native Instruments Komplete 26新增奇特合成器和实验钢琴音色

The Verge
The Verge · 2026-05-06T16:37:40Z
基于倾向评分的产品实验:Python中LLM特征的因果推断

文章讨论了在基于大型语言模型(LLM)的产品中,用户选择新功能(如AI助手)时的偏差问题。重度用户更倾向于尝试新功能,导致比较结果失真。为解决这一问题,文章介绍了倾向评分方法,通过统计工具消除选择偏差,准确评估功能效果,并提供具体步骤和代码示例,帮助数据科学家在产品实验中应用这些方法。

基于倾向评分的产品实验:Python中LLM特征的因果推断

freeCodeCamp.org
freeCodeCamp.org · 2026-04-30T23:01:26Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码