小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
商业分析:数据驱动成功的基本工具、技术与技能

商业分析通过数据和统计方法帮助组织回答关键问题,如“发生了什么”、“为什么发生”、“接下来可能发生什么”及“我们该怎么做”。它利用描述性、诊断性、预测性和规范性分析来提升决策质量和业务绩效。现代工具如Excel、SQL和Python支持数据可视化和分析,帮助识别趋势、机会和风险。

商业分析:数据驱动成功的基本工具、技术与技能

Databricks
Databricks · 2026-02-17T19:52:36Z
大数据成矿预测系列(八) | 从定性到概率:逻辑回归——地质统计学派的“集大成者”

证据权重法(WofE)在成矿预测中应用广泛,但常违反独立性假设。逻辑回归(LR)作为一种强大的统计方法,克服了这一局限,允许变量间相关性,提供更稳健的预测。LR模型通过logit变换建模成矿概率,具备良好的可解释性和处理复杂关系的能力,适应现代地质数据分析需求。

大数据成矿预测系列(八) | 从定性到概率:逻辑回归——地质统计学派的“集大成者”

Seraphineの小窝
Seraphineの小窝 · 2025-11-08T12:48:22Z
迈克尔·克里斯托菲德斯:利用pg_stat_statements近似查询的p99性能

本文讨论了如何利用pg_stat_statements中的均值和标准差列来近似查询的p99性能。虽然无法直接跟踪百分位数,但可以通过统计方法获得实用的近似值。作者提供了SQL查询示例以获取前50个查询的近似p99时间,并指出该方法的局限性,建议结合其他监控工具使用。

迈克尔·克里斯托菲德斯:利用pg_stat_statements近似查询的p99性能

Planet PostgreSQL
Planet PostgreSQL · 2025-06-04T15:58:45Z

地球化学数据分析中,封闭效应导致成分数据伪相关性。传统统计方法未考虑这一约束,可能产生误导。为解决此问题,提出了加性对数比变换、中心化对数比变换和等距对数比变换等方法,以便用常规统计分析处理成分数据。

地球化学数据的封闭效应

Seraphineの小窝
Seraphineの小窝 · 2025-04-22T09:05:21Z
大型语言模型输出中的偏见检测:统计方法

本文探讨了大型语言模型(LLM)输出中的偏见检测,强调统计方法的重要性。LLM在文本生成和情感分析等任务中表现优异,但仍存在性别、社会经济和能力等偏见。通过数据分布分析、嵌入测试和AI公平性360框架等方法,可以量化和检测这些偏见。研究者们致力于提高模型的透明度和公平性,以减少偏见带来的歧视。

大型语言模型输出中的偏见检测:统计方法

MachineLearningMastery.com
MachineLearningMastery.com · 2025-03-21T16:46:32Z

本文研究序列变点分析中的一个重要挑战:在检测到变化后进行推断。通过构建未知变点的置信区间,提供了理论合理且实用的序列变点定位工具。

Post-detection Inference for Sequential Changepoint Localization

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-10T00:00:00Z

本研究分析了经验软件工程中统计方法的错误应用及专家识别能力不足的问题。通过对近三十年文献的调查,发现现有方法存在显著统计问题,呼吁对统计方法进行深入研究与改革,以确保研究结果的可信性和方法的严谨性。

A Call for Critical Rethinking and Reform of Data Analysis in Empirical Software Engineering

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-22T00:00:00Z
📊 生成式人工智能开发者周 - 线性回归简介

线性回归是一种简单有效的统计方法,用于分析变量间的关系,本文探讨了其基本原理及应用。

📊 生成式人工智能开发者周 - 线性回归简介

DEV Community
DEV Community · 2025-01-10T10:25:54Z

本研究提出了一种结合深度学习、优化和统计方法的验证管道,解决工业领域监督学习的认证问题。该管道通过十个步骤的有向图模型,有效预测航空结构设计中的应力故障模式,具有重要的工业应用潜力。

迈向认证:针对工业中的监督学习的完整统计验证管道

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-04T00:00:00Z
使用pandas进行数据探索

本文介绍了如何在PyCharm中利用汇总统计和图表快速探索Kaggle数据集。作者分析了连续和分类变量的统计方法,强调中位数和四分位数范围的重要性,并展示了生成直方图、条形图和散点图以识别数据模式和关系的过程。最后提到JetBrains AI助手可提升数据分析效率。

使用pandas进行数据探索

The JetBrains Blog
The JetBrains Blog · 2024-10-29T15:47:18Z
小数据集的5种创新统计方法

数据科学家不仅依赖机器学习,还需用统计方法解决小数据集问题。本文介绍五种方法:自助法、贝叶斯估计、置换检验、刀切法和符号检验,帮助在小数据集上进行有效分析。

小数据集的5种创新统计方法

KDnuggets
KDnuggets · 2024-10-15T12:35:02Z

论文提出一种统计方法来分析语言模型的道德信念。研究了28个模型在680个模棱两可和687个明确道德情景中的表现。结果表明,模型在明确情景中倾向于选择常识性行动,而在模棱两可情景中表现出不确定性。部分模型对问题的表达方式敏感,尤其是闭源模型在模糊情景中表现出一致性。

日常困境:揭示大型语言模型在日常生活中的价值偏好

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-03T00:00:00Z

本研究提出了一种自动评估和修复数据质量问题的框架,通过统计方法和机器学习算法,有效地检测和修正缺失值、重复数据和拼写错误,推动自动化数据质量评估的发展。

面向无领域知识的可解释自动数据质量增强

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-16T00:00:00Z

这篇文章介绍了数据科学中常用的15种统计方法,包括描述统计、概率分布、假设检验、回归分析、相关性和协方差、中心极限定理、贝叶斯统计、方差分析、时间序列分析、主成分分析、卡方检验、K均值聚类、马尔可夫链和蒙特卡洛模拟。这些方法对于数据科学家来说非常重要,可以帮助他们从数据中提取有意义的洞察、测试假设和建立预测模型。

数据科学中的15种顶级统计方法:附示例的完整指南

DEV Community
DEV Community · 2024-09-14T06:15:40Z

数据可视化在数据科学中至关重要。使用统计方法可以提高可视化的清晰度、准确性和效果。文章介绍了几种常用的统计可视化技术,包括直方图、箱线图、散点图、热力图、小提琴图、柱状图和线图。通过参加数据科学课程,可以学习和掌握这些技术,提升数据科学和数据可视化的能力。

数据可视化技术:提升数据科学洞察力的统计方法

DEV Community
DEV Community · 2024-09-02T10:54:57Z

本研究评估了性别偏见的NLP模型的统计和因果去偏方法,发现这些方法在目标度量上有效减少了偏见,但不一定改善了其他偏见度量的结果。同时,我们展示了统计和因果去偏技术的组合能够减少通过两种类型的度量来衡量的偏见。

FairFlow: 自然语言处理中基于模型的反事实数据增强的自动化方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-23T00:00:00Z

本论文研究了一种获取语言模型中编码信念的统计方法,并探讨了不同语言模型中的道德信念。调查结果显示,大多数模型在明确情景中选择与常识一致的行动,而在模棱两可的情况下表达了不确定性。

股份投入:基于多利益相关者协调的 LLM 决策制定

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-21T00:00:00Z

本文深入分析了Linux统计系统CPU利用率的内部原理,通过定时器以固定节拍采样各个CPU核的使用情况,并将时间累加到不同的统计项中。top命令读取/proc/stat中的输出数据,这些数据是根据kernel_cpustat变量汇总并输出的。文章还解释了用户态、内核态和空闲时间的统计方法。总体而言,Linux的CPU利用率统计方法是基于采样的,虽然不是百分之百精确,但对于整体情况的评估是可靠的。

Linux 中 CPU 利用率是如何算出来的?

良许Linux教程网
良许Linux教程网 · 2024-04-23T12:41:35Z

本论文介绍了在SemEval2024 Task8中检测机器生成文本的方法,包括统计、神经网络和预训练模型方法,并评估了这些方法的有效性。方法在单语和多语境下,在子任务A和B上分别获得86.9%和83.7%的准确率。同时,还提出了未来研究中的挑战和重要因素。

AIpom 参加 SemEval-2024 任务 8:在 M4 中检测 AI 产生的输出

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-28T00:00:00Z

本文介绍了一种新颖的零样本医学信息检索方法MedFusionRank,它结合了预训练语言模型和统计方法的优势,并利用预训练的BERT风格模型提取关键词,再通过将这些关键词与医学知识图中的概念实体链接,进一步丰富其领域知识。实验评估表明,MedFusionRank相比现有方法表现优越,在多种评估指标上具有有希望的结果。即使是来自于短查询或单个术语,MedFusionRank在检索相关信息方面表现出有效性。

通过知识图谱嵌入进行零样本医学信息检索

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-31T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码