小红花·文摘 - 小红花技术领袖俱乐部

sktime是一个专为时间序列数据设计的Python库，提供类似scikit-learn的API。本文通过工业HVAC传感器的温度预测示例，介绍了时间序列数据的处理，包括数据预处理、模型拟合和评估。sktime支持缺失值填补、去趋势和去季节性等操作，并与Python机器学习生态系统良好集成。

在Python中使用sktime构建时间序列机器学习模型

KDnuggets ·

作者开发了一款本地AI财务分析应用，旨在保护用户隐私并提供实时分析。该项目包括数据预处理、机器学习模型选择和可视化设计，能够自动检测CSV格式，使用混合算法进行交易分类和异常检测，帮助用户快速获取财务洞察。应用支持本地大语言模型生成自然语言分析，确保数据安全。完整源代码可在GitHub上获取。

使用Python和本地大语言模型开发私有AI财务分析师

KDnuggets ·

如何使用Python和朴素贝叶斯分类器构建垃圾邮件检测器

如何使用Python和朴素贝叶斯分类器构建垃圾邮件检测器

freeCodeCamp.org ·

从混乱到整洁：8个轻松的数据预处理Python技巧

从混乱到整洁：8个轻松的数据预处理Python技巧

KDnuggets ·

提升你的机器学习技能：安德鲁·吴课程后的行动指南

提升你的机器学习技能：安德鲁·吴课程后的行动指南

MachineLearningMastery.com ·

【案例共创】线性回归 - 汽车行驶里程与油耗关系预测

【案例共创】线性回归 - 汽车行驶里程与油耗关系预测

华为云官方博客 ·

时间序列中的Transformer与LSTM：哪种效果更好？

时间序列中的Transformer与LSTM：哪种效果更好？

MachineLearningMastery.com ·

从零开始构建简单检索增强生成（RAG）系统的七个步骤

从零开始构建简单检索增强生成（RAG）系统的七个步骤

KDnuggets ·

广告中的AI代理：上下文内容投放

广告中的AI代理：上下文内容投放

Databricks ·

RAG实践:一文掌握大模型RAG过程

RAG实践:一文掌握大模型RAG过程

京东科技开发者 ·

PYTHON脚本练习（三）聚束分析

seisamuse ·

使用Scikit-Learn管道与Pandas的ColumnTransformer和NumPy数组进行高级特征工程

使用Scikit-Learn管道与Pandas的ColumnTransformer和NumPy数组进行高级特征工程

MachineLearningMastery.com ·

机器学习入门：好奇编码者的实用指南

机器学习入门：好奇编码者的实用指南

DEV Community ·

初学者理解机器学习中的数据预处理

初学者理解机器学习中的数据预处理

DEV Community ·

本研究提出了一种优化医疗领域大语言模型（LLM）数据预处理和训练的新方法，强调模型的安全性和有效性。研究结果表明，芦荟家族模型在医疗基准测试中表现优异，能够有效抵御攻击，推动医疗LLM伦理标准的建立。

Aloe Family Formulation of Open and Specialized Medical Large Language Models

BriefGPT - AI 论文速递 ·

本研究提出了一种新型可解释AI方法，通过扩展决策谓词图，全面分析数据预处理对孤立森林模型性能和偏差的影响。该方法引入内点-外点传播分数，增强了模型的可解释性，并揭示了特征在异常值识别中的贡献。

Extending Decision Predicate Graphs for Comprehensive Explanation of Isolation Forest

BriefGPT - AI 论文速递 ·

与Unstructured和Redis一起加速AI工作流程

与Unstructured和Redis一起加速AI工作流程

Redis Blog ·

数据预处理的常见技术有哪些？

数据预处理的常见技术有哪些？

DEV Community ·

本研究针对肖像模式短视频的音视频事件定位（AVEL）问题，提出了专用数据集AVE-PM，并改进了数据预处理和模型设计，显著提升了性能，为移动视频内容的AVEL研究奠定了基础。

肖像模式短视频中的音视频事件定位

BriefGPT - AI 论文速递 ·

本研究针对墨西哥皮肤病识别中的数据不足问题，提出了一种预处理dermaMNIST数据集的方法，以提高分类质量。通过使用轻量级卷积神经网络，减少训练实例数量，同时实现与ResNet模型相似的性能。

Lightweight Deep Models for Dermatological Disease Detection: A Study on Instance Selection and Channel Optimization

BriefGPT - AI 论文速递 ·