小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
沉浸式翻译 immersive translate
Dify.AI
大型语言模型嵌入能否改善时间序列预测?一种实用的特征工程方法

该代码段处理数据框,重置索引、重命名列,清理价格数据,删除多余列,并合并价格数据与嵌入数据。

大型语言模型嵌入能否改善时间序列预测?一种实用的特征工程方法

MachineLearningMastery.com
MachineLearningMastery.com · 2026-02-27T14:40:25Z
7个不太知名的Python库用于可扩展特征工程

特征工程是数据科学和机器学习中的关键环节,旨在从原始数据中构建有意义的特征。本文介绍了7个不太知名的Python库,包括NVTabular、FeatureTools、Dask、Polars、Feast、tsfresh和River,以提高特征工程的效率和规模,适用于大规模数据集和复杂转换的自动化。

7个不太知名的Python库用于可扩展特征工程

KDnuggets
KDnuggets · 2026-01-27T14:25:00Z
5个实用的Python脚本用于有效的特征工程

特征工程可以通过五个Python脚本自动化,提升模型性能。这些脚本包括分类特征编码、数值特征转换、特征交互生成、时间特征提取和特征选择,简化机器学习项目中的复杂工作。

5个实用的Python脚本用于有效的特征工程

KDnuggets
KDnuggets · 2026-01-13T13:00:14Z
导致机器学习项目失败的5个关键特征工程错误

特征工程是机器学习成功的关键,但常见错误可能导致项目失败。文章指出五个主要问题:数据泄露、维度陷阱、目标编码陷阱、异常值管理不当和模型特征不匹配。理解并解决这些问题,有助于提升模型在生产中的表现,避免复杂性,确保特征有效性。

导致机器学习项目失败的5个关键特征工程错误

KDnuggets
KDnuggets · 2025-12-04T13:00:20Z
专家级特征工程:高风险模型的高级技术

本文介绍了三种高级特征工程策略:反事实特征、领域约束表示和因果不变特征,旨在构建稳健且可解释的高风险模型,适用于金融和医疗等关键领域。

专家级特征工程:高风险模型的高级技术

MachineLearningMastery.com
MachineLearningMastery.com · 2025-11-11T11:00:09Z
利用LLM嵌入进行文本数据的7个高级特征工程技巧

大型语言模型(LLMs)不仅能理解和生成文本,还能将文本转化为数值嵌入。本文介绍了七种高级Python示例,利用LLM生成的嵌入来增强文本特征工程,从而提高情感分析和主题分类等任务的准确性和鲁棒性。

利用LLM嵌入进行文本数据的7个高级特征工程技巧

MachineLearningMastery.com
MachineLearningMastery.com · 2025-10-29T15:44:41Z
大数据成矿预测系列(五) | 告别特征工程:卷积神经网络(CNN)如何实现“端到端”成矿预测

机器学习为地质学家寻找矿产资源提供了新方法,卷积神经网络(CNN)能够直接处理原始地质数据并自动提取特征,克服了传统方法的局限性。然而,CNN仍需大量高质量数据,且决策过程不透明,存在“黑箱”问题。

大数据成矿预测系列(五) | 告别特征工程:卷积神经网络(CNN)如何实现“端到端”成矿预测

Seraphineの小窝
Seraphineの小窝 · 2025-10-21T07:21:45Z
文本数据的七种特征工程技巧

本文介绍了七种文本特征工程技巧,以帮助机器学习和深度学习模型处理文本。这些技巧包括去除停用词、词干提取、词袋模型、TF-IDF、n-grams、清洗和标记化,以及词嵌入,旨在将原始文本转化为机器可读的数值特征。

文本数据的七种特征工程技巧

MachineLearningMastery.com
MachineLearningMastery.com · 2025-10-16T15:24:51Z
基于n8n的AI驱动特征工程:提升数据科学智能

本文介绍了一种利用AI进行特征工程的工作流程,通过自动化分析将个人专业知识转化为团队智能。该流程结合统计模式、领域背景和业务逻辑,提高数据科学的效率与创造性。用户可通过五个节点的智能分析生成战略性特征建议,促进数据团队的协作与发展。

基于n8n的AI驱动特征工程:提升数据科学智能

KDnuggets
KDnuggets · 2025-08-08T12:00:34Z
特征工程的生命周期:从原始数据到模型准备输入

特征工程是将原始数据转化为有用特征的过程,旨在提升机器学习模型的预测能力。它包括数据清理、特征创建和选择,通过处理缺失值和异常值,创建新特征并选择相关特征,从而提高模型的准确性和效率。

特征工程的生命周期:从原始数据到模型准备输入

KDnuggets
KDnuggets · 2025-07-16T14:00:30Z
特征工程:正确实施的实用指南

特征工程是提升模型性能的关键,理解数据类型(结构化与非结构化)和特征级别(名义、序数、区间、比率)非常重要。通过应用五种特征工程技术(改进、构建、选择、提取、学习)并评估其影响,可以有效提升模型表现。遵循结构化、分类、应用技术和评估影响的步骤,有助于更好地进行特征工程。

特征工程:正确实施的实用指南

DEV Community
DEV Community · 2025-04-16T03:06:04Z
在Databricks实验中使用SparkML和MLFlow进行嵌入的特征工程

本文介绍了如何在Databricks中使用Apache Spark和MLFlow进行机器学习特征工程,重点是通过Word2Vec生成类别嵌入。文章以Kaggle的停车交易数据集为例,详细阐述了数据处理、特征选择和嵌入生成的步骤,并强调了嵌入在深度学习模型中的重要性。

在Databricks实验中使用SparkML和MLFlow进行嵌入的特征工程

DEV Community
DEV Community · 2025-04-06T15:10:03Z

该研究提出了FeRG-LLM框架,利用大型语言模型自动化表格数据特征工程,提升效率与效果,且在多个数据集上优于传统模型,同时解决了安全性和成本问题。

FeRG-LLM:通过推理生成的大型语言模型进行特征工程

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-30T00:00:00Z

本研究提出了LLM-FE框架,结合进化搜索与大语言模型,克服传统特征工程的局限性。实验结果表明,LLM-FE在分类和回归任务中显著提升了表格预测模型的性能。

LLM-FE:基于大语言模型的表格数据自动特征工程

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-18T00:00:00Z
特征工厂:一个基于Apache DataFusion的Rust特征工程库 🦀

我正在开发一个名为Feature Factory的开源特征工程库,基于Apache DataFusion,目前处于早期阶段。欢迎社区反馈和有兴趣的贡献者参与。GitHub链接: https://github.com/habedi/feature-factory

特征工厂:一个基于Apache DataFusion的Rust特征工程库 🦀

DEV Community
DEV Community · 2025-03-09T16:35:33Z
数据转换与特征工程:AWS机器学习工具的全面指南

数据转换和特征工程是机器学习的关键步骤。AWS提供了SageMaker Data Wrangler和Glue等高效工具,简化数据准备过程。文章讨论了数据清洗、缺失值处理、去重和特征工程等技术,强调了使用AWS工具提升数据处理效率和质量的重要性。

数据转换与特征工程:AWS机器学习工具的全面指南

DEV Community
DEV Community · 2024-12-28T10:34:02Z

本研究首次提出适用于横向和混合设置的AutoFE算法,解决了联邦学习中自动特征工程的缺乏问题,证明其性能可与集中式数据相媲美,具有重要的应用潜力。

联邦自动特征工程

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-05T00:00:00Z

本研究针对大型语言模型在表格机器学习中的特征工程偏差,提出了一种检测模型建议特征操作频率异常的方法。研究发现,LLMs倾向于使用简单操作,忽视复杂特征组合,可能导致预测性能下降。

大型语言模型在表格数据特征工程中过度使用简单特征

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-23T00:00:00Z

特征工程是将原始数据选择、操作和转换为可用于监督学习的特征的过程。特征可以是数值、文本或分类的,有助于提高模型效率、灵活性和用户体验。特征工程包括特征创建、特征提取、特征选择和特征缩放等过程。特征缩放方法包括归一化和标准化。特征编码方法包括独热编码和分箱。

特征工程:终极指南

DEV Community
DEV Community · 2024-08-25T18:33:16Z

这篇文章介绍了一个地方,程序员可以在这里分享、保持最新状态并发展自己的职业。

特征工程终极指南。

DEV Community
DEV Community · 2024-08-24T16:03:01Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码