小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

反欺诈是支付平台的重要策略,需不断更新防御措施以应对有组织的黑产。主要欺诈类型包括账户盗用、新账户欺诈和盗卡。特征工程和模型演进是关键,设备指纹和行为序列能有效识别欺诈行为。图风控和实时决策提升了拦截效率,但黑产也在不断适应。最终目标是使欺诈成本高于收益,维护平台安全。

【金融科技工程】反欺诈:设备指纹、关系图谱、行为序列、黑产对抗

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-22T00:00:00Z
特征工程中7个必备的Python itertools

本文介绍了如何使用Python的itertools模块简化特征工程任务,包括生成交互特征、构建查找表、创建滞后窗口和合并特征列表等功能。通过示例展示了高效处理数据的方法,以提升机器学习模型的性能。

特征工程中7个必备的Python itertools

MachineLearningMastery.com
MachineLearningMastery.com · 2026-03-30T11:00:42Z
在资源有限的环境中构建智能机器学习

在资源有限的环境中,构建智能机器学习解决方案需要使用轻量级模型和简单的工作流程。通过特征工程提取混乱数据中的有用信息,并应用简单的迁移学习技巧,即使在计算能力不足的情况下,也能有效地帮助农民和小商户做出明智决策。

在资源有限的环境中构建智能机器学习

MachineLearningMastery.com
MachineLearningMastery.com · 2026-03-12T11:00:38Z
从文本到表格:利用大型语言模型进行表格数据的特征工程

本文介绍了如何利用预训练的大型语言模型(LLM)从文本中提取结构化特征,并与数值列结合以训练监督分类器。内容包括创建混合文本和数值字段的数据集、使用Groq托管的LLaMA模型提取特征,以及在工程化表格数据集上训练和评估分类器的过程。通过将非结构化数据转化为结构化表格数据,提升机器学习模型的预测能力。

从文本到表格:利用大型语言模型进行表格数据的特征工程

MachineLearningMastery.com
MachineLearningMastery.com · 2026-03-10T11:00:41Z

Kedro是一个开源工具,旨在帮助数据科学项目从实验笔记本转向生产环境。文章介绍了Kedro的安装、项目创建及核心功能,包括数据目录和数据处理管道的构建。用户可以定义数据集,创建特征工程和数据分割的节点,并通过配置文件管理参数。运行项目后,用户可以查看数据处理结果,并使用Kedro可视化工具展示工作流程。

Kedro指南:您的生产就绪数据科学工具箱

KDnuggets
KDnuggets · 2026-03-04T15:00:41Z
大型语言模型嵌入能否改善时间序列预测?一种实用的特征工程方法

本文探讨了大型语言模型(LLM)嵌入对时间序列预测的影响。通过比较基线模型与包含LLM嵌入的模型,结果显示两者的准确率相近,LLM嵌入的效果并不显著。在高频复杂数据环境中,传统方法仍然更为有效。

大型语言模型嵌入能否改善时间序列预测?一种实用的特征工程方法

MachineLearningMastery.com
MachineLearningMastery.com · 2026-02-27T14:40:25Z
第722期:itertools、循环导入、模拟及更多(2026年2月17日)

本文介绍了五个重要的itertools方法,帮助数据科学家简化特征工程,系统化函数替代嵌套循环,处理交互、幂特征和分类组合。

第722期:itertools、循环导入、模拟及更多(2026年2月17日)

PyCoder’s Weekly
PyCoder’s Weekly · 2026-02-17T19:30:00Z
7种利用大型语言模型(LLM)嵌入进行高级特征工程的技巧

本文介绍了七种利用大型语言模型(LLM)嵌入进行高级特征工程的技巧,包括计算语义相似性、降维和去噪、使用聚类标签和距离、文本差异嵌入、嵌入白化、句子与词级嵌入聚合,以及将嵌入作为特征合成的输入。这些方法可以将通用嵌入转化为特定任务的高信号特征,从而提升模型性能。

7种利用大型语言模型(LLM)嵌入进行高级特征工程的技巧

MachineLearningMastery.com
MachineLearningMastery.com · 2026-02-03T15:26:42Z
7个不太知名的Python库用于可扩展特征工程

特征工程是数据科学和机器学习中的关键环节,旨在从原始数据中构建有意义的特征。本文介绍了7个不太知名的Python库,包括NVTabular、FeatureTools、Dask、Polars、Feast、tsfresh和River,以提高特征工程的效率和规模,适用于大规模数据集和复杂转换的自动化。

7个不太知名的Python库用于可扩展特征工程

KDnuggets
KDnuggets · 2026-01-27T14:25:00Z
5个实用的Python脚本用于有效的特征工程

特征工程可以通过五个Python脚本自动化,提升模型性能。这些脚本包括分类特征编码、数值特征转换、特征交互生成、时间特征提取和特征选择,简化机器学习项目中的复杂工作。

5个实用的Python脚本用于有效的特征工程

KDnuggets
KDnuggets · 2026-01-13T13:00:14Z
导致机器学习项目失败的5个关键特征工程错误

特征工程是机器学习成功的关键,但常见错误可能导致项目失败。文章指出五个主要问题:数据泄露、维度陷阱、目标编码陷阱、异常值管理不当和模型特征不匹配。理解并解决这些问题,有助于提升模型在生产中的表现,避免复杂性,确保特征有效性。

导致机器学习项目失败的5个关键特征工程错误

KDnuggets
KDnuggets · 2025-12-04T13:00:20Z
中级机器学习从业者必备的5个Python脚本

本文介绍了五个Python脚本,旨在简化机器学习工程师的重复性任务,包括自动特征工程管道、超参数优化管理器、模型性能调试器、交叉验证策略管理器和实验跟踪器。这些工具提高了数据预处理、超参数调优和模型性能分析的效率,使工程师能够专注于模型构建。

中级机器学习从业者必备的5个Python脚本

MachineLearningMastery.com
MachineLearningMastery.com · 2025-11-13T11:00:54Z
专家级特征工程:高风险模型的高级技术

本文介绍了三种高级特征工程策略:反事实特征、领域约束表示和因果不变特征,旨在构建稳健且可解释的高风险模型,适用于金融和医疗等关键领域。

专家级特征工程:高风险模型的高级技术

MachineLearningMastery.com
MachineLearningMastery.com · 2025-11-11T11:00:09Z
利用LLM嵌入进行文本数据的7个高级特征工程技巧

大型语言模型(LLMs)不仅能理解和生成文本,还能将文本转化为数值嵌入。本文介绍了七种高级Python示例,利用LLM生成的嵌入来增强文本特征工程,从而提高情感分析和主题分类等任务的准确性和鲁棒性。

利用LLM嵌入进行文本数据的7个高级特征工程技巧

MachineLearningMastery.com
MachineLearningMastery.com · 2025-10-29T15:44:41Z
10个Python一行代码生成时间序列特征

本文介绍了10种Python一行代码生成时间序列特征的方法,强调特征工程在时间序列预测中的重要性。这些方法包括滞后特征、滚动均值和差分等,旨在提取数据的时间行为特征,以分析趋势和波动。

10个Python一行代码生成时间序列特征

MachineLearningMastery.com
MachineLearningMastery.com · 2025-10-27T14:25:18Z
利用大型语言模型(LLMs)进行结构化数据的五种高级特征工程技术

本文探讨了如何利用大型语言模型(LLMs)进行特征工程,通过将结构化数据与文本结合,提升下游模型性能。介绍了生成语义特征、智能缺失值填补、领域特定特征构建、混合嵌入空间和特征选择等五种技术,旨在提高数据处理的智能化和解释性。

利用大型语言模型(LLMs)进行结构化数据的五种高级特征工程技术

MachineLearningMastery.com
MachineLearningMastery.com · 2025-10-22T14:41:10Z
大数据成矿预测系列(五) | 告别特征工程:卷积神经网络(CNN)如何实现“端到端”成矿预测

机器学习为地质学家寻找矿产资源提供了新方法,卷积神经网络(CNN)能够直接处理原始地质数据并自动提取特征,克服了传统方法的局限性。然而,CNN仍需大量高质量数据,且决策过程不透明,存在“黑箱”问题。

大数据成矿预测系列(五) | 告别特征工程:卷积神经网络(CNN)如何实现“端到端”成矿预测

Seraphineの小窝
Seraphineの小窝 · 2025-10-21T07:21:45Z
文本数据的七种特征工程技巧

本文介绍了七种文本特征工程技巧,以帮助机器学习和深度学习模型处理文本。这些技巧包括去除停用词、词干提取、词袋模型、TF-IDF、n-grams、清洗和标记化,以及词嵌入,旨在将原始文本转化为机器可读的数值特征。

文本数据的七种特征工程技巧

MachineLearningMastery.com
MachineLearningMastery.com · 2025-10-16T15:24:51Z
懒惰数据科学家的探索性数据分析指南

使用Python自动化工具可以在20%的时间内获得80%的探索性数据分析(EDA)洞察,帮助数据科学家节省时间并专注于结果解释。常用工具包括ydata-profiling、Sweetviz和AutoViz。尽管自动化有效,手动EDA在特征工程和假设检验中仍然不可或缺。

懒惰数据科学家的探索性数据分析指南

KDnuggets
KDnuggets · 2025-10-07T14:00:41Z
大型语言模型(LLMs)提升机器学习工作流程的五个关键方式

大型语言模型(LLMs)可以显著提升机器学习工作流程,主要体现在五个方面:生成合成数据以降低数据准备成本;提供特征工程建议以优化特征提取;通过代码生成和调试简化实验过程;促进团队间有效沟通以减少误解;自动化研究以跟踪最新进展并推动持续创新。这些应用帮助解决机器学习中的常见挑战。

大型语言模型(LLMs)提升机器学习工作流程的五个关键方式

MachineLearningMastery.com
MachineLearningMastery.com · 2025-08-29T12:56:42Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码