小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本文讨论了量化特征仓库的构建,强调时间正确性(PIT)和版本管理的重要性。特征存储需解决复用、版本化和训练-服务一致性的问题,避免数据修订导致的回测失效。采用双时间维度模型,确保在任意历史时刻能准确还原特征值。文章还介绍了特征存储的技术选型及工程实现,强调监控和回填机制的重要性,以确保数据的可靠性和一致性。

【量化交易】特征存储与时间对齐:point-in-time 正确性

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-05-01T00:00:00Z
基于倾向评分的产品实验:Python中LLM特征的因果推断

文章讨论了在基于大型语言模型(LLM)的产品中,用户选择新功能(如AI助手)时的偏差问题。重度用户更倾向于尝试新功能,导致比较结果失真。为解决这一问题,文章介绍了倾向评分方法,通过统计工具消除选择偏差,准确评估功能效果,并提供具体步骤和代码示例,帮助数据科学家在产品实验中应用这些方法。

基于倾向评分的产品实验:Python中LLM特征的因果推断

freeCodeCamp.org
freeCodeCamp.org · 2026-04-30T23:01:26Z
C# OnnxRuntime 部署 DINOv3 密集特征可视化

本文介绍了基于ONNX的图像特征提取模型dinov3_vitl16的实现,用户可以加载图像并提取特征,同时生成相似度热力图。文章详细阐述了模型的输入输出、特征提取过程及相关图像处理方法。

C# OnnxRuntime 部署 DINOv3 密集特征可视化

dotNET跨平台
dotNET跨平台 · 2026-04-28T00:01:35Z

风控是支付系统的核心,确保资金安全。文章探讨构建风控引擎的六个子系统,包括规则引擎、名单、用户画像、图分析和模型推理。强调实时性和延迟预算,介绍决策编排和Champion-Challenger策略,以确保风控决策的有效性与合规性,并展示行业案例和技术选型,突显风控在金融科技中的重要性。

【金融科技工程】十九:实时风控引擎——规则、特征、模型、决策流与 Flink/Spark

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-22T00:00:00Z
SafetyPairs:通过反事实图像生成隔离安全关键图像特征

本文介绍了SafetyPairs框架,生成仅在安全特征上不同的图像对,以区分安全与不安全的图像。通过图像编辑模型进行针对性修改,构建了一个包含3020个图像的安全基准,提升了视觉语言模型的评估能力,并改善了轻量级模型的训练效率。

SafetyPairs:通过反事实图像生成隔离安全关键图像特征

Apple Machine Learning Research
Apple Machine Learning Research · 2026-03-24T00:00:00Z
您下一个机器学习模型的七个可读性特征

本文介绍了如何使用Textstat Python库提取七种文本可读性和复杂性特征,包括Flesch可读性、Flesch-Kincaid年级水平、SMOG指数、Gunning Fog指数、自动可读性指数、Dale-Chall可读性评分和共识评分。这些指标有助于分析文本的可读性,支持机器学习模型的分类或回归任务。

您下一个机器学习模型的七个可读性特征

MachineLearningMastery.com
MachineLearningMastery.com · 2026-03-18T14:01:29Z
特征库全解

特征库是集中管理数据特征的平台,起源于2017年Uber,旨在简化数据管道。它们在机器学习和AI中变得重要,支持实时数据特征,促进特征重用,避免重复工作。流行工具包括Feast、Tecton和Google Cloud Vertex AI特征库。

特征库全解

KDnuggets
KDnuggets · 2026-02-16T17:00:51Z
ShareChat每秒处理十亿个特征,随后需要将成本降低10倍

ShareChat团队成功将实时特征存储的处理能力从每秒100万特征提升至10亿特征,并通过优化数据库架构、清理资源和迁移至ScyllaDB等方法,实现了成本降低10倍,同时保持系统性能。

ShareChat每秒处理十亿个特征,随后需要将成本降低10倍

The New Stack
The New Stack · 2026-02-12T14:00:08Z
Persona Vectors:语言模型中角色特征的监控与调控

本文介绍了通过提取大语言模型中的人格特质向量来监控和控制模型行为的方法。该方法在内容审核和安全对齐方面具有重要应用价值,研究展示了如何自动提取人格向量,并在模型推理和微调中进行干预,以防止人格漂移和筛选训练数据。

Persona Vectors:语言模型中角色特征的监控与调控

实时互动网
实时互动网 · 2026-02-03T03:26:36Z
整合蛋白序列/三维结构/功能特征等数据,德国团队基于度量学习构建构建人类E3泛素连接酶「全景图」

研究团队对人类E3连接酶组进行了分类,整合多层次数据,利用度量学习方法识别E3家族关系及其功能,探索潜在药物靶点。这为E3连接酶的生物学功能理解和药物开发提供了新思路。

整合蛋白序列/三维结构/功能特征等数据,德国团队基于度量学习构建构建人类E3泛素连接酶「全景图」

HyperAI超神经
HyperAI超神经 · 2026-01-22T06:17:36Z
DualVLN——基于像素目标点的双系统VLN基础模型:VLM做全局规划且预测中期路径,DiT策略头依托高频RGR输入和“来自VLM的低频潜在特征”生成动作轨迹

本文回顾了作者创业11年的历程,并介绍了上海AI LAB发布的DualVLN模型。该模型结合视觉-语言导航推理与实时控制,采用双系统架构,分别负责高层推理和低层动作执行,提升了动态环境中的导航能力。实验结果表明,DualVLN在多种场景中表现优异,成功率高,导航误差低。

DualVLN——基于像素目标点的双系统VLN基础模型:VLM做全局规划且预测中期路径,DiT策略头依托高频RGR输入和“来自VLM的低频潜在特征”生成动作轨迹

结构之法 算法之道
结构之法 算法之道 · 2026-01-19T10:48:45Z
避免过拟合、类别不平衡与特征缩放问题:机器学习从业者的笔记本

机器学习面临过拟合、类别不平衡和特征缩放等挑战。过拟合可通过交叉验证检测,增加训练数据可改善模型表现。类别不平衡可通过调整类权重和重采样策略解决。特征缩放确保输入特征对模型训练的贡献均衡。理解这些问题及其解决方案是提升模型性能的关键。

避免过拟合、类别不平衡与特征缩放问题:机器学习从业者的笔记本

KDnuggets
KDnuggets · 2026-01-14T14:56:26Z
Twitter 推荐算法核心揭秘:个性化推荐与高性能特征生成 | 开源日报 No.844

the-algorithm 是 Twitter 的推荐算法源代码,负责动态内容推送,支持个性化推荐。style-aligned 用于生成风格对齐图像,兼容 SDXL 和 ControlNet。cherry-markdown 是轻量级 Markdown 编辑器,支持多种编辑模式。HierSpeech++ 是零-shot 语音合成系统,提供高质量的 TTS 和 VC 功能。LucidDreamer 用于生成 3D 场景。

Twitter 推荐算法核心揭秘:个性化推荐与高性能特征生成 | 开源日报 No.844

开源服务指南
开源服务指南 · 2026-01-08T07:35:57Z
OpenCVSharp:在实际应用中使用 KAZE 算法进行特征匹配

本文介绍了如何在OpenCV中使用特征检测算法,通过读取两张图像,检测关键点并计算描述符,利用KNN进行特征匹配,最后通过投票机制及尺度、方向过滤绘制匹配结果和对象边界。

OpenCVSharp:在实际应用中使用 KAZE 算法进行特征匹配

dotNET跨平台
dotNET跨平台 · 2025-12-20T00:46:35Z
驱动Dropbox Dash实时AI的特征存储解析

Dropbox Dash利用AI整合文件、聊天和公司内容,提升工作效率。其特征存储系统通过实时机器学习快速找到相关文件,并支持用户行为分析,确保搜索结果的及时性和准确性。Dash的架构设计兼顾实时与批处理,优化特征检索速度,保持数据新鲜度,提升用户体验。

驱动Dropbox Dash实时AI的特征存储解析

Dropbox Tech Blog
Dropbox Tech Blog · 2025-12-18T18:00:00Z
OpenCVSharp:了解几种特征检测

本文介绍了OpenCVSharp中的多种特征检测算法,包括FAST、FREAK、KAZE、AKAZE和Star。FAST算法快速识别特征点,适合实时处理;FREAK生成高效的二进制描述符;KAZE和AKAZE通过非线性扩散提高鲁棒性和速度;Star检测器通过多尺度分析识别关键点,适用于图像配准和物体识别。

OpenCVSharp:了解几种特征检测

dotNET跨平台
dotNET跨平台 · 2025-12-15T23:50:43Z
针对非结构化文本数据的三种特征工程技术

本文介绍了将原始文本转换为机器学习模型可用的数值特征的方法,包括TF-IDF、GloVe词嵌入和基于变换器的嵌入。TF-IDF通过词频和文档频率突出文档独特性;GloVe通过词向量捕捉语义;变换器模型(如BERT)提供上下文感知的表示。选择方法需根据具体需求和资源限制。

针对非结构化文本数据的三种特征工程技术

MachineLearningMastery.com
MachineLearningMastery.com · 2025-12-12T16:09:37Z

这段代码展示了如何在Rust中处理可变引用和类型转换。定义了结构体My及其从i32引用的转换实现,并提供了两个特征MyInto0和MyInto1,用于不同的转换方式。

Discovering an Interesting Difference in Generic Inference

Rust.cc
Rust.cc · 2025-12-10T10:02:37Z
蓝牙低能耗设备的工作原理:GATT服务与特征解析

GATT(通用属性配置文件)是蓝牙低能耗设备交换信息的结构,定义了数据的存储、格式和访问方式,使不同制造商的设备能够互操作,如心率带与健身车的连接。理解GATT后,蓝牙通信和应用开发变得更加简单直观。本文探讨了GATT的工作原理、服务和特征的组织方式,以及如何构建BLE应用。

蓝牙低能耗设备的工作原理:GATT服务与特征解析

freeCodeCamp.org
freeCodeCamp.org · 2025-12-03T17:57:50Z
语义正则表达式:使用结构化语言自动解释大型语言模型特征

本文介绍了语义正则表达式(semantic regexes),一种将大型语言模型(LLM)特征转化为人类可理解的结构化语言。与自然语言描述相比,语义正则表达式提供了更精确、一致的特征描述,并支持对特征复杂性的量化分析。用户研究表明,语义正则表达式有助于准确理解LLM特征激活。

语义正则表达式:使用结构化语言自动解释大型语言模型特征

Apple Machine Learning Research
Apple Machine Learning Research · 2025-12-03T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码