小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
LARYBench 发布:定义具身动作表征 ImageNet,首次度量从人类视频学习的泛化表征

本文介绍了LARYBench,一个用于评估隐式动作表征的基准系统,旨在提升机器人在不同环境中的泛化能力。LARYBench分析了大规模人类视频数据,提供超过一百万段标注视频,涵盖151种动作,支持多样化的机器人形态和操作场景。实验结果表明,通用视觉模型在动作泛化和控制精度上优于专门模型,强调了隐式动作表征的重要性。

LARYBench 发布:定义具身动作表征 ImageNet,首次度量从人类视频学习的泛化表征

美团技术团队
美团技术团队 · 2026-04-27T00:00:00Z

文章探讨金融公司如何在架构治理中引入AI,通过统一技术栈、构建平台能力和治理AI应用,实现AI的可复用性和管理。强调可观测性和度量在AI架构治理中的重要性,以确保AI效果和价值的量化,最终延伸治理方法论至AI,保持系统的可见性和可控性。

平台工程视角下的 AI 应用架构治理

phodal
phodal · 2026-02-05T03:39:00Z
Gitee 企业版效能度量全面升级:构建可衡量、可洞察、可优化的研发体系

Gitee 企业版推出新效能度量模块,专注于研发效率与有效性,提供系统化报表,帮助企业识别流程瓶颈与协作短板,提升研发洞察力和团队效率。

Gitee 企业版效能度量全面升级:构建可衡量、可洞察、可优化的研发体系

Gitee 官方博客
Gitee 官方博客 · 2026-01-26T06:46:45Z
打造智能化软件工厂:Gitee Insight 的 DevSecOps 度量实践

随着数字化转型,软件成为企业的核心竞争力。Gitee Insight 作为智能研发中枢,提供全面的研发度量与治理能力,解决数据孤岛和效能缺失问题,提升软件交付质量与效率,推动 DevSecOps 战略落地。

打造智能化软件工厂:Gitee Insight 的 DevSecOps 度量实践

Gitee 官方博客
Gitee 官方博客 · 2026-01-23T09:22:29Z
整合蛋白序列/三维结构/功能特征等数据,德国团队基于度量学习构建构建人类E3泛素连接酶「全景图」

研究团队对人类E3连接酶组进行了分类,整合多层次数据,利用度量学习方法识别E3家族关系及其功能,探索潜在药物靶点。这为E3连接酶的生物学功能理解和药物开发提供了新思路。

整合蛋白序列/三维结构/功能特征等数据,德国团队基于度量学习构建构建人类E3泛素连接酶「全景图」

HyperAI超神经
HyperAI超神经 · 2026-01-22T06:17:36Z
向量相似性解析:度量、算法与最佳基础设施

构建理解语义的AI应用需超越关键词匹配,依赖向量相似性。向量是表示数据的数字列表,能捕捉文本和图像的语义关系。选择合适的相似性度量和算法对处理大规模数据至关重要,常用的度量包括余弦相似性、点积和欧几里得距离。Redis支持高效的向量相似性搜索,适用于实时AI工作流。

向量相似性解析:度量、算法与最佳基础设施

Redis Blog
Redis Blog · 2025-12-18T00:00:00Z
我们构建的度量产品运作良好——但我们还是决定放弃并重新开始

Sentry在推出度量产品前两周决定停止项目,因传统时间序列度量无法满足开发者需求。经过重构,Sentry建立了基于事件的度量系统,解决了高维度和连接性问题,提升了开发者调试代码的效率。

我们构建的度量产品运作良好——但我们还是决定放弃并重新开始

Sentry Blog
Sentry Blog · 2025-11-19T00:00:00Z
谷歌推出LLM-Evalkit,以为提示工程带来秩序和度量

谷歌推出了LLM-Evalkit,这是一个基于Vertex AI SDK的开源框架,旨在简化大型语言模型的提示工程。该工具提供统一的数据驱动工作流程,支持无代码界面,促进技术与非技术团队的协作。框架已在GitHub发布,用户可利用谷歌的试用信用进行探索。

谷歌推出LLM-Evalkit,以为提示工程带来秩序和度量

InfoQ
InfoQ · 2025-10-20T17:55:00Z
跟随能量,寻找路径:基于能量模型的黎曼度量

本文提出了一种从预训练的能量模型(EBMs)直接推导黎曼度量的方法,以解决高维空间中数据点之间的最短路径问题。该方法定义了空间变化的距离,并计算遵循数据流形内在几何的测地线。研究表明,EBM推导的度量在高维设置中优于传统基线,推动了生成建模和仿真的几何驱动学习。

跟随能量,寻找路径:基于能量模型的黎曼度量

Apple Machine Learning Research
Apple Machine Learning Research · 2025-09-22T00:00:00Z

Brian Proffitt在CHAOSSCon演讲中探讨了开源的商业价值,强调企业应关注开源社区的健康指标与参与价值。他指出,上游开源项目与下游商业产品的关系,认为上游是价值放大器而非竞争对手。企业应通过清晰的品牌、客户反馈、成功案例和公开路线图来提升市场价值。

开源的度量指标和商业业务(演讲实录)

「开源之道」
「开源之道」 · 2025-09-17T03:41:45Z
反对使用度量指标来衡量开发者生产力的案例

在软件开发中,度量指标不应作为生产力的衡量工具。DORA指标旨在提升团队交付能力,而非评估个人表现。有效的度量应关注团队效率和流程健康,帮助识别问题并改善系统,而非单纯追求数字。设计度量时需明确需求,与相关方沟通,确保与业务成果相关联。

反对使用度量指标来衡量开发者生产力的案例

The New Stack
The New Stack · 2025-07-29T15:05:33Z

在使用dotTrace进行性能评测时,需要理解墙钟时间和线程时间。墙钟时间是线程的总时间,而线程时间则关注线程的实际活动时间。通过Win32 API可以获取这些时间数据,以帮助分析程序性能问题。

DotTrace系列:3. 时间度量之墙钟时间和线程时间

dotNET跨平台
dotNET跨平台 · 2025-06-24T00:00:39Z

本文介绍了使用dotTrace进行程序性能评测时的时间度量,包括墙钟时间和线程时间。墙钟时间记录线程的实际运行时间,使用Win32 API获取;线程时间则关注线程的活动时长。理解这两者的原理有助于分析程序性能问题。

DotTrace系列:3. 时间度量之墙钟时间和线程时间 - 一线码农

一线码农
一线码农 · 2025-06-23T02:18:00Z

本研究解决了在发展项目中进行实地数据收集面临的挑战,尤其是在数字设备不易获得的情况下。我们提出了一种基于深度学习的方法,通过OCR和OMR技术自动数字化纸质数据,并成功应用于一项旨在提高农村女性健康意识的项目,推动了近400万通电话的发送。该项目的数据、模型和代码已开源,具有重要的社会影响。

利用度量学习进行手写数字识别及其在语音通信平台推广中的应用

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-26T00:00:00Z

本研究解决了检索增强生成(RAG)系统评估中组件间复杂相互作用造成的挑战,导致现有基准稀缺的问题。我们提出了MIRAGE,一个专为RAG评估设计的问题回答数据集,提供了7,560个实例,并映射至37,800个条目的检索池,同时引入新评估指标以测量RAG的适应性。研究发现优化模型对齐及RAG系统内部动态提供了新见解。

MIRAGE:用于检索增强生成评估的度量密集基准

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-23T00:00:00Z

本研究提出了一种新方法SyCAM,解决了现有类激活映射(CAM)在生成热图时灵活性不足的问题。SyCAM通过预定义评估度量自动生成优化的CAM表达式,提升了热图的针对性和有效性。实验结果表明,SyCAM在不同CNN模型上表现优异。

基于度量的类激活映射合成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-14T00:00:00Z

本文提出了一种新颖的傅里叶切片-瓦瑟斯坦嵌入方法,能够有效地将多重集嵌入欧几里得空间,保持切片瓦瑟斯坦距离,从而改善多重集的表示效果并提升学习任务的表现。

傅里叶切片-瓦瑟斯坦嵌入用于多重集和度量

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-03T00:00:00Z

本研究解决了在生物医学领域机器生成图像评价中的定量评估困难问题。通过引入Tversky指数作为一种新的评估方法,作者证明了它对生成图像质量的定性评估比传统的方法更为直观,有助于在关键任务场景中进行有效的图像质量评估。

基于计数相似度度量的机器生成生物医学图像评估

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-28T00:00:00Z

本研究解决了基于沙普利值的责任度量在数据复杂度方面的计算难题,特别是对于非数值查询的应用。提出了一种新的责任度量家族——加权最小支持和(WSMS),该度量在概念上简单且可以有效计算,能够对大类查询提供可行的解决方案。重要的是,WSMS度量不仅满足直观属性,还能够以沙普利值的形式等同于一个适当定义的合作博弈,从而为传统方法提供了一个重要的替代方案。

重新审视沙普利:可处理的查询答案责任度量

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-28T00:00:00Z

本研究分析了24个面部表情识别(FER)数据集,提出了新指标,发现大规模自动收集的数据集在泛化能力上更优,并为数据集的选择和设计提供了建议,以促进FER系统的发展。

评估深度学习的人脸表情识别数据集:一种具有新颖相似度度量的基准研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-26T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码