小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

去年8月,我们曾参加过《剑网3》的十六周年庆典。在现场,这款经典MMO放出了不少重点的未来规划,例如重内容和单人玩法的“前传企划”,还有大量围绕内容品质升级和玩法迭代的新规划,当时一度抬高了玩家与产品自身对于未来的想象。庆典结束两个月后,《剑网3》上线的年度资料片“山海源流”,已经算是给出了第一轮回答——全民可学的“江湖流派”无相楼正式落地,结合一系列旧有美术素材的重制,已经发布会上提出的“...

运营17年的《剑网3》,还在用最「务实」的姿态做新版本

游戏研究社
游戏研究社 · 2026-04-24T16:00:00Z
.NET 10 + YOLO 的多模型视觉平台:检测、分割、OBB、姿态全支持

基于.NET 10的多模型智能识别平台,集成YoloDotNet推理引擎和SQLite管理,支持多任务并行处理,适用于工业质检和边缘计算,简化AI集成过程。

.NET 10 + YOLO 的多模型视觉平台:检测、分割、OBB、姿态全支持

dotNET跨平台
dotNET跨平台 · 2025-12-30T23:58:35Z
三维视觉新突破:字节Seed推出DA3,实现任意视角重建视觉空间;7w+真实工业环境数据!CHIP 填补 6D姿态估计工业数据空白

字节跳动的Depth Anything 3(DA3)模型通过单一Transformer实现深度和姿态估计,简化了三维视觉任务的处理,并刷新了多项基准测试记录。

三维视觉新突破:字节Seed推出DA3,实现任意视角重建视觉空间;7w+真实工业环境数据!CHIP 填补 6D姿态估计工业数据空白

HyperAI超神经
HyperAI超神经 · 2025-12-23T06:09:54Z
三维视觉新突破:字节Seed推出DA3,实现任意视角重建视觉空间;7w+真实工业环境数据!CHIP填补6D姿态估计工业数据空白

Depth Anything 3(DA3)是字节跳动Seed团队推出的视觉几何模型,采用单一Transformer架构,简化多任务学习,能够从任意视角预测空间几何结构。实验表明,DA3在相机姿态和深度估计任务中表现优异,刷新多项性能记录。

三维视觉新突破:字节Seed推出DA3,实现任意视角重建视觉空间;7w+真实工业环境数据!CHIP填补6D姿态估计工业数据空白

HyperAI超神经
HyperAI超神经 · 2025-12-22T12:54:37Z
Video2Motion之GVHMR——基于重力-视角坐标的人体运动恢复:从RGB视频中提取人的SMPL轨迹(含人体姿态估计WHAM的详解)

本文探讨了WHAM和GVHMR模型在人体姿态估计中的应用。WHAM利用视频数据和RNN进行3D运动预测,优化脚接触感知;GVHMR在重力坐标系中恢复人体运动,减少误差累积,提高精度。

Video2Motion之GVHMR——基于重力-视角坐标的人体运动恢复:从RGB视频中提取人的SMPL轨迹(含人体姿态估计WHAM的详解)

结构之法 算法之道
结构之法 算法之道 · 2025-10-28T13:02:34Z
运动中的房间:无姿态室内3D物体检测作为定位与地图构建

本文介绍了一种名为“Rooms from Motion”(RfM)的新方法,用于无姿态图像的室内3D物体检测。RfM通过基于图像的3D框替代传统的2D关键点匹配,能够估计相机姿态和物体轨迹,生成高质量的语义3D物体地图。与现有方法相比,RfM在定位性能和地图质量上表现优异,适用于增强现实和机器人等领域。

运动中的房间:无姿态室内3D物体检测作为定位与地图构建

Apple Machine Learning Research
Apple Machine Learning Research · 2025-10-24T00:00:00Z
CPEP:对比姿态-肌电预训练提升基于肌电信号的手势泛化能力

本文介绍了一种对比姿态-肌电预训练(CPEP)框架,旨在提升基于肌电信号的手势分类性能。通过对低质量数据与高质量数据的对齐,CPEP提高了表示质量,实现了零样本分类。实验结果显示,该模型在已知手势分类上提高了21%,在未知手势分类上提高了72%。

CPEP:对比姿态-肌电预训练提升基于肌电信号的手势泛化能力

Apple Machine Learning Research
Apple Machine Learning Research · 2025-10-16T00:00:00Z

VideoMimic是一种通过单目视频学习人类动作并转化为类人机器人控制策略的方法。该系统能够重建人类及其环境,训练机器人在不同场景中自主执行动作,如上下楼梯和坐下。研究表明,VideoMimic在多样化环境中表现出良好的鲁棒性,未来将扩展应用以实现更复杂的人机交互。

一看视频就能学会的VideoMimic——三步走:先real2sim(涉及视频作为输入、提取姿态且点云化、重定向到G1上),后sim中训练,最后sim2real

结构之法 算法之道
结构之法 算法之道 · 2025-08-06T08:46:08Z

本文探讨了机器人在智能装配中的应用,介绍了Manual2Skill论文,强调机器人如何通过视觉语言模型(VLM)从手册中学习操作技能,实现自动化家具装配。该方法解析手册内容,生成分层装配图,并预测每个步骤的组件位姿,从而提高装配效率。

Manual2Skill——让VLM从装配手册中提取装配步骤,随后做姿态估计,最终完成IKEA家具的自动组装(含IKEA-Manuals的详解)

结构之法 算法之道
结构之法 算法之道 · 2025-08-01T17:14:51Z
憋了6年的剑与魔法开放世界动作游戏,以更成熟的姿态回来了

《红色沙漠》开发接近尾声,预计2025年底上线。游戏战斗系统简单易上手,玩家可通过组合按键施展华丽招式,BOSS战斗考验应变能力,整体体验良好。制作组积极改进,期待填补市场空白。

憋了6年的剑与魔法开放世界动作游戏,以更成熟的姿态回来了

游戏研究社
游戏研究社 · 2025-07-22T08:00:00Z

本研究解决了机器人辅助微创手术中手术工具姿态估计的适应性不足问题。提出了一种新的六自由度姿态估计管道,结合了最先进的零样本RGB-D模型和基于视觉的深度估计方法,显著提高了对未见手术工具的姿态估计准确性。实验表明,该方法超越了现有的基准,为手术工具的姿态估计设立了新的标准。

SurgPose:使用零样本学习和立体视觉的通用手术工具姿态估计

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-16T00:00:00Z

本研究探讨手影艺术中的逆问题,提出三阶段手影姿态生成管道,有效解耦解剖与语义约束,生成率超过85%,具有实用价值。

手影姿态生成器

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-11T00:00:00Z

本研究提出了一种名为P2P-Insole的低成本方法,通过集成IMU的鞋垫传感器估计和可视化3D人类骨骼数据,解决了现有高成本替代品的局限性。该方法借助变换器模型及多模态信息提高复杂运动模式识别的准确性,具有广泛的应用前景,特别是在康复、伤害预防和健康监测领域。

P2P-Insole: 利用脚部压力分布和运动传感器进行人体姿态估计

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-01T00:00:00Z

本研究提出了Pixel3DMM,通过预测每个像素的几何信息,从单幅RGB图像重建3D人脸模型。实验结果显示,该方法在姿态和表情的几何准确性上提升超过15%。

Pixel3DMM: A Versatile Screen Space Prior for 3D Face Reconstruction from a Single Image

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-01T00:00:00Z
DynPose-100K:大规模动态视频数据集与相机姿态

DynPose-100K是一个包含100,131个带相机姿态标注的动态视频数据集,旨在解决动态视频中的相机姿态估计问题,提供多样化的真实场景,推动视频生成和机器人技术的发展。

DynPose-100K:大规模动态视频数据集与相机姿态

DEV Community
DEV Community · 2025-04-30T09:16:38Z
学习者的姿态或许并不利于学习

文章探讨了学生身份对认知的影响,指出学校教育常导致对现实的偏差。学生依赖老师的知识,缺乏批判性思维,导致对工具和身份的误解。作者强调学习者应主动实践,而非仅停留在理论上,以通过实际使用掌握技能。

学习者的姿态或许并不利于学习

極客死亡計劃
極客死亡計劃 · 2025-04-06T02:35:25Z

本研究提出了一种基于上下文表示学习的运动预训练方法,有效解决了单目3D人姿态估计中的深度模糊和数据不足问题,显著提升了模型的时空关系理解能力,并在两个基准数据集上取得了优异性能。

基于上下文表示学习的双流Transformer-GCN模型用于单目3D人姿态估计

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-02T00:00:00Z

本研究解决了人类与物体交互中的力估算问题,传统方法需依赖昂贵的设备。我们提出的ForcePose框架创新性地将人类姿态估计与物体检测结合,利用深度学习实时预测力的大小和方向,且无需物理传感器。该方法在850个标注视频的测试中,表现出显著优势,开辟了在多种实际应用中进行力分析的新前景。

ForcePose:一种基于动作识别的深度学习力计算方法,结合了MediaPipe姿态估计和对象检测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-28T00:00:00Z
开源姿态检测演示

本文比较了姿态检测模型BlazePose、MoveNet和YOLO11的架构、技术特点及性能。BlazePose适用于复杂动作,MoveNet针对边缘设备进行了优化,YOLO11支持多任务应用。应用场景涵盖健身、医疗和工业,未来趋势为模型轻量化与跨平台集成。

开源姿态检测演示

DEV Community
DEV Community · 2025-03-22T23:59:20Z

本研究提出了一种双流架构和异步采样策略,以解决文本生成3D场景中的不稳定性问题,提升多视图生成的一致性和准确性。

VideoRFSplat:直接场景级文本到3D高斯点云生成,具备灵活的姿态和多视角联合建模

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-20T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码