小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

WordPress推出了Presence API插件,旨在实现多人在线状态感知,解决后台协作中的编辑冲突问题。该插件可实时显示在线用户和编辑状态,并通过REST API接口支持更多应用,为古腾堡编辑器的实时协作功能奠定基础,提升团队协作效率。

WordPress 官方推出 Presence API 插件:实现多人在线状态与编辑感知,为将来协作功能铺路

WordPress 果酱
WordPress 果酱 · 2026-04-29T14:21:54Z
OpenMOSS发布MOSS-Audio:一个用于语音、声音、音乐和时间感知音频推理的开源基础模型

MOSS-Audio是一个开源音频理解模型,集成了语音转录、情感分析和环境声音理解等功能。其模块化设计包括音频编码器和大型语言模型,采用DeepStack跨层特征注入和时间感知表示技术,显著提升了音频处理能力。MOSS-Audio-8B-Thinking在音频理解基准测试中表现优异,准确率达到71.08%。

OpenMOSS发布MOSS-Audio:一个用于语音、声音、音乐和时间感知音频推理的开源基础模型

实时互动网
实时互动网 · 2026-04-28T03:00:32Z
StereoFoley:基于视频的对象感知立体音频生成

本文介绍了StereoFoley框架,该框架能够从视频生成语义对齐、时间同步和空间准确的立体音频。该模型克服了现有数据集的限制,通过合成数据生成管道实现对象感知的立体声音。研究还引入了立体对象感知度量,并通过人类听觉研究验证了其有效性,建立了视频到音频生成的新基准。

StereoFoley:基于视频的对象感知立体音频生成

Apple Machine Learning Research
Apple Machine Learning Research · 2026-04-28T00:00:00Z
图达通在北京车展展示全矩阵激光雷达及感知方案

图达通在2026北京国际汽车展上展示了全矩阵激光雷达及感知方案,涵盖猎鹰、灵雀、蜂鸟三大平台,支持L2至L4级自动驾驶。猎鹰K3激光雷达探测距离达900米,识别小型物体能力显著提升。灵雀系列提供多种激光雷达产品,蜂鸟平台具备超广视场和灵活调节优势。此外,图达通还展示了结合AI算法的智能交通管理平台。

图达通在北京车展展示全矩阵激光雷达及感知方案

全球TMT-美通国际
全球TMT-美通国际 · 2026-04-24T08:27:24Z
HTD——基于触觉预测的人形行走-操作框架:融合视觉、本体感知、力反馈、触觉,同时预测动作、未来手部关节受力、由EMA目标编码器监督的未来触觉潜变量

本文探讨了人形机器人在“行走-操作”任务中的挑战,提出了一种集成式全身操控系统,结合强化学习、VR遥操作和触觉感知。研究者开发了具身触觉梦境的Transformer(HTD),通过多模态学习提升机器人对接触状态的理解和反应能力,简化了学习过程,旨在提高人形机器人的操作能力和灵活性。

HTD——基于触觉预测的人形行走-操作框架:融合视觉、本体感知、力反馈、触觉,同时预测动作、未来手部关节受力、由EMA目标编码器监督的未来触觉潜变量

结构之法 算法之道
结构之法 算法之道 · 2026-04-23T10:29:30Z

传统认证系统存在安全隐患,风险感知认证(RBA)和自适应多因素认证(Adaptive MFA)通过动态评估风险来提升安全性。RBA根据用户行为、设备和地理位置等信号进行评分,确保高风险操作得到更强的验证。本文探讨了RBA的信号来源、评分模型及实施挑战,强调用户体验与安全的平衡。

【身份与访问控制工程】风险感知认证:设备信任、异常登录与挑战升级

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-21T00:00:00Z

Cloudflare推出新的沙箱功能,允许用户在安全环境中运行AI代理。该功能通过出站工作者实现灵活连接和安全身份验证,支持动态控制和零信任机制,确保代理在执行任务时保护敏感信息。

动态、身份感知和安全的沙箱认证

The Cloudflare Blog
The Cloudflare Blog · 2026-04-13T13:00:00Z

这篇综述论文探讨了具身人工智能(AGI)的五个演化阶段(L1-L5),强调与物理环境的互动。研究者认为,真正的AGI应具备感知、行动能力,并能在开放环境中持续学习和适应。论文为未来十年AGI的发展提供了技术路线图和理论支持。

一分钟读论文:《迈向具身 AGI:具身 AI 综述与未来之路》

Micropaper
Micropaper · 2026-04-09T00:00:00Z

赫尔佐格探讨了旧石器时代人类灵性与环境的关系,强调流动性和渗透性,认为人类与自然的连接体现了灵性。通过肖维岩洞的壁画,揭示古人类的梦想与情感,质疑过去是否真的消失,强调感知与灵性的重要性。

观后:《忘梦洞》

素生
素生 · 2026-04-06T08:57:14Z
瑞声科技公开人形机器人感知解决方案,释放机器人业务加速落地信号

瑞声科技在焉知机器人大会上展示了其人形机器人感知解决方案,强调机器人需具备“听得见、听得懂、能自然交互”的能力。随着行业向工程化发展,市场对供应链的要求提升,关注系统能力与稳定交付。瑞声科技将声学领域的经验应用于机器人,推动技术与业务的双重进展。

瑞声科技公开人形机器人感知解决方案,释放机器人业务加速落地信号

量子位
量子位 · 2026-03-31T06:06:40Z
RLT——VLA引导的在线RL:极简MLP结构的Actor-Critic在“VLA浓缩Token感知与VLA参考动作先验”的双重加持下进行在线快速微调,最终从粗到细搞定拧螺丝和充电器插入

本文讨论了一种轻量级的在线强化学习方法,用于微调视觉-语言-动作模型。研究者通过引入“RL token”提高样本效率,使得模型能够快速适应真实世界任务。该方法结合冻结的VLA和小型actor-critic网络,优化关键任务阶段的表现,旨在实现高效的在线微调,同时保持泛化能力。

RLT——VLA引导的在线RL:极简MLP结构的Actor-Critic在“VLA浓缩Token感知与VLA参考动作先验”的双重加持下进行在线快速微调,最终从粗到细搞定拧螺丝和充电器插入

结构之法 算法之道
结构之法 算法之道 · 2026-03-26T03:44:34Z
用于3D高斯点云的即插即用感知优化

3D高斯点云(3DGS)方法常依赖于像素级损失,导致渲染模糊。研究发现,正则化的Wasserstein失真(WD-R)在恢复细节方面表现优异,超越传统3DGS损失和当前最佳方法。WD-R在多个数据集上实现了最先进的感知质量,并在3DGS场景压缩中节省了约50%的比特率。

用于3D高斯点云的即插即用感知优化

Apple Machine Learning Research
Apple Machine Learning Research · 2026-03-26T00:00:00Z
青蛙皮肤细胞xenobot:实现感知行为与记忆机制的底层逻辑

科学家通过结合青蛙的皮肤细胞和神经细胞,创造了名为Xenobot的生物机器人。这些机器人能够自我组织、游泳、感知环境、做出决策并记忆,尽管没有大脑,仍能通过细胞间的化学信号展现复杂行为。这项研究为合成生物学和再生医学提供了新方向。

青蛙皮肤细胞xenobot:实现感知行为与记忆机制的底层逻辑

极道
极道 · 2026-03-22T12:01:00Z
CMIC:使用具有冗余感知的状态空间模型压缩图像 | ICLR 2026

本文提出了一种动态状态空间模型Content-Aware Mamba(CAM),并基于此构建了图像压缩模型CMIC。CMIC通过内容自适应token重排和全局先验提示,增强了长距离冗余建模能力,在多个数据集上实现了SOTA性能。

CMIC:使用具有冗余感知的状态空间模型压缩图像 | ICLR 2026

实时互动网
实时互动网 · 2026-03-17T03:26:07Z
德州仪器与英伟达合作加速人形机器人安全部署

德州仪器与英伟达合作,结合TI的电机控制和传感技术与英伟达的计算能力,提升人形机器人的感知与安全功能。通过NVIDIA Holoscan Sensor Bridge,TI整合毫米波雷达与Jetson Thor平台,实现低延迟3D感知,增强目标检测与跟踪能力。

德州仪器与英伟达合作加速人形机器人安全部署

全球TMT-美通国际
全球TMT-美通国际 · 2026-03-10T06:59:21Z
一分钟读论文:《全球AI感知准备度指数公布,无国做好应对准备》

一项研究显示,全球对人工智能的意识准备程度严重不足,31个国家中无一达到中等水平。英国得分49分最高,但仍属部分准备。研究指出,尽管对意识的科学理解丰富,实际准备却不足,亟需建立治理能力。

一分钟读论文:《全球AI感知准备度指数公布,无国做好应对准备》

Micropaper
Micropaper · 2026-03-06T11:42:00Z
PVE 配置 VLAN 感知

文章介绍了如何配置交换机和PVE以支持虚拟机的VLAN,包括设置多个VLAN接口、Trunk口和Access口,以及在PVE中创建Linux Bridge和Linux VLAN,确保虚拟机正确接入所需VLAN。

PVE 配置 VLAN 感知

泠泫凝的异次元空间
泠泫凝的异次元空间 · 2026-02-27T02:58:47Z
基于初步6G基础架构,InterDigital与土耳其电信实现协作蜂窝与Wi-Fi感知技术部署

InterDigital与土耳其电信公司合作,成功部署全球首创的协作蜂窝与Wi-Fi感知技术,提升了感知精度和服务连续性。该技术将在2026年MWC26展示,标志着6G系统的重要进展。

基于初步6G基础架构,InterDigital与土耳其电信实现协作蜂窝与Wi-Fi感知技术部署

全球TMT-美通国际
全球TMT-美通国际 · 2026-02-25T06:15:47Z
InterDigital将在MWC26展示AI与感知技术

InterDigital将在2026年MWC展示其在人工智能、无线通信和视频领域的创新,重点包括AI远程操控技术及与土耳其电信的6G合作。

InterDigital将在MWC26展示AI与感知技术

全球TMT-美通国际
全球TMT-美通国际 · 2026-02-24T06:37:35Z
X-VLA——基于Soft Prompt的Transformer编码器练就可扩展的跨本体VLA:VLM做多模态感知,DiT-style做动作生成

本文介绍了一种新型机器人学习模型X-VLA,采用软提示技术以提升跨具身机器人学习的适应性和泛化能力。通过引入可学习的嵌入,X-VLA有效解决了不同硬件和任务环境下的异质性问题,增强了模型在多样化数据集上的表现。该模型在多个基准测试中表现优异,展现出在灵巧操作和适应新领域方面的强大能力。

X-VLA——基于Soft Prompt的Transformer编码器练就可扩展的跨本体VLA:VLM做多模态感知,DiT-style做动作生成

结构之法 算法之道
结构之法 算法之道 · 2026-02-21T05:00:30Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码