当具身智能成为人工智能产业的下一个核心赛道,全球科技巨头纷纷加码布局,特斯拉Optimus、波士顿动力Atlas持续迭代,国内优必选、越疆等企业加速追赶。在这场技术与资本的双重博弈中,宇树科技作为国内高性能通用机器人领域的标杆企业,其IPO招股书披露的一组数据引发行业热议:2024年度,公司研发费用仅为9046.63万元。9000万什么概念?网传腾讯当初从OpenAI挖来姚顺雨花费了1亿元的...
阿维塔与华为深化合作,共同开发新款阿维塔12,该车搭载华为激光雷达,提升辅助驾驶能力,提供多种动力选择和高科技配置,整体升级显著,旨在优化智能驾驶与用户体验。
iCAR品牌专注于差异化汽车,V23销量曾佳但因市场变化下滑。新款V27在设计、空间和动力上有显著提升,采用增程动力,满足家庭需求。其智能驾驶系统和个性化配置增强了竞争力,期待3月15日上市时的定价能重振销量。
美团以约7.17亿美元收购叮咚买菜的中国业务,后者将成为全资子公司,旨在增强美团在华东市场的竞争力,并整合叮咚的供应链优势。叮咚创始人承诺未来五年不与美团竞争,此次收购将重塑中国即时零售行业格局。
英伟达以200亿美元收购Groq,以应对谷歌TPU的竞争。Groq的LPU在推理速度上优于GPU和TPU,但内存容量较小,需要多颗芯片协同工作。尽管成本较高,市场对速度的需求持续增长,英伟达希望借此提升推理能力,拓展业务。
作者在使用Atlas浏览器两周后发现,其创新在于将本地开发环境与AI整合,显著提升开发效率。尽管Atlas具备持久任务线程和本地服务读取等优势,但仍存在多页面推理、缺乏提示模板和移动版本等短板。总体来看,Atlas有潜力成为开发者的主要工具。
API安全是数字化业务的关键,但其脆弱性导致频繁的安全事件。常见风险包括身份验证不严、数据泄露和缺乏速率限制。为确保安全,需实施严格的身份验证和数据加密措施。
网络安全公司CrowdStrike在Fal.Con 2025大会上推出了两款新产品:Falcon补丁管理和Threat AI,旨在整合工作流程并提升企业防御能力。补丁管理解决了漏洞识别与修复的脱节问题,而Threat AI则自动化分析威胁,提高响应速度。这些产品支持AI驱动的安全防御体系,增强企业安全能力。
雷柏V700 DIY-98是一款性价比高的简约客制化键盘,配色多样,采用快银轴,适合游戏和办公。内置4000mAh电池,续航可达700-800小时,整体体验良好,适合大多数用户。
南洋理工大学与商汤合作推出PhysXNet,这是首个系统性标注的物理3D数据集,包含26,000个3D物体及其物理属性。该数据集填补了3D生成中物理属性的空白,并提出PhysXGen框架,实现从图像到3D资产的生成,推动3D资产在多个领域的应用。
清华大学团队提出了EscapeCraft,一个用于评估多模态大模型推理能力的3D密室逃脱环境。研究发现,顶级模型如GPT-4o在复杂任务中的逃脱成功率不足50%,凸显了推理过程的重要性。
上海AI Lab提出的POLAR新范式通过参考答案灵活打分,提升了强化学习中奖励模型的可扩展性和泛化能力,克服了传统模型的局限性,展现出显著的Scaling效应。
SeePhys新基准显示,当前顶尖AI模型在物理图像理解方面的准确率仅为55%。该基准涵盖从初中到博士的多模态物理问题,强调视觉信息对模型推理的重要性,揭示了多模态推理的巨大挑战。
机器之心数据服务现已上线,提供高效稳定的数据获取,简化数据爬取流程。
家庭应用在过去十年发展缓慢,功能有限。Controller for HomeKit 提供更强大的自动化和场景设置,支持多平台,需订阅使用,适合智能家居爱好者,提升使用体验。
《忍者龙剑传》系列探讨了动作游戏的演变与玩家体验。尽管设计上存在不足,但其独特的动作表现和战斗体验仍吸引了众多玩家。未来的动作游戏需兼顾硬核与广泛玩家的需求,以适应市场变化。
OpenAI最近更新了图像生成模型GPT-4o,支持复杂指令和中文输出,生成效果优于DALL-E 3。该模型允许多模态输入,提升了图像生成的一致性和速度,尽管艺术性略逊于MidJourney。用户可通过语音或文字生成个性化图像,未来将扩展API功能。
本文探讨了视觉语言模型(VLMs)在基础视觉线索关联能力上的表现,并提出了VLM²-Bench评测框架。研究发现,尽管VLMs在多图和视频处理上有所提升,但在视觉线索关联能力,尤其是人物识别任务中仍显不足。分析表明,语言和视觉中心的提示方法对模型性能有显著影响,并指出未来研究方向。
搜索引擎的竞争加剧,AI技术推动变革。用户习惯逐渐转向AI问答,传统搜索面临挑战。360推出纳米AI搜索,提升用户体验并整合多模态功能。未来AI搜索将重塑商业模式,传统搜索巨头需应对新挑战。
完成下面两步后,将自动完成登录并继续当前操作。