小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

“豆包手机”助手基于字节的UI-TARS模型,能够自动执行复杂任务。核心技术已开源并经过多次迭代,提升了性能和交互能力。尽管存在权限争议,官方强调用户需主动授权。用户体验反馈积极,展现出手机智能化的潜力。

起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机”

量子位
量子位 · 2025-12-09T07:51:19Z
字节版Operator抢跑OpenAI? 直接免费开源, 网友:怒省200美元!

OpenAI发布了Computer Use智能体Operator,标志着智能体时代的到来。字节跳动的UI-TARS已开源,具备高度智能和自主思考能力,支持多平台操作,并在任务成功率上超越同类产品,推动智能体技术发展。

字节版Operator抢跑OpenAI? 直接免费开源, 网友:怒省200美元!

机器之心
机器之心 · 2025-01-26T09:41:17Z
UI-TARS:利用长期记忆和反思调整不断优化

字节跳动发布的UI-TARS是基于Qwen2-VL微调的自动化GUI交互智能体,经过三阶段训练,支持中英文图片和指令。该模型训练数据量大,涵盖多种感知任务,提升了推理能力和动态适应性。模型已开源,但数据和训练代码未公开。

UI-TARS:利用长期记忆和反思调整不断优化

NotionNext BLOG
NotionNext BLOG · 2025-01-24T00:00:00Z

该研究提出了一种新型图形用户界面代理模型UI-TARS,增强了感知能力和统一行动建模,表现优异,减少了对人为干预的依赖。

UI-TARS: A New Paradigm for Automated Graphical User Interface Interaction

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-21T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码