CUA 开源了:训练 AI 操控电脑的基础设施长什么样

去年 Claude Code 出圈的时候,大家就在讨论 Computer-Use Agent 这个方向。现在 CUA(Computer-Use Agents)方向终于有了开源基础设施。

CUA 是什么

CUA 是一个开源项目,包含三块核心能力:

data-ad-format="fluid" data-ad-layout-key="-7k+ex-4a-9w+4a">

Sandbox:为 AI Agent 提供隔离的桌面环境。跑自动化任务的时候不用担心把系统搞崩。

SDK:直接对接主流 Agent 框架,不用自己写底层对接代码。

Benchmarks:一套评测标准,衡量你的 Agent 到底能不能稳定完成桌面任务。

实测效果

我拿官方提供的示例跑了几个场景:

  • 自动填表:成功率约 70%,复杂交互会卡住
  • 跨应用操作(比如从浏览器复制数据到 Excel):基本可用
  • 长任务(5分钟以上):容易跑偏,需要加监控

和 Claude Code 比怎么样

如果你已经在用 Claude Code,CUA 的价值在于本地化部署自定义训练。不想把数据送出去的公司可以用这套自建。

18k star 不是白来的,工业界确实有需求。


适合谁用:需要自建 AI 自动化流程的团队,或者想研究 Agent 底层能力的开发者。

data-ad-format="auto" data-full-width-responsive="true">