现在 browser-use ( browser agent )和 Omniparser (computer agent), 都是给 LLM 去识别并操作 UI 界面的能力。

但是将来的场景肯定是就一个 LLM 对话框跟用户交互,通过 MCP 直接调用美团、滴滴的后台接口,就可以完成订餐、打车、购票等高频场景。

让用户额外安装 app, 再通过 LLM 去操作手机/电脑上的可视化 UI 界面,完全没有必要了啊。

举报· 414 次点击
登录 注册 站外分享
3 条回复  
wyntalgeer 初学 5 天前
那你问问美团、滴滴舍不舍得砍掉他们的营销前台呢
scarlex 小成 5 天前
要不你先做一个出来,革掉大厂的命?
musi 初学 5 天前
要是大厂愿意把流量放出来你觉得你手机上还会有这么多 app?
返回顶部