X 阿 阿西_出海 5h ago · archived 3h ago 这个阿里的开源项目page-agent,能让你用自然语言控制网页界面,在 GitHub 已经斩获 18.7K star。 它把 AI agent 直接塞进网页里,然后你用自然语言指挥它点按钮、填表单、跳流程都行。 它不需要 headless 浏览器,不需要截图,不需要 OCR,也不需要多模态模型。 一行 script 标签,你的网站就有了一个 AI 副驾驶。