Agent Browser

长按二维码关注

一、基本信息

安装名:agent-browser

仓库来源:GitHub

二、功能简介

Agent Browser 用于让 WorkBuddy 直接进入网页并执行浏览器级操作,例如打开页面、滚动、点击、展开内容、截图和读取网页信息。对于必须交互后才能看到内容的页面,这个 Skill 能显著提升可访问性。

三、适用场景

需要滚动、点击或展开后才能读取内容的网页

需要自动截图指定页面

需要检查按钮、表单或页面结构

需要进入网站后抓取指定信息

四、推荐使用方式

直接描述目标页面、需要执行的操作和最终输出结果即可。

示例指令:

请打开这个网页,完整阅读需要展开和滚动后才能看到的内容,整理成结构化摘要,并为关键页面截图留档。

五、效果示意

可以看到,WorkBuddy 会模拟真实浏览行为,按步骤读取页面内容。

最终可输出结构化总结或整理后的文档结果。

六、使用建议

先说明目标页面:尽量提供明确链接与目标动作。

指定输出形式:可要求输出摘要、表格、截图或操作记录。

适合处理动态网页:尤其适合普通搜索难以完整获取内容的场景。

WorkBuddy

WorkBuddy 是腾讯推出的全场景职场 AI 智能体桌面工作台,面向各类职能角色设计。您只需用一句话描述需求,WorkBuddy 便能像同事一样自主规划和执行任务,并交付可验收的结果。

 

扫二维码

关注我们

不迷路^_^


我们愿景

城市更繁荣

乡村更美丽