Open source版嘅ComputerUse/Operator

大棍巴

3 回覆
0 Like 2 Dislike
大棍巴 2025-02-04 00:57:17
可以用其他visual model (OpenAI/Anthropic以外,例如Google Gemini,又或者Qwen 2.5 72B VLM)去自動控制你個browser

GitHub link:
https://github.com/browser-use/web-ui

示範:
https://www.reddit.com/r/LocalLLaMA/s/sYoNH0Xs0C

以後唔識programming都可以自動上網搶飛
網蛇 2025-02-04 01:13:05
Browse-use先係個underlying library
之前research過 我記得做一個普通objective都燒好多錢 (用GPT) 而且無得cache個action 所以下次做同一樣野又要prompt個LLM
佢地個approach似乎係highlight每一個可以interact既HTML element 之後比LLM簡邊個先可以邁向目標
好彩既話 用LLM本身既planning已經足夠
唔好彩既話會塞死左 甚至入左loop
MultiOn果d 用RL去train個LLM去plan
大棍巴 2025-02-04 01:15:16
原來我冇打到個library 名
多謝補充
吹水台自選台熱 門最 新手機台時事台政事台World體育台娛樂台動漫台Apps台遊戲台影視台講故台健康台感情台家庭台潮流台美容台上班台財經台房屋台飲食台旅遊台學術台校園台汽車台音樂台創意台硬件台電器台攝影台玩具台寵物台軟件台活動台電訊台直播台站務台黑 洞