Open source版嘅ComputerUse/Operator
大棍巴
3 回覆
0 Like
2 Dislike
大棍巴
2025-02-04 00:57:17
可以用其他visual model (OpenAI/Anthropic以外,例如Google Gemini,又或者Qwen 2.5 72B VLM)去自動控制你個browser
GitHub link:
https://github.com/browser-use/web-ui
示範:
https://www.reddit.com/r/LocalLLaMA/s/sYoNH0Xs0C
以後唔識programming都可以自動上網搶飛
網蛇
2025-02-04 01:13:05
Browse-use先係個underlying library
之前research過 我記得做一個普通objective都燒好多錢 (用GPT) 而且無得cache個action 所以下次做同一樣野又要prompt個LLM
佢地個approach似乎係highlight每一個可以interact既HTML element 之後比LLM簡邊個先可以邁向目標
好彩既話 用LLM本身既planning已經足夠
唔好彩既話會塞死左 甚至入左loop
MultiOn果d 用RL去train個LLM去plan
大棍巴
2025-02-04 01:15:16
原來我冇打到個library 名
多謝補充
第 1 頁
吹水台
自選台
熱 門
最 新
手機台
時事台
政事台
World
體育台
娛樂台
動漫台
Apps台
遊戲台
影視台
講故台
健康台
感情台
家庭台
潮流台
美容台
上班台
財經台
房屋台
飲食台
旅遊台
學術台
校園台
汽車台
音樂台
創意台
硬件台
電器台
攝影台
玩具台
寵物台
軟件台
活動台
電訊台
直播台
站務台
黑 洞