連登語言模型 LiLM，用AI回應連登貼文

阿里是多德

280 回覆

1015 Like 37 Dislike

阿里是多德 2024-07-14 16:02:20

多謝

嚟緊都會搞多啲 project 去做啲更 fundamental 同可以 monetize 嘅嘢，無奈香港啲 so-called AI 公司大部分都淨係喺度 call API

章魚一味 2024-07-14 16:03:17

可唔可以列到每個台佔training 百分比

Dr.Strange 2024-07-14 16:05:35

你以為其他人？其實全都是我

射在人生邊上 2024-07-14 16:09:15

用咗幾耐去fine tune個模型？

衝動王 2024-07-14 16:11:48

照住嚟做啦直頭係

責任全在美方 2024-07-14 16:12:28

樓主好勁

吉良吉影二世 2024-07-14 16:13:54

有冇五毛留言Ai版？
想頂爛市搶佢哋份工

唔甜食乜鳩糖水 2024-07-14 16:14:14

利申唔知會唔會爆token

阿里是多德 2024-07-14 16:15:09

最終 version 有 2600 iterations，每個 iteration 50 秒左右，total 大概係一日半。

用得最耐時間係試唔同 model 同 data，包括兩個 70B 嘅 model 同埋更加大嘅 dataset，24 小時咁 run。試哂全部嘢兩部機 total 應該用咗 700 個鐘。

男神彭於硬 2024-07-14 16:15:16

開工搵錯字啦望，咪偷懶呀屌你老母

抖音真經 2024-07-14 16:16:28

屌過？

阿里是多德 2024-07-14 16:16:39

我係睇到佢條片所以想做個連登 version，但同佢用嘅 approach唔同，可以睇返 github

power_off 2024-07-14 16:17:12

正在播放《韓子亮 TL HON - 留名系統啟動》

●────────────────

依水利亞 2024-07-14 16:17:29

有冇試過Mistral-7B-Instruct-v0.3?

叮噹不要老 2024-07-14 16:19:34

bot嚟

On9con正傻閪 2024-07-14 16:21:01

same

阿里是多德 2024-07-14 16:21:21

冇，以前用過呢個 model 嘅中文係不堪入目，所以冇試到

2015 2024-07-14 16:23:26

最近有啲時間都研究緊Lin Yi 條片, 想開始做下
依家可以慳返了

青絲散 2024-07-14 16:23:36

Qwen1.5-32B-Chat

Qwen模型全部都加咗審查, 好多有關中國嘅政治野唔會答.

GPT-4 2024-07-14 16:23:45

但無login個d留言睇唔到
會唔準wo

黃寶妮 2024-07-14 16:23:53

又係B站抄

2015 2024-07-14 16:24:28

啱啱睇返
幾時有人用lihkg train LLM
https://lih.kg/3709082
個post
原來你都係到

青絲散 2024-07-14 16:24:52

我之前用Qwen想做個本地嘅翻譯ai,
一堆英語租口都唔比翻

尾丸ポルカ 2024-07-14 16:25:38

你用咩spec 嘅mac 機train?

去街街 2024-07-14 16:26:01

第 1 頁第 2 頁第 3 頁第 4 頁第 5 頁第 6 頁第 7 頁第 8 頁第 9 頁第 10 頁第 11 頁第 12 頁

吹水台自選台熱　門最　新手機台時事台政事台 World 體育台娛樂台動漫台 Apps台遊戲台影視台講故台健康台感情台家庭台潮流台美容台上班台財經台房屋台飲食台旅遊台學術台校園台汽車台音樂台創意台硬件台電器台攝影台玩具台寵物台軟件台活動台電訊台直播台站務台黑　洞