連登語言模型 LiLM,用AI回應連登貼文

279 回覆
1010 Like 37 Dislike
2024-07-14 16:02:20
多謝 嚟緊都會搞多啲 project 去做啲更 fundamental 同可以 monetize 嘅嘢,無奈香港啲 so-called AI 公司大部分都淨係喺度 call API
2024-07-14 16:03:17
可唔可以列到每個台佔training 百分比
2024-07-14 16:05:35
你以為其他人?其實全都是我
2024-07-14 16:09:15
用咗幾耐去fine tune個模型?
2024-07-14 16:11:48
照住嚟做啦直頭係
2024-07-14 16:12:28
樓主好勁
2024-07-14 16:13:54
有冇五毛留言Ai版?
想頂爛市搶佢哋份工
2024-07-14 16:14:14
利申 唔知會唔會爆token

2024-07-14 16:15:09
最終 version 有 2600 iterations,每個 iteration 50 秒左右,total 大概係一日半。

用得最耐時間係試唔同 model 同 data,包括兩個 70B 嘅 model 同埋更加大嘅 dataset,24 小時咁 run。試哂全部嘢兩部機 total 應該用咗 700 個鐘。
2024-07-14 16:15:16
開工搵錯字啦望,咪偷懶呀屌你老母
2024-07-14 16:16:28
屌過?
2024-07-14 16:16:39
我係睇到佢條片所以想做個連登 version,但同佢用嘅 approach唔同,可以睇返 github
2024-07-14 16:17:12
正在播放《韓子亮 TL HON - 留名系統啟動》

●────────────────
2024-07-14 16:17:29
有冇試過Mistral-7B-Instruct-v0.3?
2024-07-14 16:19:34
bot嚟
2024-07-14 16:21:01
same
2024-07-14 16:21:21
冇,以前用過呢個 model 嘅中文係不堪入目,所以冇試到
2024-07-14 16:23:26

最近有啲時間都研究緊Lin Yi 條片, 想開始做下
依家可以慳返了
2024-07-14 16:23:36
Qwen1.5-32B-Chat

Qwen模型全部都加咗審查, 好多有關中國嘅政治野唔會答.
2024-07-14 16:23:45
但無login個d留言睇唔到
會唔準wo
2024-07-14 16:23:53
又係B站抄
2024-07-14 16:24:28
啱啱睇返
幾時有人用lihkg train LLM
https://lih.kg/3709082
個post
原來你都係到
2024-07-14 16:24:52
我之前用Qwen想做個本地嘅翻譯ai,
一堆英語租口都唔比翻
2024-07-14 16:25:38
你用咩spec 嘅mac 機train?
2024-07-14 16:26:01
吹水台自選台熱 門最 新手機台時事台政事台World體育台娛樂台動漫台Apps台遊戲台影視台講故台健康台感情台家庭台潮流台美容台上班台財經台房屋台飲食台旅遊台學術台校園台汽車台音樂台創意台硬件台電器台攝影台玩具台寵物台軟件台活動台電訊台直播台站務台黑 洞