連登語言模型 LiLM,用AI回應連登貼文

279 回覆
1010 Like 37 Dislike
2024-07-14 14:56:29
github 有 scraper 同 sample dataset,本身啲 data 300MB 放唔到上 github
2024-07-14 15:00:01
本身試過淨係用熱門,但效果唔好,所以最後嘅篩選條件係所有 >20 reaction 嘅 reply
2024-07-14 15:01:52
2024-07-14 15:03:10
其實我好想知呢個AI係點樣做到
有冇人可以解釋下
2024-07-14 15:05:47
09/07/2024:
棄用 Hugging Face transformer,轉用 MLX

可以講多少少呢度發生啲咩事?之前唔係用MLX?

另外,有冇寫過粵文?見你readme都用繁中,會唔會考慮改用粵文寫?
2024-07-14 15:12:35
Hugging Face transformer 唔支持 mlx 格式嘅 model,同埋用嗰陣需要手動加 attention mask,set parameters 例如 top p 同 temperature 都冇 mlx-lm 咁方便
2024-07-14 15:12:56
粵文即係口語?
2024-07-14 15:18:11
scraper 用邊隻 想要
2024-07-14 15:19:51
自己寫,可以睇下 github data.py 段 code,用 proxy 同 header 去 bypass IP ban
2024-07-14 15:20:10
有D弱智吧vs bilibili條片嘅感覺
2024-07-14 15:20:58
個model識唔識寫潮文
or 如果叫佢reply篇潮文會點
2024-07-14 15:21:05
你可以當住係先,而家都冇咩規範,但係唔寫就少流傳,網上冇咁多呢啲內容,將來都冇咁易train AI,咁未來就可能只有英文同簡中AI
2024-07-14 15:29:21
支持,望到人地 Bilibot 條片一路都想玩下,可惜自己能力做唔到
2024-07-14 15:30:01
你係肥絲大隻
2024-07-14 15:43:41
唔識寫,啲 data 淨係 post 同 comment 嘅 pair

有冇咩潮文 post 嘅例子?我試下
2024-07-14 15:49:06
LM
2024-07-14 15:49:46
lm
2024-07-14 15:49:51
Proxy 有無推薦用邊隻?
2024-07-14 15:51:31
Zyte,free trial 都夠 scrape 好多個 post,同埋放落個 code 到超方便
2024-07-14 15:53:25
強帖留名
2024-07-14 15:54:36
或者你叫佢回「一人一篇笑撚死嘅潮文」
再唔得就加埋context
「我先」之後求其俾d佢
2024-07-14 15:59:03
其實我好想知呢個AI係點樣做到
有冇人可以解釋下
2024-07-14 16:00:34
LLM
2024-07-14 16:00:43
其實我好想知呢個AI係點樣做到
有冇人可以解釋下
2024-07-14 16:01:38
連登 LLM應該叫DLLM
吹水台自選台熱 門最 新手機台時事台政事台World體育台娛樂台動漫台Apps台遊戲台影視台講故台健康台感情台家庭台潮流台美容台上班台財經台房屋台飲食台旅遊台學術台校園台汽車台音樂台創意台硬件台電器台攝影台玩具台寵物台軟件台活動台電訊台直播台站務台黑 洞