LLaMA.cpp又一突破:用6GB RAM就run到媲美GPT-3嘅30B LLaMA model

高學歷廢青

50 回覆
65 Like 4 Dislike
高學歷廢青 2023-04-01 11:44:18
https://github.com/ggerganov/llama.cpp/pull/613
https://twitter.com/JustineTunney/status/1641881145104297985
痴撚線
原本要用40GB GPU RAM再加64 GB system RAM嘅30B model
(30B model亦都係Facebook原本份paper話同GPT-3一樣performance嘅model)
宜家唔使用GPU不突止,重要普通system RAM淨係要用6GB就得


事件證明:
1. 各大企業嘅ML researcher其實唔識傳統programming所要求嘅efficiency
2. 所謂large language model要用成個數據中心嘅硬件先run到可能其實只不過係多年來嘅extremely poorly optimised code嘅後果
サーシャ 2023-04-01 11:46:11
rh0x0 2023-04-01 11:51:47
jart嚟架大佬
拾狗帶落山 2023-04-01 11:56:30
lm
蛋撻哥哥 2023-04-01 12:10:06
lm
千人一面 2023-04-01 13:00:30
陣間用IBM 5100
一注獨中 2023-04-01 14:30:41
gameboy帶係coding嘅模範
IT磚材 2023-04-01 15:09:50
rh0x0 2023-04-01 15:20:15
同jart呢啲痴線佬比根本唔公平
天子門生 2023-04-01 15:38:21
叫GPT 5.0自己optimise 自己最好
不絲意遊氣 2023-04-01 16:02:39
不絲意遊氣 2023-04-01 16:03:09
民間發展AI比企業快,絕對係好事
夏蕙七下海 2023-04-01 16:07:54
https://github.com/ggerganov/llama.cpp/pull/613

睇翻原作者comment, mmap目前係CUDA/TPU未有類似功能

應該係DeepML長期依賴GPU運算, 所以對CPU專用功能視而不見
變型叮噹 2023-04-01 16:08:33
唔通我已經入錯線,所以個世界先至會打仗?

千人一面 2023-04-01 16:11:29
新聞標題:研究人員都唔知AI做緊乜
千人一面 2023-04-01 21:25:06
仲有 gpt4All
人生書家 2023-04-01 22:54:07
真啊,做FAANG,睇住啲ML engineers寫啲code真係差到,然後啲build target bloat到一個點,我都鬧做幾年,都係冇咩改善
高學歷廢青 2023-04-01 23:20:53
GPT4All講真嘛嘛,因為佢無filter走GTL-3.5-Turbo嗰啲好常見嘅「唔好意思我作為AI唔可以答呢個問題」嘅道德審查答案,搞到個finetune都成日有呢個問題。
呢個啱啱有個anon post嘅,唔錯:
https://rentry.org/nur779#gpt4-x-alpaca-13b-quantized-4-bit-weights-ggml-q4_1-from-gptq-with-groupsize-128
佢係用LLaMA 13B做基礎,再用Alpaca個dataset finetune,再用GPT-4嘅對答output finetune,再用GPTQ方法去quantise,再convert去llama.cpp嘅ggml格式。
千人一面 2023-04-01 23:26:27
麻瓜學野
llama.cpp係咪做唔到output寫code同出excel表個類功能
六環彩大師 2023-04-02 04:28:07
咁optimise有咩意思
man power 唔係錢呀
咁叻你一個library都唔好call
全部from scratch 用C寫最efficient.
六環彩大師 2023-04-02 04:28:33
work左就冇人optimise
本土文化淫 2023-04-02 04:32:03
真 work 左邊個會take 個 risk 去 optimise
Note9 2023-04-02 04:40:44
個model train 嘅data 量同chat gpt 比應該差好遠?
吹水台自選台熱 門最 新手機台時事台政事台World體育台娛樂台動漫台Apps台遊戲台影視台講故台健康台感情台家庭台潮流台美容台上班台財經台房屋台飲食台旅遊台學術台校園台汽車台音樂台創意台硬件台電器台攝影台玩具台寵物台軟件台活動台電訊台直播台站務台黑 洞