砌機行deepseek 671b

debugger;

46 回覆
2 Like 23 Dislike
debugger; 2025-01-28 17:25:26
1.
epyc genoa (9654), 12*48g rdimm, 461gb/s
$40k hkd
q4_k_m, eval 20t/s, output 7.5t/s, ctx增加後未知

2.
mac studio m2 192gb*3, 800gb/s
$150k hkd
預測output最多14t/s

3.
xeon 6 + 12x mrdimm 8800, 845gb/s
200-300k hkd?
預測output 15t/s

4.
8-10張3090 48g
150k hkd up
預測output 30t/s以上

5. 3-4部nv project digits
100k hkd up
預測output 4t/s

5.
租cloud用api算啦..
debugger; 2025-01-28 17:27:01
Outliers 2025-01-28 17:32:29
你自己砌梗係唔夠人哋data centre咁cost-efficient㗎
助理工程師 2025-01-28 17:38:36
點樣駁3部mac studio一齊run 一個model?
10蚊跟機 2025-01-28 17:40:36
電費?
debugger; 2025-01-28 17:44:08
參考mac mini cluster llm
debugger; 2025-01-28 17:45:02
cpu only solution應該用300-400w
10x 3090應該裝三相電
debugger; 2025-01-28 17:45:43
3部project digits應該500w左右,詳情未知
港女洋腸夢 2025-01-28 17:45:58
6. 直接課金俾deepseek 算,$5美金有排玩
旋風管家一拳超人 2025-01-28 18:10:14
人哋純粹想自己上手試下啫
GIGACHAD 2025-01-28 18:42:54
自己砌機行係咪就可以冇censor?
兼職陰陽師 2025-01-28 19:13:41
617b真係call api算
我咁支持self host都咁話
兼職陰陽師 2025-01-28 19:13:55
671b*
極北鷲 2025-01-28 19:15:33
可能人地公司用呢
systemd 2025-01-28 19:19:34
6. 等n記部digit
debugger; 2025-01-28 21:14:26
考慮埋1.58b quant

1. 一張mi300x
2. 一部mac studio m2/m4 ultra
3. 兩張A100 80g
4. 192gb ram電腦加張gpu做offload
icewater 2025-01-28 21:34:06


搞咁多野,都不如買service
debugger; 2025-01-28 21:39:44
一早課左openrouter
但一直想心思思整個全Local對話型廣東話ai
icewater 2025-01-28 21:52:41
連登仔都係唔想你嘥埋啲冤枉錢啫
一注獨中 2025-01-28 22:03:23
逐隻GPU獨立供電得啦
洗咩三相電
不過就唔可以用同一way電
點樣供電又唔影響運算
唔需要同一隻牛做晒
debugger; 2025-01-28 23:08:00
本身都想replace屋企部壞左既xeon e5v3
咪奇老味 2025-01-29 01:37:30
你堆spec會比你想像中行得快
我部M1 Max 64GB 48GB vRAM 行70B都比想像中行得順
大棍巴 2025-01-29 01:53:03
可以睇埋哩個:
https://unsloth.ai/blog/deepseekr1-dynamic

下個月我地部4*A6000 ADA應該行到,1.73 bit似乎已經唔錯。
debugger; 2025-01-29 02:01:11
問左有人m2 ultra 192g行1.58b,13.5tok/s
大棍巴 2025-01-29 02:01:47
*原來已經提過,不過條link都幾多嘢,可以望下。
吹水台自選台熱 門最 新手機台時事台政事台World體育台娛樂台動漫台Apps台遊戲台影視台講故台健康台感情台家庭台潮流台美容台上班台財經台房屋台飲食台旅遊台學術台校園台汽車台音樂台創意台硬件台電器台攝影台玩具台寵物台軟件台活動台電訊台直播台站務台黑 洞