香港大學推出 Dream 7B(擴散推理模型)

大棍巴

27 回覆
3 Like 9 Dislike
大棍巴 2025-04-03 17:07:37
https://hkunlp.github.io/blog/2025/dream/
香港大學與華為諾亞方舟實驗室攜手合作,正式發布 Dream 7B(擴散推理模型),是目前最強大的開源擴散式大型語言模型。

簡而言之,Dream 7B 具有以下特點:
• 持續大幅超越現有的擴散式語言模型;
• 在通用能力、數學與程式碼處理方面,表現可媲美甚至超越同等規模的自回歸(AR)語言模型;
• 展現出強大的規劃能力與靈活的推理能力,這些特性天然受益於擴散建模方法。



Reddit discussion
https://www.reddit.com/r/LocalLLaMA/comments/1jbpesk/block_diffusion/
真天真 2025-04-03 17:29:29
美國唔禁賣gpu 比中國香港大學?
廢架?
想同yy結婚 2025-04-03 18:16:26
可以同Grok deep seek chat gpt打牌了
fufuying 2025-04-03 18:42:08
Team: Jiacheng Ye*, Zhihui Xie*, Lin Zheng*, Jiahui Gao*, Zirui Wu, Xin Jiang, Zhenguo Li, and Lingpeng Kong.

一個香港人都冇
問問 2025-04-03 19:13:26
H K U >>>>>>> ChinU
佢地會 2025-04-03 19:15:07
香港讀書叻嗰d去哂讀醫
垃圾先讀ai
美國總統特朗普 2025-04-03 19:17:11
垃圾先讀ai <<are you sure?
史文哲果啲叫乜
佢地會 2025-04-03 19:28:06
same kind of rubbish
no need to differentiate
大棍巴 2025-04-03 19:37:03
十幾年前CU engine科都已經9成Grad students係NDS
香港人由始至終都係咁對啲science/engine嘢,與人無尤
二式複戰-屠龍 2025-04-03 20:02:16
某啲只能用“邏輯思維”打飛機既科目,佢地有邏輯有推理能力就唔撚洗讀文科啦
GaoGao 2025-04-03 20:15:59
香港人真係唔識整
二五年三月二四 2025-04-03 20:21:41
7B
Thx
二五年三月二四 2025-04-03 20:24:18
你都開得嚟睇
點解唔睇多行
Affiliations: The University of Hong Kong, Huawei Noah’s Ark Lab
何不採花?? 2025-04-03 20:27:18
大棍巴 2025-04-03 22:32:45
debugger; 2025-04-04 02:39:26
香港人: 有乜用?
das2asff 2025-04-04 05:32:06
不嬲都冇 你哋成日J嘅排名都係靠大陸人刷返嚟
背棄了理想 2025-04-04 06:36:45
HumanEval
Dream 7B: 57.9
Mercury Coder Mini: 88

MBPP
Dream 7B: 56.2
Mercury Coder Mini: 77.1
一前一後 2025-04-04 06:38:35
咁講啦,靠自己努力入到大學嗰堆,唔理佢讀咩科,我又唔會覺得佢哋垃圾喎
契媽最後信徒 2025-04-04 07:17:09
召喚IT潮文
不寫程式的程式員 2025-04-04 13:04:27
7b唔係好大
Llama 8b有16GB VRAM就行到
debugger; 2025-04-04 13:24:32
general對比specialized?
二五年三月二四 2025-04-05 20:37:47
7B你行到啫,training都係要用貴gpu
基動戰士鋼撚 2025-04-05 20:39:51
邊有人係香港做research

做雞都養唔掂自己
天地無用@SaiWan 2025-05-29 13:59:42
Last open day at HKU, none of hongkonger, all china student and professors
吹水台自選台熱 門最 新手機台時事台政事台World體育台娛樂台動漫台Apps台遊戲台影視台講故台健康台感情台家庭台潮流台美容台上班台財經台房屋台飲食台旅遊台學術台校園台汽車台音樂台創意台硬件台電器台攝影台玩具台寵物台軟件台活動台電訊台直播台站務台黑 洞