【詞彙聯想】10 分鐘玩個遊戲,就可以幫廣東話研究出一分力 2

56 回覆
32 Like 3 Dislike
2024-10-13 21:05:54
玩法
https://smallworldofwords.org/hk

填寫個人資料



教育年數:小一起計讀咗幾多年書:中學畢業=12年或13年
粵語地區分支:香港出世、長大就揀香港(移咗民都OK),其他地區同樣
位置:揀唔揀都得


遊戲開始

見到「鉛水」,你會即時聯想到另外邊三隻字?
留意每隻字都要由「鉛水」開始聯想
輸入一隻聯想詞彙之後,拍 Enter 或 撳「下一題」,就可以輸入下一隻聯想詞彙
輸入夠三個,會直落下一題
(你亦都可以直接撳「不知道」或「沒有更多回應」,跳下一題)

個研究做啲乜?
這個頂目是一個大型科學研究,目的是要在世界各個主要語言中,建構一個模擬大腦表達詞彙的網絡。
與一般字典不同的是,這個詞彙網絡可以提供資料讓我們知道每個詞彙在腦是如何表達的。很多心理學,語言學及腦科學的研究人員都想研究各個解釋語言表達和處理的理論。這些知識可以應用於不同領域的研究,例如文化差異,母語及外來語的詞彙學習等。

下圖是廣東話詞彙聯想網絡的圖像化數據。

現時,圖中包括約1,400個詞彙,每一點代表一個詞彙。愈多人答某個詞彙,代表該詞彙的點就愈大。另外,詞彙的顏色由電腦自動分配。廣泛意義相同的字會被分配到相同的顏色。

圖中可見的只是廣東話詞彙聯想網絡的一小部分。我們正收集更多的數據去改善及擴充此詞彙聯想網絡。如果你想出一分力,令此詞彙聯想網絡可涵蓋最重要的廣東話詞彙,歡迎你花五至十分鐘完成二十題簡單的詞彙聯想。

更多圖像化數據
https://smallworldofwords.org/hk/project/cluster/overview

其他語言詞彙配對研究,可以喺度搵到
https://smallworldofwords.org/hk/project/home

壇嘢邊個搞
這個多語言的研究項目得以實現,全靠世界各地研究人員的通力合作
項目負責人:
Simon De Deyne(Computational Cognitive Science Lab, University of Melbourne, Australia)
廣東話部份負責人:
劉擇明博士 (香港教育大學語言學及現代語言系)
陳友凱教授 (香港大學李嘉誠醫學院精神醫學系)
2024-10-13 21:06:35
2024-10-13 21:55:03
輕輕一推 呢幾年來玩咗好多次
2024-10-13 21:56:12
希望今次揾到多啲人玩啦
2024-10-13 22:28:15
關聯生成器
https://smallworldofwords.org/hk/project/visualize
喺呢度輸入詞語

跟住就會出到廣東話嘅人見到呢個詞之後,會聯想到啲咩
2024-10-13 23:57:52
輕輕推下
2024-10-14 03:31:36
2024-10-14 12:56:40
gchi
2024-10-14 13:14:05
2024-10-14 20:49:42
用黎做llm?
2024-10-14 21:06:45
好似好好玩
2024-10-14 21:16:17
2024-10-14 21:29:01
好玩喎
2024-10-14 21:33:45
同word2vec 有乜分別
2024-10-14 22:07:30
2024-10-14 22:09:36
LLM 更加需要句子或者語篇材料
呢個 dataset 有各種語言學、心理學用途
詳情我遲啲再打
2024-10-14 22:10:14
多謝支持,我都覺得好好玩
2024-10-14 22:18:41
鉛水->官商勾結
咁我第二個字詞係繼續填填鉛水嘅聯想詞,定官商勾結嘅聯想詞?有少少confuse
2024-10-14 22:23:19
2024-10-14 22:27:10
啲問題開始 challenging

word2vec 係透過文本做材料,揾出每個詞(或Token)嘅共現特性,建立一個包含每個詞語嘅 n-dimensional 嘅 representation,令我哋可以比較兩個任意詞語之間嘅距離(而呢個距離反映語義、語法相似性),用嚟做其他 NLP 任務。

詞語聯想係另一種詞同詞嘅關係。
1)聯想到嘅詞語唔一定語義相似:有時係反義詞,有時物件你諗到形容詞,見到動作你諗就到對象(之類)
2)聯想係 directed (有方向性):見到 X 令我諗起 Y,唔代表有相反方向嘅聯想。例如見到「前夫」你可能會諗起 Mirror,但係見到 Mirror 你可能會諗起「姜濤」。

更加重要嘅一點係「聯想」唔係拎住啲字、語料就會揾到,所以要用實驗形式收集。

多謝你嘅問題,等我可以打咁多字推 post
2024-10-14 22:27:38
永遠用題目個詞去做聯想嘅起點
2024-10-14 22:30:46
2024-10-14 22:49:41
2024-10-14 23:02:02
其實llm個matrix都幾反映到token(字元)之間嘅關系
2024-10-14 23:05:27
LLM 都係好好嘅 approximation
(上面講多咗啲真人答案嘅其他價值)
吹水台自選台熱 門最 新手機台時事台政事台World體育台娛樂台動漫台Apps台遊戲台影視台講故台健康台感情台家庭台潮流台美容台上班台財經台房屋台飲食台旅遊台學術台校園台汽車台音樂台創意台硬件台電器台攝影台玩具台寵物台軟件台活動台電訊台直播台站務台黑 洞