5. Duplicate data
兩條fork將來會有唔同既data 使用者無從分辨邊啲係duplicate data 呢啲duplicate data變相會錯誤地有更大既weight
手一黏便緊(UTC+92025-01-31 19:23:19
好老實講 1就算 手巴day 1已經講呢個form係笑話 連登仔不嬲唔駛尊重
但2-5係影響所有使用者 (which is why手巴本身唔尊重任何salary survey)
天線BugBugB2025-01-31 19:24:46
3年經要上40k
環太平洋抽水機2025-01-31 19:28:13
6. Data 的 authenticity
利申有入兩條on9 data
手一黏便緊(UTC+92025-01-31 19:28:29
而且講咩柒尊重 條友根本唔care 佢care就唔撚會咁fork法
加上本身無寫license 咁fork可以係reasonable public use
討論仲focus係尊唔尊重 係無撚意思
手一黏便緊(UTC+92025-01-31 19:28:58
呢個唔太關fork事
天線BugBugB2025-01-31 19:29:31
入多啲
漢語多功能字庫2025-01-31 19:30:26
其實
我有洗過data
因為啲data太少
唔開胃
winpeas2025-01-31 19:31:00
up mud 9
手一黏便緊(UTC+92025-01-31 19:31:41
Day 1已經講左會有假data 你班垃圾
天線BugBugB2025-01-31 19:31:43
你lead?
天線BugBugB2025-01-31 19:32:52
it avg = 年資*10000 + 20000
環太平洋抽水機2025-01-31 19:33:41
漢語多功能字庫2025-01-31 19:34:33
咁少數據唔靚㗎嘛
手一黏便緊(UTC+92025-01-31 19:36:17
大概係用Epistemic graphs既distance or path協助RAG 唔單單用vector similarity score
利申 做過similarity 知應用短板 但唔識RAG
手一黏便緊(UTC+92025-01-31 19:37:22
所以話你班垃圾不值得被尊重 人地唔尊重你咁fork出去係理所當然
天線BugBugB2025-01-31 19:41:54
炒❌️
抄✔️
3b正字協會
労働はクン2025-01-31 19:43:45
我作為原form設計者我唔介意人抄form,我覺得又唔係咩藝術品咁,任何人整左salary survey其實都係差唔多咁既樣
D data比人拎去fork,我自己覺得比夠credit就ok,但佢credit比唔足夠(例如應該係佢張sheet度annotate番個source) ,而且的確可能有師兄真係只想係lihkg圍內shared。唔講請求,始終kind of open data,但招呼都唔打個就fork係唔禮貌
我冇thread ac, 呢度有師兄肯的話歡迎quote 我諗法