發覺好多人對Data Analyst有錯誤幻想

733 回覆
1145 Like 26 Dislike
2022-05-11 16:37:50
要分呀
Bootstrap係無可奈何,唔夠data下既選擇
如果夠data, 最好做Stratified KFold

如果你個algo係計distance, feature會有weighting就要normalize
Tree base model係唔洗normalize
2022-05-11 17:22:48
Data Analyst 好似人工唔錯 係咁呀啦
2022-05-11 18:07:17
我覺得要搵benchmark
如果件事本身有方法做開就compare to舊方法
如果無就睇下有無得收集human performance
Eg 你做緊image classification就試下compare人類個accuracy
就算人類係100%都唔驚,你可以照用黎睇下個model差幾遠

用多用少variable其實都係試
有可能加多個會好左又可能會衰左
所以依家都講緊MLOps,點樣令啲experiment可以快啲,可以快啲試到唔同方法/step個效果
2022-05-11 18:44:56
點厭惡性法?
2022-05-11 19:35:44
Same…
完全冇entry level opening
2022-05-11 21:44:41
2022-05-11 23:15:51
2022-05-11 23:19:38
2022-05-11 23:26:27
2022-05-12 02:45:35
2022-05-12 03:14:18
我有照報
都有得in
但每次in完都俾人話我experience 得DA
太green… 每次第一in就已經gg
(我有2年DA經驗,依家讀緊DS master)

我有擺自己啲project仔
都係好大路S3 / Airflow / Postgres 嘢…
依家努力緊考吓d cloud cert
巴打有冇建議我應該prioritize邊個方向努力多啲?
係咪都係考cloud cert 先實際啲?
定係睇晒本kimball 書 + Designing Data-Intensive Application書,學concept 先?
定係整d DE/MLOps project 有用啲?
定係我應該操sql/python leetcode?
2022-05-12 03:18:07
2022-05-12 04:21:44
玩AI同DATA既一定要勁Spec 如果唔係你會好撚頹
2022-05-12 04:26:23
2022-05-12 04:29:48
lm
2022-05-12 04:31:20
2022-05-12 04:38:09
2022-05-12 04:42:29
2022-05-12 04:50:35
執錯data會唔會比人發現
2022-05-12 05:11:05
2022-05-12 08:24:46
2022-05-12 08:25:38
吹水佬
2022-05-12 08:25:50
老闆有諗法,想拎出黎說服高層/其他人
用一啲好似奶勁好科學既數字去包裝
吹水台自選台熱 門最 新手機台時事台政事台World體育台娛樂台動漫台Apps台遊戲台影視台講故台健康台感情台家庭台潮流台美容台上班台財經台房屋台飲食台旅遊台學術台校園台汽車台音樂台創意台硬件台電器台攝影台玩具台寵物台軟件台活動台電訊台直播台站務台黑 洞