Data Science之你問我地答

用戶1

680 回覆
30 Like 4 Dislike
忌不如人 2020-05-19 18:49:44
三七二十一 2020-05-19 20:58:22
啱呀,吾生也有涯,而知也无涯。以有涯随无涯,殆已!

覺得知到夠明原本想學嘅嘢就好停啦,學嘢最忌depth first search咁學, 應該breath first search
馬拉申科上尉 2020-05-19 21:15:03
自己搵幾個熟既博一博
三七二十一 2020-05-19 21:33:27
之前有位巴打講嗰兩本都好出名,我之前主要都係睇PRML(PRML 出名到你google 呢4個letters, 第一個result 就係本pdf) 不過睇prml 要對住佢嗰errata 黎睇,佢都幾多位有錯,如果做做吓exercise 快現做唔倒落去,你最好對對errata 先,有可能條問題出錯咗

有本我好鍾意嘅ML 入門書係
https://www.amazon.com/Learning-Data-Yaser-S-Abu-Mostafa/dp/1600490069
雖然佢只係講linear model,但係cover 晒ML應有嘅concept, 同埋會題少少同statistical learning theory 有關嘅嘢

仲有一本叫BRML, 呢本係probability graphical model 嘅入門書,同時都cover 大部份嘅ML algorithm, 亦會focus on Bayesian approach 去睇佢地,不過有啲飛飛地書,可以用黎check 吓自己係唔係真係明嗰個topic

如果唔鍾意Bayesian approach可以睇EoSL (我冇乜點睇過,不過如果你background 係stats 嘅話,可能會啱口味啲)

又,如果啲stats 好唔得,要惡補,可以睇
https://link.springer.com/book/10.1007/978-0-387-21736-9

不過正路睇啲textbook 都夠做嘅。
返而有啲multivariable calculus 嘅嘢,你最好睇吓mit ocw 18.02

MIT ocw 18.06 都最好睇吓,如果你啲linear algebra 唔太熟嘅話

基本上上班講嘅都cover 咗我當年讀master 睇過嘅嘢關於machine learning 嘅嘢嘅6/7成
1729 2020-05-19 22:16:22
其實你可以睇下外國大學d course
stanford有放佢地d lecture notes出黎任你睇
好似有拍埋片放上youtube
nakuruuuu 2020-05-19 23:06:18
好似聽日開始udacity有個free既introduction course to Machine Learning on AWS
有興趣既巴打可以留意下
可以儲下實戰經驗
TifaBB 2020-05-19 23:54:31
答單問 https://www.coursera.org/learn/machine-learning
coursera個免費machine learning course下一期 25/5開波 依家preview week緊 想招study buddy
三七二十一 2020-05-20 00:37:29
我係take 佢第一屆嘅coursera ML course而落ML 呢個坑嘅
之前都推過畀啲人興趣嘅人睇、入門唔錯,不過有啲淺得滯,但佢啲programming exercise係唔錯
基本上有咁唔明都可以問吓
nakuruuuu 2020-05-20 07:59:44
andrew ng個course好多鬼佬推薦
1729 2020-05-21 00:22:57
呢個佢之前係教既machine learning
https://see.stanford.edu/Course/CS229
有片有lecture notes可以睇下佢教法啱唔啱你
大作戰 2020-05-21 11:46:03
我完全冇IT 底 唔係想轉行
ML 有冇野好玩 學左少少basic野 覺得ML好有用
但工作上用唔到 想做啲小project 邊做邊學

各位巴打有冇做過類似project 係網上拎data都做到
尋孕G是罪 2020-05-21 11:51:14
係, 1 同 2 都夠做有突
吃遍這世界賓周 2020-05-21 12:30:07
我又有新問題喇
假如我已經計晒d keywords 既conditional probability P(keyword|class)
但如果用黎做prediction 既data,出現左training data 入面無出現過既字,呢d 情況咪用唔著Bayesian 囉?
林智榮 2020-05-21 12:41:15
TifaBB 2020-05-21 12:45:57
用戶1 2020-05-21 13:29:45
你用緊naive bayes? 如果test set有training set無見過既字,個model就唔應該用,當見唔到
吃遍這世界賓周 2020-05-21 13:34:51
咁應該用咩方法黎計每隻字既sorce?
用戶1 2020-05-21 13:41:26
training set 分 positive 同 negative samples
然後做分詞,每個sample都變成bag of words, 然後based on 每個詞語出現係positive / negative samples既次數計概率
做prediction時,做分詞,計每個詞係上面分別係positive / negative既概率,連埋positive / negative samples本身既prior probability就計到依個新sample應該係positive 定negative
https://medium.com/analytics-vidhya/naive-bayes-classifier-for-text-classification-556fabaf252b
吃遍這世界賓周 2020-05-21 13:50:22
篇blog 提到laplace smoothing,應該就係我想知道既答案等我詳細睇睇先
唔該巴打
nakuruuuu 2020-05-21 14:00:59
HaDoop/Spark/Kafka呢d基本啦
利維亞的傑佬 2020-05-21 15:28:28
其實除左ANDREW NG,有個台大教授叫李宏毅
佢有將佢D LECTURE放上YOUTUBE
另外有個靚女MISS叫Chen Yun Nung又係台大
不過佢地係FULL LECTURE同係中文黎

李宏毅我自己覺得幾鬼馬,佢成日用D好貼地既EXAMPLE
吹水台自選台熱 門最 新手機台時事台政事台World體育台娛樂台動漫台Apps台遊戲台影視台講故台健康台感情台家庭台潮流台美容台上班台財經台房屋台飲食台旅遊台學術台校園台汽車台音樂台創意台硬件台電器台攝影台玩具台寵物台軟件台活動台電訊台直播台站務台黑 洞