Data Science之你問我地答

用戶1

680 回覆
30 Like 4 Dislike
才毛氐 2020-05-14 15:02:27
識啲high level tools 冇乜人要咁
DeepLearn 2020-05-14 15:42:26
我建議識得大概玩就好。原因係小弟2018年用6個月寫左個自動pick features計gradient decent 既auto parameter tuning script(雖然只有幾種Algo built-in...)。覺得自己好L勁,然之後無耐就收到Google dev team close beta 版既AutoML測試(依家AutoML前身). 我一用完Google版就即刻用賤價賣左個script比個印度公司。
Acropolis 2020-05-14 15:42:47
我都覺DS似係工具多
但你講嘅domain knowledge同analytic senese係點學番黎?
唔on job我覺得有啲難學/進步
山系野人 2020-05-14 15:44:09
Quantitative Finance 又係另一個例子
Math + Programming + Econ
根本好多大學都係睇將來興咩, 就將幾科撈埋一齊當新嘢
李康廉 2020-05-14 15:46:02
同stat有咩分別?
我讀stat都有學prediction, segmentation
都係睇utility個啲來predict?
算子代數 2020-05-14 15:48:29
Data Science 其中一個要點係 domain knowledge...
我諗結合 domain knowledge 同埋啲 ML tools 先開始值錢...
eventually 2020-05-14 15:52:41
so true,我嗰個年代(講緊15年前)嘅ML/DS都仲係啲門檻好高嘅嘢,就係靠呢班scientist keep住研究,先會有今日

而我係歡迎成個行業有唔同嘅生態發展,例如software development都有分core engineering、business application development同software delivery,唔洗下下叫core班大帝高成本地出手,中下游都好重要亦好需要人手,當然,人工點都差過上游

個別比較rigorous嘅界別,係會對啲唔係「根正苗紅」嘅人有啲憂慮,但我覺得成個行業嘅spectrum,總有位置係容納到訓練到啲中途先出家嘅人
用戶1 2020-05-14 15:52:51
其實 machine learning 都係用緊 statistics 個啲 techniques
我會話其實根本就係個堆野,不過 DS 多啲 computer science 既元素
用戶1 2020-05-14 15:56:21
ML係AI其中一個domain
有好多 AI algorithms唔係用ML, 例如google map 搵最短兩點既path係一種AI algo, 但唔需要 "learn" 出黎~
徬徨午夜 2020-05-14 15:59:40
點睇ust dsct?
用戶1 2020-05-14 16:07:49
https://dsct.ust.hk/core-courses
睇啲course都幾正路,不過都係個句 DS 既entry工唔多,畢業都要同人爭,不過讀完都可以做data engineer等既IT工
RX-78-2 2020-05-14 16:12:43
呢樣野先係DS最值錢既野, 唔係好多有人有好深入既domain knowledge同時有好強既programming能力
才毛氐 2020-05-14 16:13:47
巴打可唔可以講下如果我想用自己電腦去做依家google automl 既野,用咩programming tools 可以呈現出相同既野?例如hyperperameter tuning,weight feafure selection, allow nullable feature, early stop trainning 呢類? 我依家個目的都係想搞呢樣野。
我search 左好耐,睇左好似有個叫XGBoost 既lib 好似係好岩我,其實係唔係?
如果係,我應該裝python, pychram 做IDE 然後就裝埋一堆library (tensorflow-gpu, XGBoost etc.)就搞掂?
唔該哂巴打
陽炎座 2020-05-14 16:16:47
我都好掙扎,報緊呢類既master,但唔知有冇學校收之餘,兩年後既世界都會好唔同
才毛氐 2020-05-14 16:19:34
我都報左hku 既master of data science, 重未收消息,應該皮已收
用戶1 2020-05-14 16:24:53
唔係好明,你想做automl做既野=build model,定係你想整個automl出黎?
xgboost只係其中一種ML 既library,
language就首選python
IDE用jupyter notebook啦,唔好用pycharm
基本上你裝左個anacoda就可以開波跟網上面啲教學玩
陽炎座 2020-05-14 16:27:32
我都未有,我仲要係報歐洲master
RX-78-2 2020-05-14 16:34:54
行頭窄,錢多,需求極大
才毛氐 2020-05-14 16:38:43
想唔洗依賴high level tool 去完成不比high level tool 做出黎差既machibe learning model
我見aws 既notebook instance 有得用python 同pytorch ,想問下兩者有咩分別
百分百粉葛 2020-05-14 16:40:32
會唔會減左D features 反而準D?
CapaCitor 2020-05-14 16:52:34
CapaCitor 2020-05-14 16:53:21
pycharm for development
jupyter notebook for playground

兩者都唔同用處
CapaCitor 2020-05-14 16:53:55
吹水台自選台熱 門最 新手機台時事台政事台World體育台娛樂台動漫台Apps台遊戲台影視台講故台健康台感情台家庭台潮流台美容台上班台財經台房屋台飲食台旅遊台學術台校園台汽車台音樂台創意台硬件台電器台攝影台玩具台寵物台軟件台活動台電訊台直播台站務台黑 洞