IT 討論區 (145) Git Checkout
罰you
1001
回覆
4 Like
2 Dislike
第 1 頁
第 2 頁
第 3 頁
第 4 頁
第 5 頁
第 6 頁
第 7 頁
第 8 頁
第 9 頁
第 10 頁
第 11 頁
第 12 頁
第 13 頁
第 14 頁
第 15 頁
第 16 頁
第 17 頁
第 18 頁
第 19 頁
第 20 頁
第 21 頁
第 22 頁
第 23 頁
第 24 頁
第 25 頁
第 26 頁
第 27 頁
第 28 頁
第 29 頁
第 30 頁
第 31 頁
第 32 頁
第 33 頁
第 34 頁
第 35 頁
第 36 頁
第 37 頁
第 38 頁
第 39 頁
第 40 頁
第 41 頁
H07252
2022-03-12 16:18:26
自已玩kafka 可以用operator
strimzi 都算係無鑊氣
我自已野airflow 同kafka 用operator都ok
公司野正常有人睇住confluent kafka
CapaCitor
2022-03-12 16:20:07
strimzi 好野來
男男細乳
2022-03-12 16:22:47
UlittleCuntMate
2022-03-12 16:43:57
其實多唔多公司用databricks
見佢官網個demo都整得幾靚仔 仲要有sql同 delta lake
UlittleCuntMate
2022-03-12 16:45:22
同埋想問下da同de條路 洗唔洗識埋linux
Flinty
2022-03-12 16:49:26
唔多。因為太新。btw,佢屌打其他data tools。snowflake都唔夠佢揮
Flinty
2022-03-12 16:49:39
唔洗。
男男細乳
2022-03-12 16:54:39
香港都有,大公司為主
delta lake好野來
etl就多數一係databricks一係airflow
Flinty
2022-03-12 16:59:00
但個delta lake個delta sharing到依加都未release
Moya
2022-03-12 17:06:22
大家點睇iot公司
身寸周隹
2022-03-12 17:17:16
賺唔到大錢
UlittleCuntMate
2022-03-12 17:34:40
data 有冇話邊個industry 係特別好payd/請得比較多人?
fintech/bank/it vendor??
もみじ
2022-03-12 18:03:12
其實3間完全唔同......general concepts可以話一樣, 但好睇個line manager點睇件事, 想要即時hand on做到野同比時間你pick up都好唔同.
もみじ
2022-03-12 18:07:20
男男細乳
2022-03-12 18:09:43
CapaCitor
2022-03-12 18:44:31
媽咪
2022-03-12 19:05:43
睇咗三版咩都睇唔明
男男細乳
2022-03-12 19:33:34
もみじ
2022-03-12 19:37:24
CapaCitor
2022-03-12 19:46:13
Service account?
男男細乳
2022-03-12 19:48:33
腦若傷殘
2022-03-12 20:16:06
實驗羊
2022-03-12 20:19:04
Speaking of cloud platform, I’ll probably start using them via cli lol web portal is so slow
尼爾大叔
2022-03-12 20:27:25
想補充2點,
1. spark主要over pandas應該在於distributed processing, pandas雖然易用但唔support distributed. 常見有可能data scientist用pandas做一d細規模d/downsampled嘅data analysis, DE再用spark重寫
2. 嚴格嚟講SQL database都唔係用嚟做datawarehouse, 傳統SQL DB主要optimize咗係CRUD, transaction等等application usage. Azure Synapse, big query, Hive呢類專做datawarehouse嘅俾DE process 完raw data 再儲低做BI/reporting, 所以datawarehouse會喺reporting方面做得好d ,e.g. 處理fact同dimension table之間嘅joining
datalake主要係儲返raw data, 例如web scrap/亂七八糟各種data source. data scientist可以喺datalake入面睇返邊d data啱用嚟做data analysis, 再同DE夾返點起返pipeline去automate processing data
男男細乳
2022-03-12 20:29:40
第 1 頁
第 2 頁
第 3 頁
第 4 頁
第 5 頁
第 6 頁
第 7 頁
第 8 頁
第 9 頁
第 10 頁
第 11 頁
第 12 頁
第 13 頁
第 14 頁
第 15 頁
第 16 頁
第 17 頁
第 18 頁
第 19 頁
第 20 頁
第 21 頁
第 22 頁
第 23 頁
第 24 頁
第 25 頁
第 26 頁
第 27 頁
第 28 頁
第 29 頁
第 30 頁
第 31 頁
第 32 頁
第 33 頁
第 34 頁
第 35 頁
第 36 頁
第 37 頁
第 38 頁
第 39 頁
第 40 頁
第 41 頁
吹水台
自選台
熱 門
最 新
手機台
時事台
政事台
World
體育台
娛樂台
動漫台
Apps台
遊戲台
影視台
講故台
健康台
感情台
家庭台
潮流台
美容台
上班台
財經台
房屋台
飲食台
旅遊台
學術台
校園台
汽車台
音樂台
創意台
硬件台
電器台
攝影台
玩具台
寵物台
軟件台
活動台
電訊台
直播台
站務台
黑 洞