big data 所謂既多D data 有兩點
1. 多observation => 可以用更複雜更強大既model
2. 多variables => 難分析 部份model 唔適用
一般data analysis 講緊 300 observations 20 variables 已經係一個中型既dataset
你完全可以睇曬每一個variables or observations 既情況
但想像下你有10000 observations 50000 variables 一般既data analysis 點搞
你冇咩可能有意識咁揾correlation 同form 一個model e.g. regression
利申 econ
