[大數據分析]深入淺出地教你用分析軟件R-Studio

科學怪人

374 回覆
149 Like 2 Dislike
科學怪人 2020-03-01 14:51:38
對我地嚟講咪易

但我又會客觀去睇
每個人嘅擅長之處並唔同

正如識畫畫嘅可能會覺得畫一幅自畫像好簡單
但我就永遠都畫到唔啱比例

只能夠話純以統計分析去睇
R 真係仲易過Python、無咁多野記

而R已經可以做到若干方面嘅統計應用
科學怪人 2020-03-01 15:12:36

頭4條冇咩特別,唯一值得留意係中間插入一個vector 嗰度


第五條就留意六合彩喺同一注係唔會攪出相同號碼,所以replace 參數要轉做FALSE

第六條就都係先將範圍倍大至整數,再將結果除返細
1729 2020-03-01 15:21:00
老實講樓主求其gen d random data之後show下有咩用R做會特別方便好過啦
科學怪人 2020-03-01 15:25:17
練習4.

Normal Distribution

請設定一個function(x,y,z) 並命名為randomscore

需滿足以下條件:
1. x 為學生人數、y 為考試平均分數、z 為分數標準差
輸入任何x y z 可模擬任何考試結果

2. 考試分數設有半分,上限為100、下限為0
傷心1999 2020-03-01 15:30:01
LM
科學怪人 2020-03-01 15:30:18
工作需要

透過講解令自己牢記
科學怪人 2020-03-01 15:43:57

留意function 內所產生任何嘅賦值
只限喺function 裏面使用及輸出

離開咗function 之後就冇咗 ranscore 依樣野

試run
以直報怨 2020-03-01 15:44:10
成日都聽到有人推介Python做data analysis
但其實我一直都覺得R 真係影學好多
同埋有關Data 既野
真係唔係好諗到好多野係Python 獨家

跟住就會有人話Python 全能d
我絕對唔否認
但如果學黎係為左做Data analysis
咁全能做咩?
Scraping, machine learning/ deep learning, visualization, dashboard/ api hosting全部都做到。
識用REST api 就用到晒api service
究竟有咩Data 野係用Python先做到?
炉利有三好 2020-03-01 15:45:42
只係識用SPSS R真心難用
插_班女學生 2020-03-01 15:49:40
無記錯R做唔到 interactive plot
所有的圖都係static
以直報怨 2020-03-01 15:50:02
Shiny 做到
以直報怨 2020-03-01 15:50:56
不過我都想問吓Pythom 主流用咩package 整interactive plot/dashbaord?
插_班女學生 2020-03-01 16:06:45
plotly
勇武condom 2020-03-01 17:26:43
老實講,冇咩,個分別係好唔好用,本質上咪又係數學,你鐘意實可以自己implement 堆methods,但係Sklearn 好方便咁解。如果真係要數,pyspark/pyflink 計唔計
勇武condom 2020-03-01 17:29:07
冇咩點睇 我自己覺得shiny 靚過ploty
科學怪人 2020-03-01 18:05:01
咁見講到random number
就簡介下統計常用嘅t-test
用R 我覺得係相當方便



我產生咗40 位同學考Mock嘅成績出嚟
而嗰份Mock 卷係一份past paper 嚟
已知要攞3 級成績嘅話,就需要有65分

同學嘅分數自然有啲好標青同有啲好廢
單純以mean 、median 等去睇依班同學嘅水平並唔夠概括

有一個做法係叫t-test
可以預測依班同學整體上係咪可以達到「第3級」

t.test(vector, mu 可以理解為期望值, alternative 當我地只係考慮偏高嗰邊去唔去到65, 定義confidence level 一般都用95%)


結果顯示
可以預期依班同學去考試,整體上係達唔到第3級水平

第二個例子: Two-sided t-test


今次就係某間藥廠嘅生產線做完一批藥品
而藥品規定有效成份係10毫克

太多,可能會導致過量、太少又會冇效

但係做檢測就會基於儀器同人手等嘅因素
一定會有variation

所以,要斷定依一個批次嘅藥品係咪含有10毫克嘅有效成分
一個科學方法係做10次測試

檢測結果就以activeing 表示

今次因為多同少都唔得,所以會係two.sided


結果顯示依個批次就係含有10毫克嘅有效成分,可以推出市場
以直報怨 2020-03-01 18:14:47
R都有plotly
可以integrate 入Shiny 用
以直報怨 2020-03-01 18:15:55
我自己用完Python 既sklearn 再比較埋R 既caret
我覺得Caret 整合得好d

pyspark/pyflink 未用過唔識比較
等其他高手分享
精銳蒙古突騎 2020-03-01 18:16:21
一開始睇唔慣,但係睇多左又冇咩野
當年接觸python都係覺得怪怪咁,但係用多左又好d
勇武condom 2020-03-01 20:40:23
呢啲真係觀點與角度問題,至少以interface 角度嚟講,我自己覺得Sklearn 真係寫得好靚得嚟,features 真係好足,dimension deduction、unsupervised learning、ensemble model 拎嚟做poc、prototype、baseline 真係一流
勇武condom 2020-03-01 20:42:37
因為plotly 係d3js wrapper 真係要落手做得靚點都係靠d3js做 但plotly 呢個wrapper 真係做得十分好
雲家剷 2020-03-02 13:16:27
留名
吹水台自選台熱 門最 新手機台時事台政事台World體育台娛樂台動漫台Apps台遊戲台影視台講故台健康台感情台家庭台潮流台美容台上班台財經台房屋台飲食台旅遊台學術台校園台汽車台音樂台創意台硬件台電器台攝影台玩具台寵物台軟件台活動台電訊台直播台站務台黑 洞