[大數據分析]深入淺出地教你用分析軟件R-Studio

科學怪人

374 回覆
149 Like 2 Dislike
岀糧買騰訊2020 2020-02-29 18:59:50
sql+vba+python人留名
Outliers 2020-02-29 19:00:52
同埋你講資料量太多就處理唔到,可以講specific啲到底大數據可以有幾多數據。
因為好多人根本都無咁大量data,好多時Excel都夠用。
Dickgressive 2020-02-29 19:07:28
之前試過用R 做啲analysis
iterate 幾億條entry做基本分析都講緊要幾個鐘
最後頂唔順用Rcpp port 落去C++ run

R比python 好在佢natively support dataframe
同埋個官方IDE幾user friendly, 又可以直接開啲data frame 睇,裝package就咁search 就得

但R 同python大家定位好唔同,無話邊個可以取代到邊個
米go佐敦 2020-02-29 19:07:38
Lm
科學怪人 2020-02-29 19:11:07


有時如果係計到1D 循環小數,少不免會顯示比較多嘅數值

喺Console 裏面
R係預設咗會顯示7位有效數字

但係其實我地可以採用兩個方法去改變
round(2000/6, 1): 答案會準確至1個小數位

逗號後面嘅參數代表顯示小數位嘅數目

signif(2000/6, 2): 準確至兩位有效數字
有啲童年回憶



依一個%% 係會輸出餘數

講下餘數日後嘅其中一個應用
就係喺Plot graph 嘅時候
隨時間過去,想電腦喺graph 嘅標題打出月份

利用月份 %% 12就可以唔會出現13月 14月

留意喺R嘅語句裏面
係可以喺object 之間加上空格嚟令到個畫面睇落順眼啲
科學怪人 2020-02-29 19:17:11
巴打的確有道理
好多時Excel係夠用

MS Excel 理論上有1048576 rows
但係我自己實際用起上嚟
其實用上過萬 rows 嘅時候,已經會load得好慢
Outliers 2020-02-29 19:24:40
你用vba嘅話都有啲技巧可以快啲架
不過唔騎劫你個post了
科學怪人 2020-02-29 19:40:03
墮天小女警 2020-02-29 19:44:08
留名 我都係學緊r
科學怪人 2020-02-29 19:55:07
無話處理唔到
不過真係唔efficient

我就舉個實例
有個絲打係做食品行業
個倉要恆溫恆濕,裏面4角都裝咗溫濕計

4隻溫濕計每5分鐘會自動上傳一個data 上server

然後佢就要喺server download data 落嚟做分析同plot graph (raw data in csv format)

例如
“Date/Time”, “Temperature”, “Humidity”
“2019-12-20 00:00:00”, 20.2, 55.1

問題係d data並唔會好完美地每5分鐘一個
可能係每4:30-5:30一個
導致每個禮拜嘅數據量都唔一樣
每一隻Sensor 之間亦都唔同

中間要剪剪貼貼
今個禮拜多咗data則要改graph 改公式

最後我用R 幫佢解決咗
以後一見data 一run 就直接出哂所需要嘅graph
時間慳返好多
科學怪人 2020-02-29 20:00:42
練習1.

咁上完基本嘅計數機堂之後

我都俾返幾條練習大家啦

1. 以10為base number, 求log200

2. 顯示 兀(準確至三位有效數字)

3. 2000 除6 所得餘數 的二次方
科學怪人 2020-02-29 20:46:34
讀書需要?工作需要?
科學怪人 2020-02-29 21:28:05


咁講完基本嘅運算功能
而家就開始寫下程式啦

左上角有一個位,可以開一個新嘅R Script
之後左上就會出現一個新嘅視窗

Untitled1

依個模式就同Console 唔同
Console 係一入一出
R Script 就可以容許用家寫好一段野,然後一次過執行

就好似一般嘅程式咁,其實都係一個所謂「指令集」

留意如果我喺R Script 某一句打咗個 #
喺同一行嘅# 之後嘅嘢都會變成「文字描述」
可以作為註解
但並不具行任何執行上嘅意義
而同一句裏面# 前嘅嘢係會被執行嘅

留意我先打依幾句


想全部執行就先撳Ctrl + A 選擇所有嘅程式碼


再撳 Run 執行
下面Console 即刻會俾返相對嘅回應


科學怪人 2020-02-29 21:43:05
咁喺R 嘅世界
我地係可以將1D 物件賦值

就好似未知數嘅概念咁

例如


apple <- 3
即係同電腦講,apple 等於3

然後我輸入apple ,喺Console 就會自動出現3

輸入後,我亦可以攞apple 進行任何之前講過嘅運算

當然我哋亦可以改變apple 嘅數值



自此apple 就會變成4

如果之後我地唔想再要apple 嘅賦值
可以 remove(apple)

之後再輸入apple,可見系統就會唔知apple係乜嚟


電話o禁極o刀 2020-02-29 21:52:53
同python仲有java有咩主要分別?啲imported library會有唔同?
電話o禁極o刀 2020-02-29 21:54:05
for loop都唔識真係好難搞,師兄連微積分都冇讀過?聽你講你應該係computer science架話
科學怪人 2020-02-29 22:01:16
對於賦值,除咗數字之外

我地仲可以用文字

但係文字前後必須要加上雙引號




再複雜少少,賦值係可以包括function
自此簡單一句就可以做到比較複雜嘅計算

例如我想計percentage change
比較前後值嘅百份比改變
就可以定義一個 需要輸入前後值嘅function




留意function(x,y) 之後一定係加個大括號
然後包住裏面要執行嘅內容
洛托姆圖鑑 2020-02-29 22:02:39
睇標題以為係data recovery嗰隻R-Studio
堅尼米拿足金鳩猴 2020-02-29 22:21:01
吹水台自選台熱 門最 新手機台時事台政事台World體育台娛樂台動漫台Apps台遊戲台影視台講故台健康台感情台家庭台潮流台美容台上班台財經台房屋台飲食台旅遊台學術台校園台汽車台音樂台創意台硬件台電器台攝影台玩具台寵物台軟件台活動台電訊台直播台站務台黑 洞