要做分析嘅話,首先你要知賽馬有咩數據。假設你想用排名做Y去建立一個數據模型,咁其他數據就可能係模型中嘅X。做股票分析,你都會想有多啲X,俾你可以從多啲角度去了解隻股票值唔值得入手,然之後做個準啲嘅模型睇下幾時入手好,同幾時放好。賽馬都係差唔多,只係賽馬唔駛諗幾時放,只需要諗呢個賠率抵唔抵入。(呢樣野有排講,有興趣知可以再講深入啲)
下圖係舊年最後一個本地賽日嘅第一場賽果,你見到嘅所有野都係數據,易處理啲嘅話,可以直接用有排名嘅果個表,已經有好多野可以研究。平時聽電台啲馬評人會睇係邊隻馬,隻馬上幾場嘅表現係點,邊個騎師,練馬師,檔位啊,負重啊,係長途定短途賽事。簡單啲開始,你可以搵下呢啲數同個排名嘅correlation,睇下邊啲同個排名嘅關係大啲。除咗個表之外,仲有好多其他數據,例如個表上少少有幾樣野,賽事重溫、餘勢分析同鳥瞰重溫,呢3個係影片,你可以用computer vision嘅technique去做影片分析,睇下啲馬嘅沿途表現,分析下其實邊隻馬後勁有力,啱跑長途。又或者係競賽事件報告,係一堆文字,可以做下text mining。就好似下文中,「標騎飛」要經過”獸醫撿驗”先可以再出賽,咁樣可能表示”獸醫撿驗”係唔好嘅字眼,如果呢隻馬再出場,佢個表現需要大打折扣。除咗賽果之外,其實仲有好多其他相關數據,大家都可以拎黎做X,例如天氣狀況、馬匹過往嘅傷患紀錄、騎師王嘅積分等等。
唔知你果日有冇投注,試諗下如果你中咗隻12號,佢賠率有22倍,你買1000蚊,就有12000蚊收,嘩!你話爽唔爽。當然啦,佢咁高賠率,即係大眾覺得佢唔會贏,而你個模型要成功搵到呢隻冷門馬係要落好多功夫先有機會搵到佢。
(未完待續,我驚太長,大家會覺得悶,如果想繼續睇,可以留個名支持下)
![](https://na.cx/i/xibVAqA.jpg)