賽馬投資學

50 回覆
10 Like 6 Dislike
2020-08-23 14:25:24
睇到個標題,你可能會諗,賽馬唔係賭博咩?點會係投資啊?其實啲買股票嘅叔叔嬸嬸聽人地講幾個number,就跟住買,咁同賭大細又有咩分別?唔係聽消息,而係做完分析先去買股票嘅你,可能會話買股票要睇好多野架喎,要睇年報啦,要做基本面分析,又要做投術面分析,買馬點同呢?得個幾樣野睇,又唔識睇個馬樣就知佢靚唔靚,fit唔fit,點分析啊?鐘意睇數據做分析嘅你,如果連股票市場咁多野睇都搞得掂,賺到超過20%回報嘅話,賽馬世界又點會難到你呢?講到投資,最重要嘅梗係想知呢個投資有幾多回報啦?咁我就要講下係賽馬分析入面好出名嘅兩個人,一個係中大嘅前統計系教授,顧嗚高,另一個就係Bill Benter。根據網上報道,顧教授靠數學模型贏咗半億,而Bill先生呢,維基百科就話佢係賽馬市場到賺咗十億。有興趣嘅可以google下佢地係呢方面有咩威水史。就咁睇數字,係咪覺得好難以置信呢!要賺咁多錢,你估佢地真係次次都咁好彩,估中晒啲馬咩?佢地致勝嘅關鍵就係數據分析。

要做分析嘅話,首先你要知賽馬有咩數據。假設你想用排名做Y去建立一個數據模型,咁其他數據就可能係模型中嘅X。做股票分析,你都會想有多啲X,俾你可以從多啲角度去了解隻股票值唔值得入手,然之後做個準啲嘅模型睇下幾時入手好,同幾時放好。賽馬都係差唔多,只係賽馬唔駛諗幾時放,只需要諗呢個賠率抵唔抵入。(呢樣野有排講,有興趣知可以再講深入啲)

下圖係舊年最後一個本地賽日嘅第一場賽果,你見到嘅所有野都係數據,易處理啲嘅話,可以直接用有排名嘅果個表,已經有好多野可以研究。平時聽電台啲馬評人會睇係邊隻馬,隻馬上幾場嘅表現係點,邊個騎師,練馬師,檔位啊,負重啊,係長途定短途賽事。簡單啲開始,你可以搵下呢啲數同個排名嘅correlation,睇下邊啲同個排名嘅關係大啲。除咗個表之外,仲有好多其他數據,例如個表上少少有幾樣野,賽事重溫、餘勢分析同鳥瞰重溫,呢3個係影片,你可以用computer vision嘅technique去做影片分析,睇下啲馬嘅沿途表現,分析下其實邊隻馬後勁有力,啱跑長途。又或者係競賽事件報告,係一堆文字,可以做下text mining。就好似下文中,「標騎飛」要經過”獸醫撿驗”先可以再出賽,咁樣可能表示”獸醫撿驗”係唔好嘅字眼,如果呢隻馬再出場,佢個表現需要大打折扣。除咗賽果之外,其實仲有好多其他相關數據,大家都可以拎黎做X,例如天氣狀況、馬匹過往嘅傷患紀錄、騎師王嘅積分等等。

唔知你果日有冇投注,試諗下如果你中咗隻12號,佢賠率有22倍,你買1000蚊,就有12000蚊收,嘩!你話爽唔爽。當然啦,佢咁高賠率,即係大眾覺得佢唔會贏,而你個模型要成功搵到呢隻冷門馬係要落好多功夫先有機會搵到佢。

(未完待續,我驚太長,大家會覺得悶,如果想繼續睇,可以留個名支持下)

2020-08-23 14:28:08
咁多理論做乜 到跑馬時貼出心水計下你中幾多先算
2020-08-23 14:41:09
有無plan
想買tips
2020-08-23 14:51:00
Lm學嘢
2020-08-23 15:42:04
LM
2020-08-23 17:13:24
lm
2020-08-23 17:17:10
無錯
2020-08-23 17:19:24
廢話唔洗多 放低number 自然有人跟
利申:想睇樓主搞到馬會百年基業執笠
2020-08-23 20:00:25
我諗留意呢個post嘅人或多或少都係讀數、統計或者CS人,想自己砌model去贏大錢。其實顧教授都教咗唔少學生,我諗當中都有人想學佢咁賺大錢。靠人地貼士可能真係可以幫你賺一兩次快錢,但有自己嘅model先係長遠搵大錢嘅方法。呢個post之所以出係學術台,而唔係財經台吹水台,就係想大家可以由學術層面去探討下點用模型去投資賽馬,歡迎大家交流下自己既做法同諗法。
2020-08-23 20:03:55
你都有道理既, 因為馬會會有抽水呀麻, 但係換個諗法,對比股票,大把人買馬係諗都唔諗,見邊隻馬順眼啲就買,因為佢地當賽馬係賭錢係娛樂,而唔係投資,所以其實有好多人都係倒緊錢落海。
2020-08-23 20:11:59
你已經有自己套model?
2020-08-23 20:20:50
public 越來越準,用上年data train 嘅今年未必 work
2020-08-23 20:25:00
當年中大好似有條友真係俾筆錢佢建立數據分析, 條件好似係要分帳, 報紙報導佢地真係長期剷錢, 點解咁好既野會有報紙可以報導出黎 ?? 因為後尾佢兩個分錢拗唔掂數, 搞到上法庭
2020-08-23 22:56:55
當你知道有咩數據後,就可以諗下用咩做個Y同用咩模型。

(以下內容需要基本程度既統計學知識)

首先介紹嘅就係Bill 先生 所用,傳統統計學常見嘅模型 Multinomial Logistic Regression (MLR)。
MLR同一般Logistic Regression唔同嘅地方在於,LR當中既Y係binary,而MLR當中既Y就係multiclass,最重要嘅係MLR模型output出黎嘅係一個probability matrix,之後可以配合唔同既betting strategy (例如 Kelly Criterion) 去落注[Kelly Criterion既缺點問題之後會再講] ,從而maximize個回報。

但係有一點要留意,就係MLR係假設咗Y係nominal,而賽馬名次實則係ordinal,所以如果要改良,可以從 proportional odds logistic regression 著手 [有興趣之後可以再深入啲講]。

我希望講嘅野易入口唔會太複雜,所以大部分嘅point都係點到即止,如果想了解多啲 Bill Benter 個模型,可以Google "Bill Benter Computer Based Horse Race Handicapping and Wagering Systems: A Report" 就會搵到佢篇文,好詳細解釋佢個賽馬系統。 又或者如果大家有咩想問都可以留言,大家交流下。

我個人認為 MLR 係一個好值得試嘅模型,無論係新手初接觸,定係用黎做 baseline model 之後同其他模型比較都好。

(啱啱睇返先發現上面打錯字,賠率22倍,買1000蚊,應該係有22000蚊收)
2020-08-23 23:04:37
留名
2020-08-23 23:26:28
之前係YOUTUBE見過段類似既教學片
https://www.youtube.com/watch?v=8XXtW9SZ020
2020-08-25 20:38:54
講咗咁耐,最重要嘅係點樣拎到啲數據,網上大把open source嘅package或者論文幫你或者教你砌模型,但數據呢?應該從何入手呢?

最直接同唔使錢就拎到數據嘅地方就係馬會個網,你唔怕煩又有好多時間嘅話,可以自己scrape data,或者自己逐個逐個表download,逐個逐個數人手打。唔想煩嘅,可以搵下啲data provider,根據唔同嘅收費,可以得到多啲或者少啲數據項目同數據量。大家可以自己google比較下。幾年前,當我開始做果陣,我唔知原來有啲咁方便嘅野,自己花左幾個月時間學scraping,從搵數據到validation再將佢地clean好整理好,就足足花咗我年幾兩年時間。因為數據嘅質素好重要。如果啲數據錯漏百出,明明2號馬贏,佢寫咗12號,賠率係9倍,寫錯係19倍,garbage in garbage out,咁你覺得果模型會準得去邊?所以數據本身要做validation,至於點做呢,你可以將唔同地方但講同一樣嘅數據做比較,例如你見到之前果賽果,隻頭馬「萬里威揚」明明沿途走勢次次都排最尾,但最後拎到第一,好似唔係好合理。想check下個賽果啱唔啱,可以去搵呢隻馬嘅馬匹資料,double check下佢係咪真係跑第一。
用兩年時間去做數據收集呢件事有好有唔好,唔好就係我晒咗兩年嘅opportunity cost,但好處就係我對啲數據真係好熟。如果你睇到呢度,我相信你都幾有興趣,想整番個數據模型,學顧教授或者Bill先生咁係賽馬入面贏大錢。如果大家感興趣,我之後會繼續出post,教下大家點砌模型,分享下有咩數據要特別處理,內容都會用番我自己嘅數據,想知清楚啲我教學入面講嘅係邊項數據,可以到呢條link填份form買我嘅數據。

無論有興趣買數據,想學術交流下,都可以telegram搵我傾吓偈。
https://telegram.me/Horsorion
2020-08-25 20:39:48
2020-08-25 21:07:48
賽馬投資學邊有賣數據/心水咁穩賺
2020-08-28 09:33:33
馬係賭仔同賭仔對賭 馬會只負責抽水
係叻ge人贏蠢ge人錢
2020-08-28 09:33:51
22倍應該係收22000
2020-08-28 09:38:39
笑到肚痛
msn年代嘅招數就想搵水魚
2020-08-28 09:51:23
On
吹水台自選台熱 門最 新手機台時事台政事台World體育台娛樂台動漫台Apps台遊戲台影視台講故台健康台感情台家庭台潮流台美容台上班台財經台房屋台飲食台旅遊台學術台校園台汽車台音樂台創意台硬件台電器台攝影台玩具台寵物台軟件台活動台電訊台直播台站務台黑 洞