賽馬投資學

50 回覆
10 Like 6 Dislike
2020-08-28 09:53:54
講咁多 即係賣料啦
2020-08-28 10:03:42
佢四百幾萬講到自己四千幾萬喎
2020-08-28 10:06:50
最近 有好多導師朋友問我 係經濟咁差既情況下....點樣可以令自己盤生意仲有增長
2020-08-28 10:47:32
呢兩日係 telegram 都有幾位巴打搵我交流下心得 咁我都藉呢個機會分享下講左

Q: 點解揀賽馬唔揀足球?

A: 原因好簡單,因為賽馬係行彩池制 Pari-Mutuel (PMU) 而足球係行固定賠率 Fixed-Odds (FO),所以兩者表面上都係"賭博",但係玩法上有好大嘅分別。
PMU嘅意思就係將成個彩池嘅錢,抽走一部分嘅水,剩底嘅就平均分俾估中嘅人。
當多人投注落某一隻馬度,咁果隻馬嘅賠率就會低,馬會係唔會干預賠率,係一個好公平嘅遊戲。
以獨贏為例,假設獨贏彩池為2千萬,馬會會抽走17.5%嘅錢,咁而加彩池就會得返 20,000,000 x (1-17.5%) = 16,500,000,然後再將佢按每人買左嘅比例分俾估中嘅人。
但係相反,足球所有嘅賠率都係由馬會入面成班專業人士計算而得出黎,而個賠率已經包埋抽水嘅成份,所以我揀左做賽馬而冇做足球嘅模型。

PMU同FO可能好多人都知,但係值得一提嘅係其實賽馬世界入面亦都有 FO 嘅 pool,就係騎師王,呢個賠率,係由馬會入面成班專業人士計算而得出黎,呢樣野你睇幾多paper都冇咩人會mention,因為係香港獨有嘅,所以如果善用黎做feature engineering,你個模型個準確度會高唔少。

Q: 而加買獨贏係味已經冇肉食?

A: 呢個問題其實好有深度,啫係巴打清楚明白概率同賠率嘅關係先會咁問,亦都識計 EV 呀,Kelly Theory個d數,亦啫係我地俗稱嘅值博率。但係其實根據我自己做嘅數據分析,過往40年嘅賽馬紀錄,每場平均估中獨贏嘅百分比係冇大嘅升跌幅,換句說話講,咁多年黎,其實都係冇咩進步過,我自己都覺得好奇怪,因為隨住ML,DS嘅發展,suppose呢個百分比係會有上升嘅趨勢,但係數據唔會講大話,事實真係咁,亦都證明左會用ML,DS去砌模型嘅,仲係好少數,又或者大部分嘅所謂模型,係仲差過general public。

講開general public,其實大部分有砌模型嘅都會好清楚,odds係近乎所有features入面同排名嘅correlation最高,~ 0.46 - 0.48,但係如果用 MLR 模型,有咩野feature嘅feature importance係會仲高過odds嘅呢?

講住咁多先,如果大家都有咩問題,可以係到留言,或者 telegram 搵我都可以。
2020-08-28 11:15:50
另外本來唔諗住回應,但係我驚大家誤會左我嘅意思,其實主要開呢個post,係希望多d人可以分享下點用數學統計學嘅模型應用係賽馬世界,比起賣tips,我更加係想賣data。
因為我自己經歷過呢個階段,剩係由scraping, cleansing, validating, preprocessing都搞左我年幾兩年嘅時間,反而想放多D時間係modeling上面。
其實當真係落手做過,就會明當中嘅困難,有時會scrape漏左又要重新黎過,就算你段code完全冇改變,係唔同時間點scrape,亦會有唔同嘅result,仲有好多好多嘅問題會遇到。
舉個簡單嘅例子,大家知唔知馬會賽事係由幾月去到幾月,好多馬迷都會答九月去到七月,呢個答案冇錯,但係其實過往40年,係曾經有1年係8月有馬跑,但係你點樣係馬會個網搵返呢一日出黎再scrape呢,又例如同一個賽馬日,一隻馬可以係兩場賽事到同時出現,根據賽例係唔容許嘅,咁呢兩場邊場先係真邊場係錯嘅呢? 仲有好多好多呢類嘅問題要去cater,所以如果買數據,就可以確保數據嘅完整性同準確度。
我並唔係唔支持大家自己去scrape data,只係想提供多一個渠道等大家可以更加快同方便咁開始砌自己嘅model,亦都有D自己做scraping拎data嘅巴打會搵我交流下,講下佢用咩模型,有咩features咁樣,最深刻係有位巴打諗住將足球嘅ELO System apply 落賽馬到,雖然成效未必高,但係好創新同有諗頭。

好,之後都應該唔會再覆呢類comment,唔想引發罵戰。
另外想問下大家有冇咩model層面既野想知想問,可以係到留言一齊交流下,又或者分享下大家用開咩model architecture都可以。
2020-08-28 13:26:21
呢part係tips plan黎架,但係target audience係general public,冇咩programming底唔會自己用model去寫algo去買馬既人。
而我係連登主要係想focus搵一d識programming識stat 希望自己砌model既受眾,所以你會見我討論既方向都係以data層面model為主而唔會講tips plan個方面既野。

其實唔一定要買data, 單純係到交流下唔同既model我都覺得好好。
2020-08-28 14:43:11
睇左巴打講既野,都幾有啟發性
想請問會唔會有啲關於賽馬既書藉推介?
中英都得

同埋想請問有無望過積微錄,覺得個blog啲野點
2020-08-28 14:50:34
Sorry好多野好奇想問
有啲人玩stats玩數據係完全唔會理隻馬
只會當馬係一啲數據
有啲人就同時會睇下馬匹狀態睇下賽績片睇下隻馬臨場動態

想問巴打係邊一類人?點解唔會選擇另一種做法?
2020-08-28 15:29:58
大彩池有多寶架
2020-08-28 16:15:52
多寶都係馬會由利潤中抽出
2020-08-28 16:16:19
係賣data
2020-08-28 17:29:33
"計得精彩 賽馬的統計及數學方法"

我一開始乜都唔知連檔位係咩都唔識個陣就係睇呢本書入門,呢本書對我黎講就好似啟蒙老師咁。呢本書中文版已經絕左版,如果有興趣可以上網搵到 PDF,而英文版可以係Amazon買到。
(另外如果有中文版既巴打歡迎聯絡我,我真係好想收藏一本。)

另外坊間見到個幾本賽馬書我都有去書局睇過下,我會覺得可以作為參考,去睇下佢用咩features都唔錯。

積微錄我有睇過呀,我覺得好正學到唔少野,我個陣都係睇佢個網先搵到 Bill Benter 講talk個條片。其中有兩篇文我特別有啟發,分別係 "強勁無匹的賭馬方程式" 同 "Kelly Criterion的應用"。
2020-08-28 17:36:21
我係純靠數據分析個種人,因為一黎我跟本完全唔識睇馬,二黎我相信數據可以反映事實。但係我同時間會做好多野去將呢類好難quantify既野去做量化,例如用NLP去將馬評人講既野去做text mining sentiment analysis等等。
2020-08-28 17:43:33
講咁多野,d料點賣法,有咩plan
2020-08-28 18:05:17
計得精彩 我都有pdf版本
之前都有係連登留過tg share比人

另外香港賽馬煉金術(增訂版)
我自己都覺得幾大啟蒙空間
最近想搵一本書「輕鬆玩轉香港賽馬」
大陸人寫既,但搵唔到邊度買
唔知有無人有佢既ebook版?

我都同意積微錄果兩篇文好inspiring
另外我好欣賞佢砌Model得來保持理性
好多人而家砌Model變左係砌個靚仔model
而唔係令個Model行之有效

我自己文科人,對IT同數學既理解好困難
但本身揀馬都自問唔差
亦有唔少賽馬data
而家就係卡左係砌model度
2020-08-28 18:07:29
首先想講句唔好意思先,可能我既用字令到你有誤解,我絕對唔認為砌一個profitable既賽馬模型係簡單既事。

而學theory要學幾耐我覺得因人而異,好取決於到底每個人既學術水平同能力,而將theory再轉去應用層面又係另一回事。
舉個簡單既例子,望住下面個list,大家判唔判斷到邊幾篇係顧鳴高教授應用係賽馬世界既論文呢?
如果知道係邊篇,又睇唔睇得明佢寫既formula呢?
如果睇得明佢寫既formula,又識唔識用porgramming寫返出黎呢?
我絕對唔認為呢樣係一件簡單既事,需要用到既知識好多。



不過我好同意既就係feautures既重要性,一個再好既model architecture,但係入堆noise data,個performance都唔會高,所以好歡迎大家一齊交流下會用啲咩features。或者我可以拋磚引玉先,其中我覺得 Bill Benter 論文入面睇到既fitted model既residual再放入另一個model做features呢個做法好有創意又有用,大家仲有冇咩其他諗法?
2020-08-28 18:12:38
唔好講咁多 你model 個 pseudo R2 幾多
講到先有討論價值
2020-08-28 18:22:50
Lm
2020-08-28 18:39:02
Lm學野
2020-08-28 18:49:53
可惜啲人會做馬 無內幕消息無得玩
2020-08-30 15:27:17
我自己比較少睇書,睇完計得精彩之後主要都係focus係research papers為主。如果本身已經有賽馬data可以先試下砌 Bill Benter MLR Model,之後再改良諗新既features同其他model architecture。
2020-08-30 15:35:12
有冇做馬呢樣野我唔太識分,我有上網睇人話咩拉馬呀、扮打鞭等等,但係我個人睇法呢樣對投資賽馬整體係冇太大影響。因為第一,如果個騎師真係長期keep住做馬,係數據上可以反映到出黎,呢個騎師既勝率同入名率都唔會高,第二,如果做馬係rare case既話,長遠而言個model都可以keep到positive return。
2021-11-01 08:22:40
賣data 都係個網整個簡單model 來睇下. 又無 data description 講你d data 既category..
吹水台自選台熱 門最 新手機台時事台政事台World體育台娛樂台動漫台Apps台遊戲台影視台講故台健康台感情台家庭台潮流台美容台上班台財經台房屋台飲食台旅遊台學術台校園台汽車台音樂台創意台硬件台電器台攝影台玩具台寵物台軟件台活動台電訊台直播台站務台黑 洞