在這剖析人工智能在賭業內所扮演角色的文章系列的第二篇中,科技公司Differential Labs將把焦點放在數據這個人工智能的基礎元素之上。本篇將討論現時賭場數據方面的一些未完善之處,以及新的數據來源。Differential Labs的常務董事Clayton Peister會與來自賭場技術公司Acres的Noah Acres和Walker Digital Table Systems的Stephen Moore一起探討相關問題。
當我們與營運商們談及引入人工智能(Artificial Intelligence,AI)時,我們通常都會用上同一句說話作開端:賭場數據通常都是錯的,但由於它們錯得如此「貫徹」,反而令它們變得有用。雖然現時的賭場數據有用,但客人們為我們而言,依然有很多未明之處。就以價值為例,現時一般用於反映客人價值的ADT(諞按:ADT-Average Daily Theoretical,為客人平均每天理論上會輸給賭場的數額)八成都是錯的。
由於結合實際輸贏及理論贏額的ADW(Average Daily Worth)也沒有準到那裏,所以我們(作為營運商一方)以為玩家與物業互動的方式,其實和客人的親身經驗大相徑庭。由此可以想像,當其他行業從AI那裏得到了那些最有意義的時影響時,賭業卻完美地與這些影響擦身而過。可是,這種情況不會再是必然:來自新源頭的數據,特別是那些來自擁有實時數據收集功能的智能賭枱、角子機和網上博彩的每筆下注交易記錄,就能讓營運商對於客人有更深入的了解。我們相信,這些新數據能夠補足大規模個人化所需的資料,讓AI得以被最大限度地被利用。
這些數據源尤其能夠幫助認識玩家的喜好、更準確地觀察玩家的行為,以及更能產生實時和相關的結果。基於這些數據所建立的預測模型,不但更加準確,而且能夠以從前難以相像的方式捕捉到玩家的偏好。一些精明的營運商會基於直播下注交易數據來建立出模型,以達到更多營運上的優化、偵測詐騙和觸發不同的實時動作。
我們已經觀察到,每筆下注交易的數據資料,可以讓我們在準確度、喜好認知和數據的相關/實時程度這三個層面上得出改善,從而達至更好的客人互動程度。在賭枱數據方面,在這三個層面上均可得出改善,但就角子機數據而言,改善就主要出現在喜好和關聯程度方面。例如現時的角子機只能讓我們知道整個玩樂時段的總價值,但時段內在派彩表上連線和數量等方面的變動卻一直未能被捕捉到。可是,在取得每筆下注記錄後,這些行為都會變得無所遁形。
準確度
不論是在角子機、網上或賭枱上所作的每一次投注,莊家通常會在對賭中享有優勢。在亞洲,多數營運商都會假設這個優勢平均會是1.25%左右。但如果我們細看每次下注所收集的數據,就會發現實際優勢約為1.7%,而一般贏率或贏率中位數則為2.6%。事實上,少於10%的百家樂賭客可以達到1.1%到1.3%的贏率。另外,博彩場所一般都會把賭枱上的局數及平均投注金額說得比真實的小。所以如果有玩家對於自己的評級低於預期表達不滿的話,可能真的要相信他們的話。
基於不準確的評級來建立模型,不只會令人擔憂,更加是一樣徒勞無功的作為。我們最近就曾與一個有使用智能賭枱但依然以人手進行評級的營運商進行了一次實驗。我們訓練出3個用來預測客人的長期每日支出(平均每天贏/輸的金額)的模型。我們只考慮用那些有多日記錄的客人,以減少變化波動帶來的影響。
我們發展出來的第一個第一個模型(我們就稱它為底線模型吧)是一個十分先進的模型,擁有我們在過去10年收集的所有關於加強準確度的知識。第二個模型是一個簡單的移動平均模型,但用了從智能賭枱收集的每筆下注數據。第三個模型,則建基於每筆下注交易記錄,是一個被大量調整過的先進準測式模型
模型一
在評級方面,模型會把數據中的不準確之處也學進去。在主要於賭枱耍樂的玩家,根據評級所建立的模型,其長遠的錯誤率為三成到四成之間。在角子機評級方面,「平均值」的錯誤率偏低,但變化波動依然會影響到一般(中等)玩家,以致錯誤率會從20%起跳。或者更重要的是,評級的理論上輸贏數額與玩家真正的每日支出只有一個較弱的相關,而且如果玩家的平均下注額較高或者經常有附加賭注的話,這個相關就會顯得更加弱。
模型二
那個基於每次下注交易數據所建立的簡單模型,與評級模型的的表現實在不遑多讓,只是把錯誤率中三成到四成降低至接近一成。
模型三
一個基於每筆下注交易紀錄所建立的先進模型,可以把錯誤率再往下壓,但卻沒有非常大的改善;更重要的是,準確率對於捕捉像玩家潛質等就更加沒有大影響。
從這個實驗所學到的,就是要更強調數據質素的重要性這種更為不起眼的事情,因為它能夠影響到更吸引到人的預測演算法。作為AI從業員,我們是經常被綺麗的數學所迷倒的一群,而且比較會把注意力放到數據科學中更有趣的部份上,但真正能夠推高準確度的,卻是數據質素和特徵工程。可能更重要的是,在一般客人的評級上所發生的錯誤,令到由AI支持的個人化這種概念變得遙不可及。
筆者在未來的文章中,會談及準確度及資料細分。它們在反洗黑錢和負責任博彩方面,均有潛力去挑起一場革命。打個比喻,通過有RFID功能的籌碼,我們就能看到所有籌碼的交易活動,令到洗黑錢、高利貸甚至對於市場推廣的濫用等行為無所遁形。在角子機方面,某些玩家玩樂手法的突然轉變,這能夠顯示玩家可能正在濫用推廣優惠進行免費耍樂。
偏好
一個好的公關,幾乎本能上就會立即感覺到他所負責玩家的博彩偏好,很常會把玩家界定為乒乓式投注者或以豐富的詞彙來形容他們的風險偏好。每筆投注交易記錄讓我們得出一個對於整個博彩區域內的玩家的更完整畫面。例如百家樂玩家出名喜歡跟風。但來自不同種族背景的人,他們所喜歡跟從的風卻可以截然不同。另外,關於百家樂玩家,我們從智能賭枱的數據也能看出,當連續出現4局莊家後,那些來自受華人文化影響國家的玩家,有八成時間都會投注在莊家上。與之相反的是來自東南亞的玩家,他們只有65%的時間會投注在莊家上。相似的現象也出現在角子機上,我們以前從不知道一名玩家在觸發某種功能,或者在取得一個只有很少甚至沒有派彩的獎賞局後,會否改變他們的行為。把這些豐富的偏好資訊放到市場推廣之中,就是其中一種容易想到的應用方法。
另一個沒那麼明顯但效果可能一樣強大的應用方法,就是與詐騙和風險有關。例如,我們在2020年開始就逐漸可以通過智慧賭枱的數據,找出百家樂附加賭注優勢賭博的風險所在。此後,附加賭注這種優勢賭博手法,就在亞洲各地漫延,並且與其他新式投注選擇一起「升溫」。有了智慧賭枱,我們就能夠對牌盒進行計算,並從實時計算中找出不尋常的耍樂變化。這事情在網上就更為明顯,因為營運商經常會根據下注量來給予回贈,以致於連基本投注都會出現對沖下注的情況。這也是一個可以讓機器有機可乘的漏洞。俄羅斯黑客騙局就是濫用漏洞的玩家的角子機版本,並且只能通過資料細分來應對。
相關度
一般玩家在一天內耍樂的幾小時間,會被評級五到十次,令到對於玩家實時情況的應對變得散漫及不夠即時。每筆下注交易記錄就很有潛力去幫助營運商做到一些實時動作,例如更新排行榜、應對市場推廣上的困難和偵測詐騙。另外,實時數據也可讓營運商根據客人當刻的情況,在最好的時機進行干預。
解法
專家們都把AI當成魔法水晶球一樣,認為它可以解決所有類型的問題。可是,在關於數據的基礎部分能夠發展到一定水平前,AI的出品將只能繼續用於某些特定的少數情況。以每筆下注交易數據為主的新數據來源,可能是完成賭場AI拼圖的最後一塊。