Pages

10/13/2010

正確面對數字

數字可以說是現代文明的基石. 沒有數字, 就沒有科學; 沒有科學, 我們大概都還在茹毛飲血. 雖然有很多人自稱自己數學很好, 但是真的去嘗試理解去嘗試明白這些數字的人又有多少? 以下我嘗試用幾個我經常留意到的例子去說明人的謬誤.



高勝率=高手??                                                                                                                                        

在有名的網上boardgame 伺服器bsw, 只要是想進步的人, 相信都會留意得到自己的勝率. 在一些遊戲中, 高水平玩家在取樣數足夠之下可以得到高勝率. 但是高勝率就一定是高水平嗎?

不要忘記, 我們是嘗試以一個point estimator 去量度一個玩家的水平. 而這個point estimator 是我們不清楚的, 所以我們需要通過統計取樣去知道這個point estimator, 而這個point estimator 就會有效地反應出那個玩家的水平.統計取樣無論你怎樣改變取樣的模式也好, 也是離不開隨機抽樣這個概念.只有通過隨機抽樣, 數字才會公正的. 唯獨有些下手糞想得到好成績而去故意挑新手來鞭, 所以在用數字評估別人實力的時候, 必須小心.

當然, 這個不止在bsw, 在天鳳也非常常見. 那些在上級打雜魚的就是好例子

取樣數足夠嗎?                                                                                                                                        


一個遊戲無論怎樣公平都好, 怎樣少隨機要素也好, 通常也不能完全排除隨機, 如BOARDGAME 的下棋的先後次序, 電腦遊戲中的對場地圖, WOW/STARCRAF2 的對戰職業種族, QUICK MATCH 中的對手水平等等. 要量度一個人的水準, 很大機會需要用到統計, 這樣, 取樣數就是一個關鍵. 需知道如果取樣數不足, 統計出來的數字就不能夠反映自身的水平, 這就是大數定律.


以擲銀為例. 一個銀幣兩個OUTCOME 都需要50次才會收. 涉及越多運氣成份的遊戲收歛速度就會更慢, 好像麻雀, poker這些, 每一個position 都幾乎是隨機決定的. 雖然我以前也相信500個半莊可以收歛, 但是深想一層, 根本不會這樣簡單. 實力差距非常遠的時候尚可以說500場收斂
試想成有兩個玩家, 他們的實力是A 及B, 他們各有一個獨立的隨機變數e及f 所影響, e和f 都在同一個standard normal distrubution上. 所以, 他們的成績就分別會是

result of a r_a= A + e
result of b r_b= B + f

要找出他們的相對實力, 慣用的做法就是把兩者相減. 就是 r_a - r_b = (A - B) + (e - f) ----(**)
留意因為他們'運氣'都是standard normal, 因此, E(r_a - r_b) = E((A - B) + (e - f)) = E(A - B) + E(e-f) = A - B, 他們最終都會收歛的. 但是留意(**), 這樣排列的話就會有兩個因子影響結果, 一就是A-B, 二就是e-f. 如果A-B 足夠大去蓋過e-f 的影響的話, r_a - r_b 的收歛就會被A-B 主導. 因為A-B 不是隨機的, 那收歛的速度當然快. 但是如果A-B 非常接近, 那我們就可以把A-B 當成是零, 雖然這個'算式最終都會收歛', 但是一直會有e-f這個數在, 一直都會有雜音(noise), 要通過數字去觀察這兩個玩家的差距是非常有難度的. 把這兩個極端連起來, 你就可以發現, 當兩個玩家的實力越接近, 就需要越多局數去令數據收歛.


雖然用統計去改善自己的雀力是一個好開始, 但是你還相信在特上的500個半莊分析有什麼意義嗎? 事實上不止這一個數字收歛的問題. 一個人的戰略久不久就會有'進步', 這些'進步'雖然通常都是出於真的想進步的動機, 但是他的影響不一定是正面的. 既然都不在同一個取樣層面上, 又未必一定是向上調整的平均, 又何以見得會那麼快'收歛'?


分數系統                                                                                                                                                 


很多遊戲都有一些分數系統去鼓勵玩家遊戲去拿到更高的分數. 但是這些分數真的反映玩家的實力嗎?

就好像starcraft 2 系統, 他的起始分數不是1500或任何正數, 而是零. 因此你可以想像, 他是一個越打得多分數就會越向上升的系統, 因為最差那一班人的分數怎樣輸都是不會少於零的. 這樣就會造成一個分數向上升的動力. 雖然他有一個bonus pool 去作補正, 但是這個系統明顯是獎勵多時間玩的人. 他們的分數越高, 在sc2rank.com 的世界排名就越高. 但是這個真的是世界排名嗎?


另一個系統就是麻雀格鬥俱樂部的黃龍珠系統. 黃龍珠的交收只會在一個session 完結之後發生, 但是他還有各種的獎勵cs, 如一發, 逆二逆一等等的額外獎賞, 輸一發又不會有罰. cs可以換成銀星, 足夠的銀星又可以轉換成黃龍珠, 這樣又造成一個平均向上升的動力. 多的黃龍珠不會代表你真的強. 只是代表你銀彈夠多而已.


correlation 背後的因由                                                                                                                     


你媽是女人, 但是不是每一個女人都是你媽.


correlation 都是一樣, 兩個有正關係的變數, 長遠來說想量度出來的correlation 是正的. 但是一個正數correlation 卻不代表兩個變成必然是直接的正關係. 一般來說, coreelation 的演繹有3個

1. 他們是直接正關係(positively correlated)
2. 他們是直接相對關係
3. 他們背後還有一個因子令到這兩個結果經常出現

一個很好的例子就是開心以及癌症的發病至死亡的時間. 很多研究報告指出開心以及癌症是有一個positive correlation. 但是是因為開心而令到你沒那麼簡單的死去, 還是你比較富有, 物質生活豐富,而且也有錢去買藥醫病, 而令到你沒那麼快死?


在閱讀報紙或者閱讀任何數字的時候, 對於數字一定要小心. 不要被有心人騎劫你的取向, 亦都不要被那些蠢記者所誤導.

No comments: