20150425_blp501
Economist Apr 19th 2015

說A-Rod已非大聯盟高效球員的報導,現在看起來是誇大了。A-Rod因為服用提升表現的藥物,而在2014年遭到整年禁賽;當討論這位39歲的老將時,焦點都放在洋基是否會為這位前超級巨星找個位置,還是把欠A-Rod的六千一百萬美金付清,然後把他趕出球隊。但A-Rod用一連串火熱的表現,震驚了棒球界。球季剛開打兩周,而他現在是美聯第七好的打擊者。而4月17日,他首次因為球場內的表現上了頭條;他把一顆偏高的外角速球打出全壘打牆,且是2015年以來將球擊得最遠的選手。這支大號的全壘打,距離達到477英呎(145公尺),球直接飛越坦帕純品康納球場的左外野觀眾席,落在走道上。

了解棒球統計數字在短時間內不可靠的觀察家,會馬上警告說,有關A-Rod未來的表現預測,還需要持續注意。一位早期又具影響力的棒球統計作家Robert "Voros" McCracken曾寫過一段值得牢記的文字。他說任何一位大聯盟打者,都可能在60個打數(大概比兩周的比賽多一些)中,得到非常好或非常糟的成績。無數球員可跟A-Rod一樣,在35個或更少打數中擊出四支全壘打,最終卻沒甚麼好成績。2006年時,一位早就被遺忘的球員Chris Shelton,在他開季前51個打數就擊出九支全壘打。但在他球季剩餘的322個打數中,卻只再擊出七支全壘打。

但數據派的原則中,也包含了對「Voros法則」有關小樣本數波動性的反駁。雖然棒球中短期內的壓倒性多數事件。都無法分辨出是統計上有意義,還是只是隨機變異數。有一些紀錄,因為太稀少了,即使只是一場比賽,也擁有令人印象深刻的預測能力。現代棒球統計之父Bill James稱這個原則為「獨特顯著性(signature significance)。」以一個最知名的例子來說。在過去一個世紀中,十四位能在九局內投出18次以上三振的投手,有十二位是全明星選手,更有六位是名人堂成員。A-Rod的好表現,可能也是類似的案例。畢竟在2007年(那年開始採用HitTracker,來記錄所有全壘打球飛行的軌跡)後所有大聯盟的38,143支全壘打中,僅有25支全壘打(0.06%,或是1,525支才出現一支)的距離在477英呎以上。

過去七個球季中,二十二位擊出距離至少477英呎全壘打的球員,是極度令人印象深刻的,也大概會是近年球迷「最令人畏懼的強打者」的口袋名單。其中有十五位全明星球員,比如說最佳棒球選手Mike Trout(他去年擊出一支489英呎的全壘打),以及被認為擊球力量最大的Giancarlo Stanton,他曾經兩度擊出超過477英呎的全壘打。這個俱樂部的其他明星球員還包括Adam Dunn、Prince Fielder、Josh Hamilton、David Ortiz、Nelson Cruz、Justin Upton、Edwin Encarnación跟Mark Teixeira。這個法則並非萬無一失:已經消失的Cameron Maybin曾經把球打到485英呎遠。但即使是某些例外,最終演變也支持這種取向。古拉索(Curaçao,加勒比海的荷屬自治國)的Wladimir Balentein也許會嚇到多數球迷,因為在大聯盟沒甚麼出色表現的他,曾在2009年擊出一支495英呎遠的全壘打。這也預言了他在2013年創下日本職棒單季的全壘打紀錄。

A-Rod現在是生涯全壘打排行榜的第五名,絕對符合這個俱樂部的艱難條件。但他進入這個俱樂部,究竟是吃過往亮眼成績的老本,還是同時也能預測他棒球生涯晚年的可能表現?

為了得知單一距離全壘打具有多少預測能力,我開始研究2007年至2014年的所有打者。首先我先放掉那些擊成滾地球跟高飛球的打數,因為這樣的軌跡無論如何都不可能飛越全壘打牆。接著我開始測量那些飛向外野,變成全壘打的球,這是計算打者力量的標準。如果超大號全壘打真的有任何獨特顯著性,那即便是擊出一支跟A-Rod一樣大號全壘打的打者,在一整季中的表現,應該會高於平均才是。

可以預期的是,數據非常雜亂 — 用單一的打擊機會,來預測其他三百多個打擊機會的表現,無疑是一項艱辛的任務。但在這雜亂數據中所隱藏的,是一項非常有力且具統計上顯著的趨勢。擊出的全壘打每比聯盟平均多一英呎(通常接近400英呎),該位打者所擊出之其他外野飛球形成全壘打的機率就高出0.06%(見圖)。

20150425_woc889

在多數的例子中,這樣的數字算是捨入誤差(rounding error,意指精確值跟近似值間的差異。比如說1/7為0.142857142857的無限循環,但近似值為0.142857。但這個方法最大的缺陷是,這些小數點的加總會過於草率。如果某位沒有其他資訊的選手 — 比如說新來的古巴球員 — 在第一個打數就擊出全壘打,而這支全壘打的距離約等於聯盟平均,我們會預期他在剩下的球季中,比其他選手擊出多6%的全壘打。但如果某位選手在第一個打數就打出像A-Rod一樣的477英呎全壘打,我們會預期他比其他選手擊出多50%的全壘打。這的確是一般人想找到的強力獨特顯著性例子。

將這個法則應用在A-Rod身上會有些棘手。一方面,跟那些古巴叛逃球員相比,我們非常了解A-Rod:他在大聯盟已打滾二十載。以他的年紀,跟他被禁賽前那幾年的平庸表現來看(先撇開他承認使用類固醇的問題),我們有好理由懷疑他是不是發現了他的青春之泉。最多人使用的兩種免費、公開可取得的棒球預測工具Steamer跟ZiPS,根據A-Rod熱身賽的低迷表現,都不看好A-Rod的季賽表現。過沒多久,就會有靠警告好騙讀者吃飯的棒球作家,說靠小樣本數據(small sample sizes,SSS)來作結論有多危險,然後A-Rod近期的表現,會變成SSS新歌的主角。

但是,獨特顯著性的邏輯,說明了這些萬事通、不要太早下定論的訊息,無疑跟那些他們所批評的開季非理性繁榮一樣,過度簡化。A-Rod擊出一支477英呎遠的全壘打這件事,意味著有很大的機會,A-Rod不是我們季前所想的那種選手。那些被遺忘的選手就是打不出477英呎的全壘打,一支也無法。

原文
arrow
arrow
    全站熱搜

    mlkj24 發表在 痞客邦 留言(1) 人氣()