Quantcast
Channel: 水瓶倒出的流水帳-棒球統計
Browsing latest articles
Browse All 20 View Live

Runs Created

Runs Created 是 Bill James 創造出, 用來預測得分的統計量. 原形是: 上壘率 (OBP) 乘上總壘打數(TB), 加加減減, 有許多的變形.或許是純數出身, 對於一些人為的統計量, 一直看不順眼, 總希望一個公式, 能有些直覺的意思.上壘率乘上總壘打數為什麼適合用來估計總得分? 只因為統計迴歸的結果不錯? 那些再加加減減讓統計迴歸的結果更好, 就更沒意思了. 要知道,...

View Article



統計的解讀:BABIP

BABIP 意思是 Batting Average on balls put into play。它考慮的是,排除全壘打,計算被打出去的球,成為安打的機率。我們看球會覺得,運氣常常很重要。有時候明明打得很強勁,但正對著野手而去。有時候沒打好,反而成為落點絕佳的安打。從 BABIP...

View Article

再談統計的解讀

本來是在 CCLu 的 blog 中一篇關於 BABIP 文章 的討論。稍作修改,放在這兒充充板面,也好讓老婆養的寵物能長得快一點 :)當目的是要 fit 一個現象,模型當然能越簡單越好。若 fit 地不好,再去加變數或什麼的。在一些假設下,建構的模型可以 fit 數據 fit 地相當好,那是件令人高興的事。之後可以用這個模型來預測,解釋一些事。但重點是,不能因為 fit...

View Article

the most overrated offensive stat

剛逛到 ESPN 的 MLB,正在舉行一個投票:What is the most overrated offensive stat in baseball?Batting averageHome runsOn-base percentageRBISlugging percentage我也去投了一票,順便看看大家怎麼想。結果出來,我實在不敢相信我的眼睛。Batting average 13%Home...

View Article

打點機會

之前在一些回應裡,談到打點到底重不重要。單單看總數,的確會讓人不知道這個選手到底是打得好還是不好。就像我們比較常去注意打擊率,而不是安打數。相同地,打點若不是看總數,而是看有打點機會,得到打點的百分比,那會單比看打點總數要準。在 Baseball Prosepct 有列個統計量就是在算打回的打點(不包括自己回來)除以打擊時壘上的總人數。這是今年目前的統計:...

View Article


Image may be NSFW.
Clik here to view.

Expected Wins

棒球統計界最常用到的 Expected Wins 是 Bill James 所提出的 Pythagorean Formula。他認為,一個隊的勝率約等於 RS^2/(RS^2+RA^2),其中 RS 是得分(runs scored),RA 是失分(runs allowed)。之所以被廣泛使用,主要原因大概是,它預測得還蠻準的。我從來不喜歡這個公式。RS^2+RA^2...

View Article

AL MVP for now?

前幾天,David Ortiz 打出那再見全壘打後,NESN 開始在提美聯最有價值球員的競爭,A-Rod or Ortiz?又看到 CCLu 的 A-Rod deserves the AL MVP for now。我也來談談,若不考慮防守,誰該是目前的 AL MVP?傳統數據上:A-Rod: 0.321 40HR 102R 108RBIOrtiz: 0.294 38HR 101R...

View Article

What are good statistics for MVP?

OBP,SLG,RC,VORP  是統計數據的新貴,但當你拿這些統計數據來衡量 MVP 時,你是否曾想過,這些統計數據是什麼意義?用它們來衡量 MVP 是否洽當?MVP 是最有價值的球員,對什麼來說有價值?應該指的是球員所屬的隊伍。望文生義,MVP 應該是一個對他所屬球隊貢獻最大的球員。目前棒球統計界喜歡用一個統計量 VORP (Value Over Replacement Player)...

View Article


Image may be NSFW.
Clik here to view.

七戰四勝 vs 五戰三勝

之前曾聽人在討論,大聯盟一季打了 162 場,結果在第一輪的季後賽採五戰三勝的賽事,讓爆冷門的機會大增。跟五戰三勝的賽事相比,七戰四勝制到底對強隊多了多少保障?這個機率很好算。以七戰四勝來說,先贏四場的機會,就剛好是假裝七場都打了,贏得四場以上的機會。因此,只要照 Beroulli...

View Article


再談 Runs Created

Runs Created 這數據,顧名思義指的是創造出來的分數。它是目前棒球統計上很重要的關鍵數據,不管是用來衡量球員的貢獻,或是評估未來的表現,在像是 VORP,Win Share,WARP 等等,都是 RC 的衍生。球季中,我曾經稍微寫過一篇關於 Runs Created 的短文。趁季後,再來將這個數據做較多的討論。首先,對於 RC...

View Article

再談 Runs Created(修正)

昨天,突然想到我在衡量貢獻度時,忽略了一件很重要的事,決定先作修正。首先還是再一次說明一下,得分跟打點,不是因為我喜歡它們,所以用它們。而是因為得分就是要靠上壘跟之後推進,因此,一個球員的貢獻度約為(上壘數 x 隊友推壘效率 + 隊友上壘數 x...

View Article

On leadoff and batting order

前些時候,Johnny Damon 的經紀人 Scott Boras 送給洋基一篇 "New York Yankees Leadoff Analysis" 的三頁統計分析,企圖說明,Johnny Damon 來打第一棒,讓 Derek Jeter 打第二棒,可能讓 Jeter 表現回到 1998-2001...

View Article

Another example that current baseball statistics sucks

在 ptt 的紅襪板,看到有人提到用統計的方法,在討論如何排棒次。這方法起源於 Value of OBP and SLG by Lineup Position 對 OBP 和 SLG 跟得分關係的分析。它將 OBP 跟 SLG 拿去跟得分作線性迴歸,得到 OBP 跟 SLG 要怎麼加權後相加,會對得分有較好的預測。它又將第一到第九棒的 OBP 和 SLG 分開去跑線性迴歸,因此得到每一棒的 OBP...

View Article


A Derivation of the Pythagorean Won-Loss Formula in Baseball

由於時差,一清早睡不著時,逛到 ptt 的 sabermeterics 板,看到這篇 A Derivation of the Pythagorean Won-Loss Formula in Baseball 的文章,讀了後,非常感動,這才叫做統計。為了推導 Bill James 所用的 Pythagorean Formula,作者 Steven J. Miller 在得分或失分是 Weibull...

View Article

Is Weibull distribution a good fit for RS&RA?

在我前一篇中提到,A Derivation of the Pythagorean Won-Loss Formula in Baseball 中用到了 Weibull distribution,在檢定實際資料時,結果顯示可能並不是 fit 得那麼好。這裡,我想再仔細討論一下,到底 fit 得好不好?首先,看看文章第八頁的那個表。對於 RS 跟 RA 是不是 Weibull distribution...

View Article


Overuse of VORP

VORP 這玩意在目前的棒球統計可以說是個寵兒,在討論 MVP 時,VORP 會被提及,在球季前,各隊的 preview 上也常可以看得見 VORP。VORP 真的那麼好用嗎?VORP (Value Over Replacement Player) ,它是為了衡量一個球員比一個替補球員 (replacement player) 能為一個普通隊 (球員成績為聯盟平均)多製造幾分。VORP...

View Article

Win Share

之前討論 MVP 時,有人提到 Win Share 及其它類似的數據。把為球隊增添多少場勝利當作價值的標準,比起創造多少得分,這是個更“現實”的看法。可惜,目前的相關數據,其實只是把創造多少得分轉換成勝場,再去視各隊球員 W.S. 和及實際勝場差,做一些調整。其實,若要“現實”來看,那不如直接把勝場分給該場有好表現的球員?在 Wakefield 首局就慘爆的比賽夜晚,我就來創造個易於計算的現實版...

View Article


Some Comments on WPA

WPA(Win Probability Added)這個概念,是目前我看到,最接近衡量貢獻度的方法。它的概念是,每個球員上場時,依當時的狀況(比分差,出局數,壘上跑者)有個球隊獲勝的機率,等這球員做完一次攻擊(或投手投一個人次),依之後的狀況,也有個球隊獲勝的機率。兩個機率的差,就是球員對於增加球隊獲勝的貢獻。就概念來說,我覺得非常好,但實用上卻有點麻煩。一個麻煩是,每個 play...

View Article

Another example that VORP sucks

 PAOBPSLGDH6690.3800.603LF6630.3970.613上面的數據是 2004 某隊兩個球員的打擊表現。兩個人的 PA 幾乎相同。第二個球員的上壘率跟長打率都較佳。第二個球員是野手,不可取代性應該比第一個擔任指定打擊的選手來得高。你會猜第二個選手的 VORP 較高嗎?事實上: PAOBPSLGMLVPMLVVORPDavid...

View Article

Not our typical Big Papi

7/13 的比賽,九局下半,一出局,落後一分,一二壘有人,打擊輪到 David Ortiz。若是前兩年,我想大部份紅襪迷心理想的是,這比賽大概已經贏了八九成(根據 Win Expectancy,主隊贏的機會是 0.364)。可惜,這是 2007,打擊的是代傷上場的 Ortiz。7/14 的比賽,一局下,兩出局,壘上無人,Ortiz...

View Article
Browsing latest articles
Browse All 20 View Live




Latest Images