2008年9月14日 星期日

運動管理:不需要筆的資訊分析

之前講到了留意並接收各式相關資訊的方式,也就是不需要硬記,因為硬記的話也沒有比較有用,認知心理學有說明人腦的短期記憶力在數秒內即只得七成。只要在相關資訊出現時稍加留神即可,之後不斷的接收相關的重複資訊後,這些印象車轍才會形成長期的記憶。
解決了資訊庫的疑慮後,我們簡單的釐清一下這些資訊在需要被利用的時候,該以如何的形式從記憶中叫出來,才不需要過度的費神以致影響即時的表達或傳達能力。

利用兩個軸向批次性的提取資訊

整理資訊最單純有力的方式,就是固定一個中心軸(pivot),然後以這個中心軸來發展提取你所需要的資料。最主要的中心軸大致上分為兩類。
其中最常用也最容易理解的就是時間軸,以此為中心的資訊可以協助歸納時間對標的的影響力。舉個例子:

Tiger Woods在轉入職業前三年四大賽共12場出賽中,在Day2面臨cut的差距分佈由-3至-12,平均為-5.7。而在此後三年的12場四大賽出賽中cut的差距分佈則由0至-7,平均為-2.1。(平均數字為optional data,短期的思考可以不用作這種分析)由以上數據可以得知,Tiger在轉入職業的前三年四大賽前期表現,比後來三年好很多。

在上面這個例子中,就可以直接說明隨著時間變遷,運動員(也可以是某支球隊)狀態的起伏變化。在這段文字中,我們所需要提取的資訊是-3~-12,以及0~-7,可能對不熟悉的人來說擷取上會有些困難,那麼可以從短一點的時間來檢討即可,例如說一年內,甚至上一次出賽的資訊都行。

以時間為軸的系列資訊,我們稱做時間序列(time-series)。

另一個常用的中心軸是標的資訊的屬性,務實的說法是,這個中心軸代表的是整個參賽者、球隊、該運動聯盟、國家間差異對標的的影響力。一樣舉個例子:

國家聯盟今年五月的賽程中,受傷導致一場以上的無法出賽記錄共有13人次,其中投手有8人次;而美國聯盟部分共有11人次,其中投手有4人次。可以得知,在五月的比賽中兩聯盟間受傷記錄的人次差不多,但國家聯盟的投手受傷比率較高。

上面這個例子中,可以說明在同一個或類似的條件下(經常是時間),相同屬性的各項資料的比較。在這段文字中,我們所需要提取的資訊是13/8以及11/4。

以資訊屬性為軸的系列資料,我們稱做斷面(cross-section)。


簡單來說,就像是一筆資料--想像成二度空間座標A(2,3)與B(1,4),以X數據來說,A比B大;但Y數據則B比A大,就是這麼簡單,就可以應用在即時的論述分析上了!

下一篇想討論的是,如何將資訊歸納的結果做出即時的推論(inference & extrapolation)。

沒有留言: