最近、データマイニング言葉を聞いて、興味深くなり、意味を調べてみた。
データマイニングとは、
データから潜在的なニーズなどを掘り起こすという意味らしいが、
そこから転じて、
膨大なデータを解析する事で、それまで明らかになっていなかった有益な情報を引き出す
というニュアンスで解釈するらしい。
世にデータマイニングの事例を最初に紹介したのは、
1992年12月23日付「ウォールストリートジャーナル」掲載の「Super Computer Manage Holiday Stock」という記事だったといわれていて、
記事の内容は、
【アメリカ中西部の小売ストア・チェーン Osco Drugs は、25店舗のキャッシュレジスターのデータを分析したところ、ある人が午後5時に紙おむつを買ったとすると、次にビールを半ダース買う可能性が大きいことを発見した。】
というもので、
「紙おむつと缶ビール」という意外な組み合がある事がわかったということで大きな話題になり、
今でもデータマイニングの有効性を示す例としてしばしば世界中で引用されているらしい。
サッカーにおいても、昨今、多くのデータ分析がされていて、
たった1試合でも、ものすごい量の情報が数字として現れる。
数字と結果に、確実な相関関係がないのがサッカーの面白いところで、
ボール支配率が高ければ勝つわけじゃないし、走行距離が増えれば勝つわけでもない。
だが、この分析もよくよく考えれば、
全体像を見た時の話で、
チーム単位でうまくデータを見比べたら、
あるチームは、支配率が高い時に試合に勝てる傾向があり(その逆もしかり)、
あるチームは、走行距離が多い試合に勝てる傾向が見られる。
そんな見方もできる。
データは、適切に活用すれば、何かのヒントになったり、答えになったりするという事だ。
先ほどのオムツの話でも分かるように、
データは、相関関係を示してくれる。
例えば、、、
雨が降った時に渋滞が起こりやすい
は感覚的に分かる部分で、おそらくデータを分析しても同じような結果が出ると思うが、
こういった相関関係を調べてみると、面白い結果が見られそう。
データを分析するには、あらゆるシステムが必要で、こと少年サッカーにおいては、
その是非まで考え出すと、
必要・不必要な項目の切り分けが、可能性・創造性を損なわないという観点で行われるべきと思うが、
データ分析とはいかないまでも、
雨と渋滞のように、感覚知の部分で、それぞれが自己分析できる
くらいはやれないといけないと思う。
ボールを多く触れた時に、いいプレーができた
よく走れた時にはゴールを決められる
守備をサボってる時間が多いゲームは、ボールが触れない
みたいな。
ちなみに、、、
赤いパンツを履いてる時は、試合に負ける事が多く、黒いパンツを履いてる時は、試合に勝つ事が多い。
これは、俺のパンツセレクトと勝敗の相関関係。
いやいや、これは験担ぎの話で、データとはかけ離れている話しか。。。
うちの闘将も今髪を伸ばしてるらしく、全日前にサッパリ坊主にすると言っている。
サッパリしたら良いプレーができるのも験担ぎで、これも、相関関係を示すものではない(笑)
でも、
こんな験担ぎをしてでも、勝ちたいのが全日。
新人戦決勝は、打倒ロアッソの意味を込めて赤パンツ履いたが大敗したんで、
今大会は全て黒パンツで臨もう。
ヒデ君は、験担ぎで、試合前はちゃんとコーラを飲んでください。
