RSS

データを分析することの難しさ

 馬券も含めてダート未勝利戦についての話がひと段落しましたので、再び休憩ということで、今回はスピード指数を分析することの難しさについて書いてみようと思います。

 スピード指数の分析をするというのは、ほとんどの場合、統計データをとるということになりますデータをとるのは簡単ですが、適切な分析をすることは非常に難しいものです。

 例えば、未勝利戦の前走指数の高さごとにABC…とランクづけして、それぞれ次走成績を調べるとするじゃないですか。
 その結果、Aは勝率35%、Bは20%、Cは10%となった場合、これをもってAという指数レベルの馬は勝率35%程度と言えるかと言うとそうではないんですね。なぜかと言うと、指数以外の要素を全て無視しているからです。
 指数の高い馬には、当然着順上位の馬が多く、指数の低い馬には着順下位の馬が多くなります。着順上位と下位を比較して上位着順の馬の方が成績がいいのは当然ですから、指数以外の要素を無視して分析するのは問題があります。

 とは言え、場、距離、着差、頭数、ペース、レース間隔…など、さまざまな要素が複雑に絡み合う競馬において、全ての条件を同じにして統計をとることは無理ですから、無視していい部分は無視しながら、データを単純化していく必要があります。

 この、どこまでを無視して、どこからは無視してはいけないかを考えるのが、分析においては非常に重要で、この部分のさじ加減次第では、全く正反対の結論にさえなりかねません。スピード指数でもそれ以外でも、競馬のデータを分析するというのは本当に難しいもんなんです。

 ここまでも、なるべく分かりやすく説明するために、いくつかデータを挙げて説明していますが、データを出されるともっともらしく見えてしまうので、あまりデータに頼りすぎるのも危険です。
 これまでに出したデータについても、半分疑ってかかるくらいでちょうどいいと思います。 
トラックバック
トラックバック送信先 :
コメント
▼このエントリーにコメントを残す

   

プロフィール

とりおやこプロ

Author:とりおやこプロ
「とりおやこ式」へようこそ!

こちらは、
スピード指数による競馬予想サイト
「とりおやこ'S競馬」のブログです。

HOME(とりおやこ'S競馬)

プロフィール

Twitter

最近の記事

最近のコメント

リンク

『とりおやこ’S競馬』ショートカット

カテゴリ

月別アーカイブ

01  11  10  09  08  07  06  05  04  03  02  01  12  11  10  09  08  07  06  05  04  03  02  01  12  11  10  09  08  07  06  05  04  03  02  01  12  11  10  09  08  07  06  05  04  03  02  01  12  11  10  09  08  07  06  05  04  03  02  01  12  11  10  09  08  07  06  05  04  03  02  01  12  11  10  09  08  07  06  05  04  03  02  01  12  11  10  09  08  07  06  05  04  03  02  01  12  11  10  09  08  07  06  05  04  03  02  01  12  11  10  09  08  07  06  05  04  03  02  01  12  11  10  09  08  07  06 

カウンター

ブログ内検索

RSSフィード