データマイニング競馬で回収率を向上させる手法
JRA-VANにあるデータマイニングでは、控除率を引いた回収率75~85%に収束しています。
およそ十分なメリットがデータマイニングにはない感じがしますが、これは最適化されていないことも影響しています。
JRA-VANにあるデータはすでに一般化しており回収率に影響を与えるまでには至っていません。
もっとほかのことに目を向けて必要なデータを補完する発想が必要になります。
競馬で補完が必要な情報の筆頭格は能力値の可視化でしょう。
競走馬の能力を表す指数はいくらでもありますが、あまりに表面的すぎて比較検討ぐらいにしか使えないのが欠点です。
無理に数字にするよりもクラスに置き換える手法の方が現実的だと考えました。
この発想自体はカンタンでしたが、いざ実際に開発してみると天然素材で構成される競馬ならではの難しさを感じています。
競馬では完全な整合性はありえないので必ず曖昧さを残すことになります。
人間でさえ理にかなった行動をする生き物ではないのにサラブレッドは言うまでもないですから。
完璧を求めるのではなく一番効果のある部分を集約していくのが成功の近道だと感じました。
いまAIを用いた投資競馬を開発していますが、軸馬・穴馬が分かるため小額でも十分なリターンが目指せる仕様になっています。
裁判沙汰になった投資競馬は異常オッズを使ったものでしたが、是正された今では効果がなくリスクしか残りません。
AIを使った手法では似ても似つかない概念で構成されているので全く別物になります。
競馬の面白みはリターンの大きさにあります。
そのデカい配当にどうアクセスするかには人間の創造性が役に立ちます。
ただプラスにするだけなら、機械を扱うほかの公営競技の方が向いているでしょう。