JRA-VANのデータを30年分DBに入れて検証しています。
全レース全馬の単勝を100円づつ購入した場合の回収率を検証していますが、どの年も71%前後です。同じように検証した人いますか?
Kamiさん、おはようございます。
今まで特に気にしてなかったけど、頭の体操かねて試しました。うちはSQLiteで票数1の票数は単勝票数というカラムにJV-Dataの仕様書のまま格納してUUFFFFFFFFFFFNN的に頭数分が入ってるので、
WITH RECURSIVE 馬票展開 AS (
SELECT
開催年月日,
競馬場コード,
レース番号,
SUBSTR(単勝票数, 1, 15) AS chunk,
SUBSTR(単勝票数, 16) AS rest,
1 AS idx
FROM 票数1
WHERE 単勝票数 IS NOT NULL
UNION ALL
SELECT
開催年月日,
競馬場コード,
レース番号,
SUBSTR(rest, 1, 15),
SUBSTR(rest, 16),
idx + 1
FROM 馬票展開
WHERE LENGTH(rest) >= 15
),
単勝票 AS (
SELECT
開催年月日,
競馬場コード,
レース番号,
CAST(SUBSTR(chunk, 1, 2) AS INTEGER) AS 馬番,
CAST(SUBSTR(chunk, 3, 11) AS INTEGER) AS 票数,
CAST(SUBSTR(chunk, 14, 2) AS INTEGER) AS 人気
FROM 馬票展開
),
単勝売上 AS (
SELECT
開催年月日,
競馬場コード,
レース番号,
SUM(票数) AS 単勝票数合計
FROM 単勝票
GROUP BY 開催年月日, 競馬場コード, レース番号
)
SELECT
h.開催年月日,
h.競馬場コード,
h.レース番号,
s.単勝票数合計 * 100 AS 単勝売上金額,
COALESCE(p1.票数, 0) * h.単勝払戻_払戻金1 +
COALESCE(p2.票数, 0) * COALESCE(h.単勝払戻_払戻金2, 0) +
COALESCE(p3.票数, 0) * COALESCE(h.単勝払戻_払戻金3, 0) AS 払戻合計,
ROUND((
COALESCE(p1.票数, 0) * h.単勝払戻_払戻金1 +
COALESCE(p2.票数, 0) * COALESCE(h.単勝払戻_払戻金2, 0) +
COALESCE(p3.票数, 0) * COALESCE(h.単勝払戻_払戻金3, 0)
) / (1.0 * s.単勝票数合計 * 100) * 100, 1) AS 払戻率
FROM
払戻 h
JOIN 単勝売上 s
ON h.開催年月日 = s.開催年月日
AND h.競馬場コード = s.競馬場コード
AND h.レース番号 = s.レース番号
LEFT JOIN 単勝票 p1
ON h.開催年月日 = p1.開催年月日
AND h.競馬場コード = p1.競馬場コード
AND h.レース番号 = p1.レース番号
AND p1.馬番 = h.単勝払戻_馬番1
LEFT JOIN 単勝票 p2
ON h.開催年月日 = p2.開催年月日
AND h.競馬場コード = p2.競馬場コード
AND h.レース番号 = p2.レース番号
AND p2.馬番 = h.単勝払戻_馬番2
LEFT JOIN 単勝票 p3
ON h.開催年月日 = p3.開催年月日
AND h.競馬場コード = p3.競馬場コード
AND h.レース番号 = p3.レース番号
AND p3.馬番 = h.単勝払戻_馬番3
WHERE
h.単勝払戻_払戻金1 IS NOT NULL;
って感じで実行しました。1986年からしばらく75%前後、90年代辺りから80%前後とかになってるのかな? たまに5%上乗せとかで85%前後もあったりする感じです。このきっちり75%とか80%にならないのって単純に1円単位の払戻がないから例えば215円の単勝が210円なのか220円なのか知らないけどこの誤差×票数で若干ずれてる感じではないのかなぁと思うけど。
こんにちは。
全馬を均等に100円買ってもダメです。
返金率(俗にテラ銭)80%というのは、全ての売り上げから20%を控除して
残りの80%を当選者に分配する、という仕組みです。
全馬の単勝を100円ずつ買ったのでは人気薄は買いすぎ、人気馬は買い足りないです。
売り上げ比率に合わせて購入する必要があります。
過去20年のデータをPosgreに取り込みGemini cliで自動コーディングしてたのしんでます。
目からウロコの情報でした。人気馬が売れすぎていても長めで見たら80%になるものと信じてました。長い目でみれば人気薄が来ればその分配当が高くなるとお思ってました。
100円づつ購入したら73くらいが正しい?
逆にいえば確率的には人気薄を買い続けた方が期待値はたかい?
検証ありがとうございました。高くなる年は何年でした?私も再検証したいので。
Kamiさん、おはようございます。
これ、Copilotに普通に質問ぶつけたら1995年と言われました。つまり、Kamiさんが取り込んでいる過去20年だと全て80%ですね。ああ、厳密にはなんでしたっけ、JRAプレミアムとかで5%上乗せとかあるので全てではないですね^^;
確か一般論的に全馬100円づつ買うと控除率になるのがオッズだった気がしたのですがpre21さんは違うって書かれてますね。
期待値の考え方も色々とあるかと思います。その昔、ニフティのコミュニティで2番人気狙いとか言ってた方が居ました。1番人気の来る確率が3割程度とかって話とか、そんな話から2番人気の来る確率と平均オッズとの兼ね合いからの話かと思います。
期待値ってその馬が勝つ確率とオッズから、例えば勝率20%だと5倍以上ないと期待値100%超えないですよね? 穴狙いも単純に期待値が高いとは限らないかと。勝率1%とかで万馬券狙い。100回買って1回当たるかも?これ多分資金面が絡むんだと思うし、自分の場合週末72Rで1回も当たらないと相当凹みます(笑)
オッズオンリーで機械学習やると20倍あたりに若干エッジが出ますね。まあそれだけじゃ全然儲からないんですが。