プロ野球の2018年シーズンは、セ・パともに3月30日(金)に開幕します。
セ・リーグでは、いきなり巨人対阪神の黄金カードが組まれています。

5月29日(火)~6月17日(日)に開催されるセ・パ交流戦を挟んで、10月初めまで、ペナントをかけた戦いが繰り広げられるわけですが、今年はどのチームが優勝するでしょうか。
解説者や記者の予想をみると、パ・リーグではほとんどの人がソフトバンクの優勝を予想していますが、セ・リーグの方は、広島・阪神・DeNA・巨人の4球団に票が分かれているようです。

以下は、2000年から昨年までのセ・リーグ6球団の順位をグラフにしたものです。

昨年優勝の広島にとっては3連覇がかかるシーズンとなりますが、2000年以降、セ・リーグでは巨人(2007年~2009年と2012年~2014年の2回)以外には3連覇を達成したチームはありません。
昨年2位の阪神は、2005年以来13年ぶりの優勝を目指して、藤波投手の復調に期待するシーズンになります。
昨年、日本シリーズに進出したDeNAは、伸び盛りの若い選手達が経験を積んで、リーグ優勝が現実的な目標となってきています。
一方、昨年11年ぶりのBクラスに沈んだ巨人は、中日を退団した昨シーズンの本塁打王ゲレーロ選手を獲得して、戦力を充実させて臨むシーズンとなります。
こうしてみてくると、今年のセ・リーグは、広島から巨人まで、どのチームにも優勝の可能性が大きくありそうで、解説者や記者の予想が分かれるのも無理のないところでしょう。

そこで、今回は、過去のデータからセ・リーグの順位予想をしてみることとしました。
具体的には、ヒトの脳の情報処理を模倣したモデリング手法であるニューラルネットワークで、各球団の勝率を予測しました。
分析に使用したのは、2000年から昨シーズンまでの各球団の以下の成績です。
① 前シーズンの打率、得点、本塁打数、盗塁数、防御率
② 前2シーズンの打率、得点、本塁打数、盗塁数、防御率の対前年増減率
このうち、①は、チーム力の現在地を表す指標で、②は現在地まで登ってきたのか、下ってきたのかを表す指標になります。
分析の結果は以下の通りとなりました。

脚色を加えると、2018年シーズンは、夏場まで広島・阪神・DeNA・巨人の4球団の混戦が続き、終盤になって広島と阪神が抜け出し、最後は広島に1ゲーム差をつけて阪神が優勝するというシナリオでしょうか。

モデルの分析精度についてわかりやすく言うと、的中率は約75%です。過去の実績で3/4が決まるということは、長期的なチーム作りによる部分が3/4を占めるということでしょう。
モデルでは説明できない残りの1/4には、予想だにしない主力選手の故障による長期離脱や新戦力の台頭、監督の采配の冴え、ファンの熱い応援による後押し、などの影響が入ってくるものと思います。

シーズンの予想は、開幕前のこの時期にしかできません!
解説者などの専門家の「見立て」に、実績データでの予測分析結果も参考にして、皆さん独自の予想を立ててみてください。

【関連コラムなど】

アンケート/市場調査の作成・集計・分析
問題解決に役立つ多変量解析の使い方
多変量解析で深い洞察を!アンケートデータの効果的な分析方法
スポーツ・レジャー・観光
日本球界最強バッターは誰だ?
日本球界最強バッターは誰だ?
スポーツ・レジャー・観光
野球を科学する、セイバーメトリクス
野球を科学する、セイバーメトリクス