Kaggleでソロ金メダル獲得!primeNumber若松さんがデータの力で世界に挑む

primeNumberでデータアナリストとして活躍する若松拓夢さんが、世界最大級のAIコンペティション「Kaggle」で金メダルを獲得しました。参加した1727チームの中で、ソロで7位になる快挙を達成した若松さんに、金メダル獲得までの道のりと今後の展望についてお話を伺いました。

世界中で20万人が競うデータ分析コンペティションへの挑戦

――まずは自己紹介をお願いします。

プロフェッショナルサービス本部でデータアナリストをしている若松です。入社は2023年10月で、ちょうど1年半ぐらい経ったところです。

現在はクライアント向けに、DataOpsの実行支援を行っています。またその一環として、データカタログの市場調査や社内でのSalesforceのデータ活用業務にも従事しています。

――Kaggleについて、詳しく教えてください。

Kaggleは世界中で開催されているデータ分析コンペティションで、主にデータサイエンス分野の課題に取り組みます。登録者は20万人を超え、1回のコンペには数百人から数千人が参加します。

成績に応じてメダルが授与されるのですが、1000以上のチームが参加するコンペでは上位10%がメダル対象で、金メダルは上位0.2%か、上位10チームに当たります。メダルを複数獲得することで「Expert」「Master」「Grandmaster」といった称号を獲得できる仕組みになっています。

https://www.kaggle.com/ より

――Kaggleを始めたきっかけを教えてください。

データサイエンティスト協会が提供しているデータサイエンティスト養成講座を受講し、コンペ形式のトレーニングの面白さに魅力を感じたんです。国内の「SIGNATE」というプラットフォームでコンペに出場する中で、「Kaggleにも挑戦したい」という気持ちが芽生えました。

その後、さらに学習を深めたい人向けの「コンペ部」に参加し、チームでKaggleに挑戦するようになりました。

選択と集中が鍵。1週間で掴んだ金メダルへの道

――金メダルを獲得したコンペの内容について教えてください。

NCAAの大学バスケットボールリーグにおける各チームの対戦勝率を予測するコンペで、開催期間は約1ヶ月、参加者は約2,000人でした。過去大会のシード情報や対戦結果といったデータを使いながら勝敗を予測し、実際の勝敗と比較してスコアを競い合います。私は、過去のシード情報や予測したシード情報等をもとにしたモデルをベースに、特定条件に該当する場合は数学的な根拠から勝率100%で予測値を出すという、2つの解法の組み合わせで勝率を算出しました。

――このコンペを選んだ理由はなんだったのでしょうか?

実は、その直前まで約4ヶ月開催されていた別のコンペに、会社のメンバーと全力で取り組んでいたのですが、メダルを獲得できずに終わってしまいました。

一方で、普段参加しているデータサイエンティスト養成講座のコンペ部では継続してメダルを取れていました。なので自分もメダルを取りたいと改めて思い、反省をすぐに活かせるコンペがないかと探した所、NCAAバスケコンペが開催中だと知ったんです。NCAAバスケコンペは毎年開催されているので、過去の解法をうまく活用すればメダル獲得の可能性があるのでは、と考えました。

――わずか1週間という短期間で金メダルを獲得したとのことですが、その秘訣を教えてください。

前回のコンペで良い解法をうまく選択できず失敗してしまったので、今回は「過去に実証済みの解法」だけに集中することにしたんです。

Kaggleには「ディスカッション」という参加者同士の議論の場があり、そこで過去4、5年間のNCAAコンペで実際にメダルを獲得した解法を見つけることができました。強力な解法を2つ組み合わせることで、短期間でも成果につなげることができたと思います。

――同じ解法を参考にしている人もいたと思いますが、なぜ若松さんが金メダルを獲得できたのでしょうか?

情報のキャッチアップと、その活用方法に差があったと思います。多くの人が同じ議論を見ていても、それを実際に効果的に組み合わせられたかどうかが勝負の分かれ目でした。

また、ベースとして参考にしたプログラミング手法も、過去にNCAAコンペで何度も結果を出している、他のコンペでもメダルを獲得している実績のある方のものを選びました。過去の実績に裏打ちされた手法に集中的にコミットしたことが成功につながったと考えています。

――一人で取り組む上での苦労や工夫はありましたか?

「自分が結果を出さなければ何も始まらない」というプレッシャーがありました。とはいえ、「自分がこれで行く」と決めたことを最後まで貫けたのも、良かったポイントだと思います。

Kaggleに触れることでデータを扱う「勘所」が向上。来年までに「マスター」を目指す

――Kaggleでの経験は日頃の業務にどう活かされていますか?

直接的ではありませんが、Salesforceのデータを扱う際、データの解釈やあるべきデータ構造を考えるのに活かされていると思います。また、普段のプログラミング業務でもSQLを使ってデータの整合性や値の一致を細かくチェックする習慣が身につきました。

業務外でKaggleやデータに触れることで、データを扱う際の「勘所」が向上したと実感しています。

――逆に、日頃の業務経験が今回の金メダル獲得にどう寄与しましたか?

データを扱う会社にいることで培った「こういう観点でデータを見る」という視点が、今回の解法選択において参考になりました。普段からデータを扱っているからこそ、「この手法なら効果的だろう」という判断ができたと思います。

――Kaggleにおける今後の目標はありますか?

「マスター」になることが目標です。現在、金メダル1枚と銀メダル1枚を持っているので、あと銀メダル1枚獲得すれば達成できます。今年から来年にかけて実現したいと考えています。

――業務面での目標はいかがですか?

社内でも「AI-Ready」という文脈が重要視されているので、今回の経験を活かして生成AIの活用分野で貢献していきたいです。

特に、AIモデルの精度向上において、今回学んだ「学習データの選択・加工方法」は重要になります。たとえば、どのようなデータを組み合わせれば良い結果が得られるか、どういうデータセットを学習させれば精度が向上できるか?といった技術は、生成AIをprimeNumberのサービスに組み込む際に活用できるスキルだと考えています。

――ありがとうございました!


primeNumberで働くことや、primeNumberの提供するサービスにご興味を持った方は、ぜひお気軽にご連絡ください!

https://herp.careers/v1/primenumber/wB-_PmHTlis6

https://primenumber.com/contact