はじめに
こんにちは。データ推進室の濱岡です。
本記事では、社内で開催したMLコンテストの上位3チームにインタビューしてきましたので紹介させて頂きます。
- 1位チーム:嵐山、渡邉、HUNG(フン)(+学生アルバイトさん1名)
- 2位チーム:阿内(+学生アルバイトさん2名)
- 3位チーム:下條、工藤
Recruit 機械学習コンテスト記事
コンテストの概要や問題設定に関しては以下の記事にてご覧ください
インタビュイー紹介
1位チーム
2位チーム
3位チーム
社内コンテスト参加のきっかけとは
- Q. 今回参加しようと思ったきっかけを教えてください
1位チーム
渡邉)
他のグループに所属する人とコミュニケーションをとる事が出来たり、競い合える事が面白そうだなと思ったからです。
1年目の新卒研修の時に似たようなコンペがあったのですが、その時は1位が取れなかったのでリベンジしたいと思いました。
フン)
他のデータ組織の人の発想やアイディアが知りたいという、好奇心が主な理由でした。
2位チーム
阿内)
学生アルバイトの方が3人いて、社内のコンテストをぜひ体験してもらいたかったからですね。
3位チーム
下條)
普段の業務であまり手を動かす機会がなくなってしまい、自分のリハビリも込めて、良い機会だなと思って参加しました。
工藤)
今業務では手を動かしてどんどん実装していく役割を担っているんですが、そこでもコンペの問題と同じようなモデルを作ってリリースし磨き込んでいくという事をしているので、参加する事で業務に活かす事ができそうだなと思い参加しました。
参加してみた結果!
- Q. では、実際に参加してみてどうでしたか?
1位チーム
フン)
チームビルディングという観点でも目的を達成したと思いますね。
渡邉さんと嵐山さん、僕はコンペの参加経験が少ないので、どう進めたらよいかと言う会話からスタートしました。
その段階から会話していくとデータ分析する時間が減ってしまう傾向はあると思うのですが、今回割とスムーズにいけましたね。
2位チーム
阿内)
個人的には期間が難しい所でした。
Kaggleだと3ヶ月同じデータを使って同じ事をするんですが、今回だと2日間で必要な情報を選びきりモデル構築までする必要があったためです。
色々な変数や、たくさんのデータをもらったのですが、2日間では見きれないなという感じがしたので、ハードなコンペではありました。
参加して良かったと思う点は、データ推進室で存在感を示せたことですね。
自分たちの実績が示せたり、伝わるようになったのは個人的にも嬉しかったです。
個人の力に加えて「このチームが強い」という、チームでの存在感を示せた事も良かったです。その点では今後、既存のチームで対抗する形式にしても面白いんじゃないかなと思ったりしました。
3位チーム
下條)
検討の最初からアウトプットを出すまでの一貫したプロセスを学ぶことができ、リハビリ的な効果はとてもありました。
社内利用可能な、コンテスト用に加工された行動履歴データを元に実施できたという事も良かったですね。
工藤)
荒居さんの
サンプルノートブック
についてはすごく勉強になりました。
実装の仕方とかこういう風に書いたら後々エンハンスしていきやすい書き方になるんだなとか、諸々勉強になったなと思います。
上位チームの解法を見ると、自分たちの解法に対して似通っている部分と違う部分があり、それぞれ参考になりました。
また「基礎分析で効く特徴量を探したのが一番効いた」という優勝チームの話が印象的で、スタンス面でも自分がやっている業務に活かせそうだなと思いました。
短期間でハードなコンペではあったが、サンプルノートブックの用意や、コンテスト用に加工されたデータ等の環境が整っており、業務に活かせる学びが得られた。
組織内で存在感を示せたことも良かった。
上位になれたポイントとは
- Q. 今回、上位になれた要因や背景はどこにあると思いますか?
1位チーム
嵐山)
チームで協力してたくさんの仮説を試せたからだと思います。
加えて、その仮説を資料に起こしながら進められたという事がポイントとして大きかったかなと思います。
渡邉)
チームビルディングも含めて、どうやって進めていくかなどが難しいポイントですが、今回上手くいったと思います。
自分がコンペに参加した事があるので、2日間の中でどうやって進めていったら良いのかという知見がある程度あったのと、嵐山さんのチームビルディングが上手だったので、上手くいったのかなと思います。
そこが学びになったポイントでもあります。
2位チーム
阿内)
3人いたので分担して議論できたのが良かったかなと思うのと、あとは経験も活かされていそうですね。
継続的にコンペに参加していると昔書いたコードや手法が蓄積されているので、短期間のコンペにおいては特にそうした経験の差が大きいかなと思います。
3位チーム
工藤)
時間が短くて、チームメンバーも2人と少なかったので時間を無駄にしないように気をつけました。どういう優先順位をつけて検討するか、タスクの組み立ては気を使ってやっていった感じですね。
それが結果として、この2日間という短い期間でもある程度の成果につながったのかなと思います。
チームビルディングの成功。また、タスク量の把握と最初の段階で役割分担や優先順位を決めて情報共有しながら進めた事。
- Q. 普段業務をする上で意識的にやっている事がそのままMLコンテストでも活かされた感じでしょうか?
3位チーム
工藤)
そうだと思います。業務と似通った進め方にはなっていたのかなと思います。
下條)
普段とは違い、あえてメンバーとリーダーが日頃の業務と役割を逆転して実施した事が良かったです。
僕は普段はリーダーですが、これがプロジェクトだとすると、リーダーは工藤さんになる。実装経験があり僕よりも技術レベルが高いのは工藤さんなので、工藤さん視点でどういう風にやるか決めて、タスクを振ってほしいと言ったんです。
普段と役割を逆転し、メンバーがリードしてリーダーが手を動かす。
そうするとリーダーはメンバーがやってる事がわかるし、メンバーはタスクを割り振るという事を経験できるし、とても学びがありましたね。
マネージャーと役割を逆転してみるのも面白いと思います。
工藤さんも時間内で優先順位をつけてやるべき事ができたので、他チームと比べてあまり作業時間が取れなかった面はありつつ、ある程度のアウトプットが出せていたと思います。
僕自身はなかなか精度が上げられなかったのですが、最終的には工藤さんのアイデアで精度を大きく改善する事ができました。
役割を逆転させてみても日頃の役割や立場の相互理解につながり、
仕掛けとして面白い!
社内コンテストだからこそ!普段の業務に活かされそうな事
- Q. 今回の参加で業務に活かされそうな事はありますか?
1位チーム
嵐山)
特徴量作成の引き出しが増えたと思っています。
加えて分析コンテストにおける定番の手法を身につける良い機会になったかと思います。
2位チーム
阿内)
荒居さんがやっていた手法(
サンプルノートブックについて
)が参考になったと言っている人が多いですね。
タスクに対して、こういう解き方をすると良いという事を知らない人は多いかなとは思います。
- Q. それはMLコンテストに参加してこそ得られる知見なのでしょうか?
1位チーム
嵐山)
そうですね。本やwebサイトを見れば書いてある内容ですが、コンテストを通して実装と改善のサイクルを繰り返すことができたので、ただ文献を眺めるよりも身についたように思います。
- Q. 実装内容を繰り返し試せる場というのは、業務環境にいるとあまり触れる機会がないものでしょうか?
1位チーム
フン)
そうですね。普段の業務だとPDCAが一度回るまでのスパンが長いのですが、今回のMLコンテストでは1~2日のスパンで3回くらい回せるので気持ちが良かったですね。
- Q. MLコンテスト未経験の人が参加すると、業務にプラスの影響が出るということもあるのですか?
2位チーム
阿内)
本当にMLコンテストは全員参加した方が良いと思うくらいですね。
とにかく色々な人が同時にいろんな事を試せるので。
業務では多くの人が同時にモデルを試すことができず、誰か1人が何個かのモデルを試せるくらいなんですが、MLコンテストでは違う。みんなが同時にいろんな事に取り組めて、これが上手くいったという知見がどんどん出てくるので、学びが多い所がいいですね。
3位チーム
下條)
実験のサイクルを回していく中でより早く効果を出すためには、データをどういう風に加工してどこを直せばいいか押さえておくことが重要です。
今回、荒居さんの
サンプルノートブック
を見て、そのことの大切さをすごく感じました。業務においても、機械学習実験を早く回すための設計をすることが思った以上に大事なんだなという事を学びました。
自己研鑽をしている?
- Q. 日頃、自己研鑽としてやっている事はありますか?
1位チーム
嵐山)
直近だと、同僚と統計検定の勉強をしています。
渡邉)
Nishikaに出るなどしています。
常に新しい技術に興味を持っている人が多いため、入社後も自己研鑽ができる場として同期と輪読会を開いたりもしています。
フン)
ABテストをする時、結果がはっきり出ない案件をきっかけに因果関係の勉強をする事はあります。
業務を通じて、自然にスキルアップにつながりますね。
2位チーム
阿内)
Kaggleとかですね。外部のコンペには参加するようにしています。逆にコンペ以外の自己研鑽はしていなくて…コンペですね(笑)
3位チーム
工藤)
業務内でどれだけ自己研鑽になる部分を作れるかを考えています。
所属しているグループでモデルレビュー会があるんですが、様々な層のマネージャーやKaggleマスターがいる中で、オンラインでのレビューの場があり、聞いているだけでも参考になります。
あとは、参加しているプロジェクトで「こういう学習方法にしたら結果が上がるのでは?」という風に実験的に取り組んだり、ノウハウを共有したり他の方の意見をもらったりもしていますね。
最後に
- Q. 今回のコンテストを振り返ってみていかがでしょうか?
フン)
人数が多いチームだったので、2日間で試せた仮説数が一番多かったのが自慢です。
加えて嵐山さんが仕切りをしてくれたことで、試せた数がさらに多くなったのだと思います。
渡邉)
チームメンバーみんなのスキルセットのレベルが揃っていたから、スムーズに進んだのではないかと思います。
スキルセットのレベルが揃っていると、それを踏まえて役割分担することができます。
例えばコード管理を例にとると、分からない人がいる事で管理手法に悩むステップが生まれてしまうので、そういったことがなかったのもかなりスムーズにいけた要因なのかなと思いました。
阿内)
横のつながりをコンテストの目的にするのであれば、全チームでそれぞれの知見を共有する場を設けたり、交流イベントを開催したりする事も良さそうだなと思いました。
工藤)
1、2位と違った点でいうと、特徴量を作る、前段階のデータそのものの基礎分析が大きな差を生んだのではないかなと思いました。
1位のチームは人数が多いですが、役割分担して進められていた印象があり、うちのチームでも活かせるはずだなと…
振り返ると、活かせていないリソースの部分もありそうなので、役割の切り分けなど含め、個人的に学びになりました。
上位になれた要因として考えられるのは
役割の工夫やモデル構築サイクルの設計、
スキルセットのレベルが揃っていた事。
今回データ組織として初のコンペ開催となりましたが、皆さん非常に楽しそうで、満足度高く終えることができました!
上位チームの勝利要因には個々人の技術力の高さだけでなく、スキルセットが揃っていることやチームワークなど日々の業務で大事になる要素が含まれており、新たな学びを得られる良い機会になったと実感しています。
本コンテストのように、データの専門集団が切磋琢磨しながらスキルを磨き合い、ヒトやナレッジの連携が強化される施策をこれからもどんどん実現していきたいと思います。 今後も様々なイベントや案件などの共有をしていきますので、ぜひブログでご覧いただけると嬉しいです!
一緒に働きませんか?
当社では、様々な職種のエンジニアを募集しています。興味のある方は、以下の採用ページをご覧ください。
===========================
===========================
データ推進室経営企画・人事
濱岡 みらい
データ組織の運営や組織活性施策の推進などをしています! 飲むこと食べることが大好きです。