Kaggle

この記事はKaggleについて解説した記事です。会話形式のやさしい文章で「Kaggle」の用語のイメージを紹介した後に、採用に役立つKaggleの知識を解説しています。

1分で分かる!Kaggleとは?

ジャバード先生!いきなりだけど…海賊王にボクはなる!

一体どうしたの?なんかマンガで聞いたことがあるようなセリフだね…。

いや、自由気ままに賞金を稼いで暮らすのって楽しそうじゃない?そんな生活してみたいなと思ってさ!

ことりん君、だいぶお疲れのようだね…。海賊とはちょっと違うかもしれないけど、賞金稼ぎならKaggle (カグル)に参加してみるっていう方法もあるよ。

Kaggle?

そうそう。Kaggleは、データサイエンスのプラットフォームなんだ。

どういうこと?

簡単にいうと、Kaggleにはデータサイエンスに関わる人や組織がたくさん集まっているんだよ。いろんな機能があるんだけど、その中でもコンペティションと呼ばれる大会は、高額な賞金がでることがあるんだ。

高額っていっても、大したことないんでしょ?ボクは騙されないからね!

過去には3億円ってやつもあったみたいだね。それはさすがに珍しいみたいだけど、賞金総額数千万円くらいなら割とあるみたいだよ。

え、そんなにもらえるの…?どういう仕組みなの?

さっきKaggleはプラットフォームと言ったけど、もう少し詳しく説明すると、Kaggleには「課題」を投稿することができるんだ。

課題?

そうそう。たとえばジョージア州立大学は「生徒の作文を自動的に評価したい」という課題をKaggleに投稿しているんだ。他にもいろんな課題を持った組織、人がさまざまなお題をアップしているよ。

みんないろいろ困っているんだね…。

そのお題を解決するのは、Kaggleに参加しているデータサイエンティストなんだ。

データサイエンティストがどうやってお題を解決するの?

データサイエンティストは、最適な予測モデルを構築するんだ。その予測モデルを利用すれば、「お題」に対する高い精度の予測ができるようになるんだよ。厳密には解決というより、解決策の提示の方がしっくりくるかもしれないね。

なるほど…。「お題を解決に導いてくれたら賞金をあげるよ」っていう人と「そんなに困っているなら、お題を解いてあげるよ」っていう人が集まっている…って感じだね!

そんなイメージだよ!そして、そのお題によっては、賞金が設定されていたり、Kaggle内のランクを上げるために必要なポイントをもらえたりするというわけなんだ。

なるほどねぇ。でも賞金がもらえないお題には参加したくないなぁ。

そう考える人もいるかもしれないね。でも、Kaggleの上位ランカーというのは、市場でも高く評価されるからね。上位ランカーを目指している人も少なくないんだよ。

そんなに価値があることなんだね。Kaggleに参加して上位ランカーになれれば、富と名声を得ることができるってことだね!まさに現代の海賊じゃん!

あ、Kaggleで上位ランカーになるのは至難の業だからね…って、最後まで聞かずにいっちゃったか…。

Kaggleとは?採用に役立つ基礎知識

Kaggleとは、データサイエンティストや統計に関する専門家、および企業が集うプラットフォームです。また、Kaggleを運営している企業をKaggle社といいます。同社は2017年、Googleによって買収されました。そのため、現在はAlphabet (Google)社の参加となっています。

企業、大学、その他様々な組織が課題をKaggle上にアップします。Kaggleに登録したエンジニア(チームや個人)は、それらの課題を解決するための予測モデルや分析手法を実装します。それらの結果はランキング化されるだけではなく、高額な賞金を獲得することが可能です。

そのほかにも、すぐに利用できる「データセット」や、機械学習に関するコードおよび実行環境、ディスカッションスペースなど、様々な機能を提供しています。

Kaggleを使うエンジニア

Kaggleを使うのは、データサイエンティストなど、機械学習に関連するエンジニアです。なお、Kaggleに登録(参加)しているエンジニアは「Kaggler (カグラー)」と呼ばれます。

Kaggleを使うエンジニアの特徴と在籍業界

Kaggleは、何かを実現する類のサービスではありません。エンジニアにとっては、データサイエンスに関するスキルを磨く場所であったり、評価や賞金を得る場所です。Kaggleには、さまざまなレベルのエンジニアが参加していますが、総じて成長意欲が高いという特徴があるといえるでしょう。

なお、Kagglerはさまざまな業界に在籍しています。たとえば、DeNAにはKaggle Rankerが複数人在籍しており、社内の教育にも採用しています。

参考:DeNA Kaggle Rank

採用する時に知っておくとよいこと

Kaggle Ranker

Kaggleに参加しているKagglerの中でも、特に優秀な成績を収めている人をKaggle Ranker(Kaggle上位Ranker)と呼びます。Kaggle Rankerは、データサイエンス業界界隈では、非常に高い評価を受けています。ある企業では、中途採用時にKaggle Rankerを優遇する制度が設けられているほどです。

今後、AIがますます伸びていくことが予測される現在、データサイエンティストの採用は厳しい状況となっています。Kaggle Rankerは、さらに絶対数が少ないため、貴重な人材であることは理解しておきましょう。

求人のポイント

求人を作成する時は、下記の内容を求人に入れるとよいです。

1.システム(サービス)の詳細
※特にそのシステム(サービス)をなぜ作っているのかを熱量をもって記載する。
2.開発環境
3.現在のエンジニア組織の体制
4.現行システムの課題と募集の背景
5.求められる業務と期待値
6.エンジニアとしてのスキルアップ支援制度の有無と詳細
7.エンジニアチーム内での相互成長のための仕組み(勉強会やLT会など)の有無と詳細
8.選考フロー
9.待遇
10.キャリアパス

Kaggleの豆知識

Kaggle関連の資格

Kaggleに関連する資格としては、以下のようなものがあります。

Kaggle Progression System

Kaggle社は、Progression Systemという制度を運用しています。Kaggle社のコンペティションに参加し、優秀な結果を収めると、Gold、Silver、Bronzeという3段階のメダルを獲得可能です。このメダルを獲得するのは非常に難易度が高いため、このメダルを持っているエンジニアは高く評価されます。

参考:Kaggle Progression System

G検定/E資格

日本ディープラーニング協会は、ディープラーニングに関する基礎知識や活用能力を問うG検定、ディープラーニングの理論、または実装スキルを問うE資格という認定試験を実施しています。これらの資格も、IT業界では高く評価されている資格です。

参考:G検定/E資格

Kaggle関連のイベント

Kaggleに関連するイベントとしては以下のようなものがあります。

Kaggle Days Championship

 Kaggle Days Championshipは、 Kaggle社とLogic AI社が共催するイベントです。このイベントでは、与えられたテーマに対して予測を行い、その結果を競い合うコンペティションが実施されます。

参考:Kaggle Days Championship

 

関連記事

  1. 機械学習・ディープラーニング

  2. ACCESS

  3. linux

    Linux

  4. Heroku

  5. データマイニング

  6. EC2