データマイニング
ねぇねぇねぇねぇ!ジャバード先生!!
こ、ことりん君、どうしたの??
この前、ひまわりミュージックさんのこと相談したでしょ?
その後、もう一回ひまわりミュージックさんのところにいってきたんだ。それで、改めて話を聞いてみたら、どうもデータマイニングっていうやつに興味があるらしいんだ。
なるほどね。たしかにひまわりミュージックさんだと、データマイニングをやってみると面白いかもしれないね。
そうなの?でも、データマイニングって、いまいち良くわからなくてさ…。ボク、仮想通貨のマイニングはだいぶ前からやっているんだけど、それとはまた別だよね??
仮想通貨のマイニングは、実際に仮想通貨を得るための作業を指しているよね。それとデータマイニングは別のものだね。でも、どちらもマイニング(採掘)という言葉が絡んでいる点はたしかに共通点があるといえるよね。
じゃあ、データマイニングも何かを見つけるっていうこと??
ことりん君、するどい!ことりん君が大好きな仮想通貨のマイニングは、仮想通貨を掘り当てる(得る)ことが目的なんだけど、データマイニングは「それまでは誰も知らなかったデータの関係性」を掘り当てる(検出する)ことが目的なんだ。
誰も知らなかった??データの関係性??どういうこと??
データマイニングの話をするときに、よく取り上げられるのが「オムツとビール」の話だね。ことりん君は「オムツとビール」の話を知ってる??
オムツとビール??うーん…。何も関係がなさそうな…。スーパーに売っている商品ってことくらいかな?
そうだね。どちらもスーパーで売っているものだよね。そのスーパーなんだけど、どういったお客さんがどういった商品を購入したというデータを蓄積しているんだけど、そのデータに対してデータマイニングをやってみたんだよ。
たしかに毎日たくさんのお客さんが来るから、膨大なデータがありそうだね!
そのデータマイニングの結果として「オムツ」と「ビール」という、一見まったく関連性がなさそうな商品が同時に購入されているケースが多いことがわかったんだ。
なるほど…。オムツの買い物を頼まれたパパさんが、ついでにビールも…って感じなのかな?
ことりん君みたいに、いろんなストーリーが考えられるけど、データマイニングでわかることはそういう事実があるってところだけだね。ただ、こういった事実があるのであればビール売り場の近くにオムツを配置することで、売上が上がる可能性は高まるよね。
なるほど!たしかにそうだね!そういったデータマイニングによって発見した法則みたいなものを経営に活用すれば、売上アップが期待できそうだね!
そういうこと!人間が何か関係を見つけだそうとすると、どうしても固定概念やバイアスがかかってしまうからね。さっきの例でいうと「オムツとビールは関係あるはずがない」と思って、おそらくそのようなポイントに着目することもないよね。
たしかにパッと見て関係がありそうなものに注目しがちかもしれない…
それに、そもそも人間の力だけで大規模なデータをチェックすること自体が難しいからね。
だからTableauとかQlikみたいなBIツールってやつが必要になるんだね!納得!ジャバード先生ありがとう!
はーい!またね!
データマイニングとは?採用に役立つ基礎知識
データマイニングとは、ビッグデータなどから人間が気付くことが難しい新たな関係性やパターンなどを検出することがです。このデータマイニングには、機械学習などといったAIの技術が活用されています。
データマイニングを行うエンジニア
データマイニングは、データサイエンティストやデータアナリストなどといったエンジニアが使用します。また、企業によっては、データマイニングエンジニアというデータマイニングのスペシャリスト的な職種が用意されていることもあります。
※ 内部リンク:データサイエンティスト
データマイニングを行うエンジニアの特徴と在籍業界
データマイニングは、データに新たな価値を見出すための技術です。そのため、好奇心が旺盛かつ論理的に物事を考えることができる人が多いです。なお、業界としては、ユーザー企業で働くエンジニア、SIer業界、コンサル業界などに在籍していることが多いです。
採用する時に知っておくとよいこと
データマイニングの活用方法
データマイニングは、あくまでもデータ分析のことであり、何でも解決できる魔法の技術ではありません。データマイニングによって検出されたデータの関係性は、非常に大きな価値を持つ可能性がある一方で、事実の1つにしかすぎません。そのデータの関係性をどう活かすかといった点は、ビジネス的な思考や経営に関するスキルが必要不可欠になります。
データマイニングエンジニアを採用する際は、業務としてどのあたりまでを経験したことがあるかを確認するとよいでしょう。
求人のポイント
求人を作成する時は、下記の内容を求人に入れるとよいです。
1システム(サービス)の詳細
※特にそのシステム(サービス)をなぜ作っているのかを熱量をもって記載する。
2開発環境
3現在のエンジニア組織の体制
4現行システムの課題と募集の背景
5求められる業務と期待値
6エンジニアとしてのスキルアップ支援制度の有無と詳細
7エンジニアチーム内での相互成長のための仕組み(勉強会やLT会など)の有無と詳細
8選考フロー
9待遇
10キャリアパス
データマイニングの豆知識
データマイニングを使った有名な企業・サービス
データマイニングは、日本国内でも様々なシーンで活用されています。ここでは、データマイニングに関するいくつかの事例を紹介します。
東芝社 プラント異常予兆検知AI
東芝は2021年12月7日に、データマイニングを活用したプラントに対する早期異常予兆検知AIを開発したと発表しました。このAIは従来の技術より12%程度良好な結果が得られているとのことです。なお、こちらの件については、後述するICDM2021 LITSAでも発表されました。
参考:MONOist 東芝がプラント異常予兆検知AIで新技術、大小2つの変動から正常状態を高精度予測
Insight Tech社 IDEAI
Insight Tech社は不満買取センターというWebサービスを運営している企業です。このサービスは2021年2月末時点で会員は52万人まで成長しています。また、2000万件以上の不満データが蓄積されています。IDEAIは、このビッグデータに対して、データマイニングをすることで、本当に価値がある不満を見つけ、新しいアイデアを創出するサービスを展開しています。
参考:日経クロストレンド 不満の声は宝の山 AIがアイデアの種を自動で発掘する新サービス
データマイニング関連の資格
データマイニングに関する資格は以下のようなものがあります。
データマイニング関連のイベント
データマイニングに関するカンファレンスは以下のようなものがあります。いずれも国際的なイベントです。
- ACM主催 KDD (Knowledge Discovery and Data Mining)
- IEEE主催 ICDM (International Conference on Data Mining)