約6000万人のビッグデータを『IBM SPSS Modeler』でデータ分析〜企業と消費者のための実践的なデータ分析に求められるもの〜


今回は実際に『IBM SPSS Modeler』を導入してデータ分析を行っている株式会社Tポイント・ジャパンを訪問しました。学生にはお馴染みのTポイントを管理・運営している企業です。大容量のデータをデータ分析する仕事のおもしろさについて、そして学生が陥りがちな「よくわからないけどデータ分析してみよう」という罠にはまらないためのヒントも伺いました。

お話をしてくれた方 山本 卓也さん
yamamoto大学卒業後、大手花卉小売業へ入社しデータベース・マーケティング部でデータ分析の仕事をスタート。外資系金融機関へ転職し、データ分析を行う。その後 TSUTAYA 総合研究所へ入社。現在は株式会社Tポイント・ジャパンにて、T ポイント提携先様の分析を担当するデータアナリストの育成にも携わっている。 明治大学農学部出身。
お話を聞いた人 青野 将大
MY FUTURE CAMPUS学生スタッフ
aonoサッカーサークルの他に学生団体に2つ入っていて、趣味はフットサルやサッカー、ボルダリングなどアクティビティ全般が好き。将来は日本ではなく、海外の勤務を希望している。成熟した市場ではなく、成長途上の国々で市場とともに、勤務企業の成長を成し遂げたいこと、マーケティングなどを通して国家ごとの文化の違いに触れたいと考えている。

日本人口の約半数にあたる会員数。大容量データを分析するシゴト

――MFC学生スタッフの青野です。私もTカードを利用しており、いったいどのように大量のデータを分析しているのか興味津々です。

山本さん それではまずTポイント・ジャパンの仕事から紹介します。青野さんがお話しされたように、株式会社Tポイント・ジャパンはTポイントを中心としたデータベース・マーケティング事業のほか、TSUTAYAの書店事業から広がるエンタテイメント事業も展開しています。現在Tポイントを導入している企業は158社ですが、地域の店舗とも提携しており、例えば地場のラーメン屋さんなど1店舗のみで導入しているケースも含めると、約56万店舗で使えます。多くの業界で利用できるポイントカードへ成長しました。青野さんの世代だと共通ポイントカードは当たり前かもしれませんが、全国の店舗で共通して使えるポイントはTカードが先駆けだったんですよ。

――CCCの中で山本さんはどのようなお仕事をされているのですか?

山本さん Tポイントの提携先企業からお預かりしている購買データを分析し、その分析結果を提携先企業へ報告しています。例えば青野さんがTポイントの提携先のコンビニエンスストアで買い物をしてTカードを店員さんに渡すと、そのデータはTポイント・ジャパンのセントラルデータに蓄積されます。そのデータを分析して、例えば男子大学生にはこの商品が人気だとコンビニエンスストア本社へ報告します。現在私はそれを行うデータアナリストを育成したり、分析環境の構築などのインキュベーションを行ったりしています。現在、Tポイントの会員数は約6000万人。日本人口の約半分ですが、その数をどこまで広げていけるのかという仕事もしています。

―― CCCには6000万人もの購買データが集まり、その分析に利用しているのがIBM SPSS Modeler ですが、他の分析ツールではなくIBM SPSSを使っている理由は?

山本さん データ分析の業界内では以前からIBM SPSS Modelerは小売りに強いと言われていました。IBM SPSSは相対的に安価というメリットもあるのですが、次の2つの点からIBM SPSS Modelerが当社に適していると判断しました。まず1つめは大容量データの処理が速いという点です。そして2つめはデータマイニングの手法が豊富ということです。Tポイントのデータはもはやビッグデータと化しており、大容量データをマイニングするにはIBM SPSS Modelerは欠かせないツールです。今は大量消費ではなく、消費者一人ひとりのニーズに対応する One-to-Oneマーケティングの時代です。そこで必要になるのが集団の中から似たものを集めて分類するクラスター分析です。それに強いのがIBM SPSS Modelerです。

_dsc0015

大局的な視点から本当に必要なデータ分析のみを行う

―― IBM SPSS Modelerが大量データ分析に適していることはわかりましたが、では実際にどのように分析していくのですか?

山本さん まず分析の一連の流れを整理しておくと、クライアント企業から課題のヒアリング→関連する情報やデータの収集→仮説の設定→データのクレンジングと概要把握→仮説の再設定→分析設計→分析→分析結果の検証→クライアント企業への報告・提案→実際の課題への対応→結果の効果検証となります。収集したデータをクレンジングした後にすぐ踏み込んだ分析するのではなく、まずはデータマイニングの手法を用いてデータの外れ値や全体の傾向をつかみます。おそらく青野さんは仮説からどうやって分析を設計していけばよいのかを聞きたいのではないですか?

―― まさにそこを聞きたかったんです。おそらく多くの学生もその部分で悩んでいるのではないかと。以前、IBMのSPSS担当者の方に取材し「データ分析には、その領域において前提となる知識が必要だ」ととても大きなヒントをいただいたのですが、実際にデータ分析に携わっている山本さんは、どこに注意して分析を進めておられるのですか?

山本さん 私の場合は提携先企業つまりクライアントからこのような課題があり、それを解決するために分析してほしいという依頼を受けます。課題解決という明確な目的があるためどのような分析が必要かを設計しやすくなります。例として、業績の落ちているAスーパーから売上が落ちた原因を分析してほしいと依頼されたとしましょう。青野さんならどこから調べますか? そのお店を利用している顧客分析や何を買っているのかという購買分析などを思い浮かべていませんか?

―― 確かに客層やその地域の住人の年収や年齢などを分析しようとするかもしれません。せっかくIBM SPSS Modelerがあるので、それを使ってなんとか傾向や手がかりをつかもうとすると思います。

山本さん それも間違いではないのですが、もう少しフラットに大局的に見てみましょう。実はこのAスーパー、なんと近くに競合のBスーパーができ、そこが連日安売りをしていました。それが売り上げ不振の大きな原因である可能性が見えてきますね。あるいは売上が落ちているのはAスーパーだけでなくスーパーマーケット業界全体の売上が下がっていることも考えられます。つまり私が言いたいのは売り上げ不振の原因追及という課題について、データ分析をしなくても分かる部分もあるということです。何もかもやみくもにIBM SPSS Modelerで分析するのではなく、まずは課題について大局的な視点から見ること。そして課題解決のために本当に必要な分析を行うことです。課題に対して仮説を立て、その仮説はどのデータで説明できるか、どう説明するかを考えながら分析設計をすることで、本当に必要な分析を実現していきます。

_dsc0073

permalink.
PAGE TOP