約6000万人のビッグデータを『IBM SPSS Modeler』でデータ分析〜企業と消費者のための実践的なデータ分析に求められるもの〜


今回は実際に『IBM SPSS Modeler』を導入してデータ分析を行っている株式会社Tポイント・ジャパンを訪問しました。学生にはお馴染みのTポイントを管理・運営している企業です。大容量のデータをデータ分析する仕事のおもしろさについて、そして学生が陥りがちな「よくわからないけどデータ分析してみよう」という罠にはまらないためのヒントも伺いました。

お話をしてくれた方 山本 卓也さん
yamamoto大学卒業後、大手花卉小売業へ入社しデータベース・マーケティング部でデータ分析の仕事をスタート。外資系金融機関へ転職し、データ分析を行う。その後 TSUTAYA 総合研究所へ入社。現在は株式会社Tポイント・ジャパンにて、T ポイント提携先様の分析を担当するデータアナリストの育成にも携わっている。 明治大学農学部出身。
お話を聞いた人 青野 将大
MY FUTURE CAMPUS学生スタッフ 東京大学3年生 農学部国際開発農学専修
aonoサッカーサークルの他に学生団体に2つ入っていて、趣味はフットサルやサッカー、ボルダリングなどアクティビティ全般が好き。将来は日本ではなく、海外の勤務を希望している。成熟した市場ではなく、成長途上の国々で市場とともに、勤務企業の成長を成し遂げたいこと、マーケティングなどを通して国家ごとの文化の違いに触れたいと考えている。

日本人口の約半数にあたる会員数。大容量データを分析するシゴト

――MFC学生スタッフの青野です。私もTカードを利用しており、いったいどのように大量のデータを分析しているのか興味津々です。

山本さん それではまずTポイント・ジャパンの仕事から紹介します。青野さんがお話しされたように、株式会社Tポイント・ジャパンはTポイントを中心としたデータベース・マーケティング事業のほか、TSUTAYAの書店事業から広がるエンタテイメント事業も展開しています。現在Tポイントを導入している企業は158社ですが、地域の店舗とも提携しており、例えば地場のラーメン屋さんなど1店舗のみで導入しているケースも含めると、約56万店舗で使えます。多くの業界で利用できるポイントカードへ成長しました。青野さんの世代だと共通ポイントカードは当たり前かもしれませんが、全国の店舗で共通して使えるポイントはTカードが先駆けだったんですよ。

――CCCの中で山本さんはどのようなお仕事をされているのですか?

山本さん Tポイントの提携先企業からお預かりしている購買データを分析し、その分析結果を提携先企業へ報告しています。例えば青野さんがTポイントの提携先のコンビニエンスストアで買い物をしてTカードを店員さんに渡すと、そのデータはTポイント・ジャパンのセントラルデータに蓄積されます。そのデータを分析して、例えば男子大学生にはこの商品が人気だとコンビニエンスストア本社へ報告します。現在私はそれを行うデータアナリストを育成したり、分析環境の構築などのインキュベーションを行ったりしています。現在、Tポイントの会員数は約6000万人。日本人口の約半分ですが、その数をどこまで広げていけるのかという仕事もしています。

―― CCCには6000万人もの購買データが集まり、その分析に利用しているのがIBM SPSS Modeler ですが、他の分析ツールではなくIBM SPSSを使っている理由は?

山本さん データ分析の業界内では以前からIBM SPSS Modelerは小売りに強いと言われていました。IBM SPSSは相対的に安価というメリットもあるのですが、次の2つの点からIBM SPSS Modelerが当社に適していると判断しました。まず1つめは大容量データの処理が速いという点です。そして2つめはデータマイニングの手法が豊富ということです。Tポイントのデータはもはやビッグデータと化しており、大容量データをマイニングするにはIBM SPSS Modelerは欠かせないツールです。今は大量消費ではなく、消費者一人ひとりのニーズに対応する One-to-Oneマーケティングの時代です。そこで必要になるのが集団の中から似たものを集めて分類するクラスター分析です。それに強いのがIBM SPSS Modelerです。

_dsc0015

大局的な視点から本当に必要なデータ分析のみを行う

―― IBM SPSS Modelerが大量データ分析に適していることはわかりましたが、では実際にどのように分析していくのですか?

山本さん まず分析の一連の流れを整理しておくと、クライアント企業から課題のヒアリング→関連する情報やデータの収集→仮説の設定→データのクレンジングと概要把握→仮説の再設定→分析設計→分析→分析結果の検証→クライアント企業への報告・提案→実際の課題への対応→結果の効果検証となります。収集したデータをクレンジングした後にすぐ踏み込んだ分析するのではなく、まずはデータマイニングの手法を用いてデータの外れ値や全体の傾向をつかみます。おそらく青野さんは仮説からどうやって分析を設計していけばよいのかを聞きたいのではないですか?

―― まさにそこを聞きたかったんです。おそらく多くの学生もその部分で悩んでいるのではないかと。以前、IBMのSPSS担当者の方に取材し「データ分析には、その領域において前提となる知識が必要だ」ととても大きなヒントをいただいたのですが、実際にデータ分析に携わっている山本さんは、どこに注意して分析を進めておられるのですか?

山本さん 私の場合は提携先企業つまりクライアントからこのような課題があり、それを解決するために分析してほしいという依頼を受けます。課題解決という明確な目的があるためどのような分析が必要かを設計しやすくなります。例として、業績の落ちているAスーパーから売上が落ちた原因を分析してほしいと依頼されたとしましょう。青野さんならどこから調べますか? そのお店を利用している顧客分析や何を買っているのかという購買分析などを思い浮かべていませんか?

―― 確かに客層やその地域の住人の年収や年齢などを分析しようとするかもしれません。せっかくIBM SPSS Modelerがあるので、それを使ってなんとか傾向や手がかりをつかもうとすると思います。

山本さん それも間違いではないのですが、もう少しフラットに大局的に見てみましょう。実はこのAスーパー、なんと近くに競合のBスーパーができ、そこが連日安売りをしていました。それが売り上げ不振の大きな原因である可能性が見えてきますね。あるいは売上が落ちているのはAスーパーだけでなくスーパーマーケット業界全体の売上が下がっていることも考えられます。つまり私が言いたいのは売り上げ不振の原因追及という課題について、データ分析をしなくても分かる部分もあるということです。何もかもやみくもにIBM SPSS Modelerで分析するのではなく、まずは課題について大局的な視点から見ること。そして課題解決のために本当に必要な分析を行うことです。課題に対して仮説を立て、その仮説はどのデータで説明できるか、どう説明するかを考えながら分析設計をすることで、本当に必要な分析を実現していきます。

_dsc0073

学生がデータ分析するうえで知っておきたいこと

―― やみくもにデータをIBM SPSS Modelerに放り込むのではなく、本当に必要な分析を行う。じつはそれもまた学生にとっては見極めが難しい点だったりするのですが……。

山本さん データで解決できる場所でデータを使えばよいだけの話です。それを見極める一つの方法として、青野さんが以前の取材で聞いた「その領域における前提となる知識を得ること」は確かに大事です。データ分析を仕事にしている私たちには「経験値」も求められます。例えばDVDレンタルの売上が極端に落ちている月があれば、「この時期は大きなスポーツイベントがあったよね」「この年のこの時期に季節外れの台風が来て外にも出られなかった」という時系列での出来事も、経験値があると思い出すことができデータ分析へと活かせます。しかし学生はこのような経験値はなかなか得られませんから、そこは事前の知識習得・情報収集によって補うしかありません。

―― 今回の≪SPSS Datathon 2016≫では小売店舗における販売データの分析、およびデータに基づいた販促施策の提案がテーマです。データ分析する上で何かヒントをいただけますか?

山本さん スーパーと同じデイリーユースのお店の販売データですね。デイリーユースの店舗の場合、私たちは2日に1回のサイクルで分析を行います。分析サイクルは業種によって異なり、何を売れ筋と呼んでいいのかも業種によって違います。ちなみに同じデイリーユースのコンビニエンスストアでは例えばお菓子は頻繁に商品を入れ替えており、いつ行っても置いてあるお菓子はすなわちロングセラー商品と言えます。何が売れているのかは、先ほどの大局的な視点が必要で数年分のデータを分析し、仮に落ち込んでいる月があれば時系列の出来事を振り返りつつ検証します。ある月の売上を分析する際におそらく前年比を思いつくと思いますが、休日の日数も忘れずに比較してくださいね。

――山本さんのお話を聞いていると、データ分析には様々な視点が必要で、簡単に結果を出せるものではないことがよくわかりました。あらためて大変な作業だなあと。

山本さん 大変ですがおもしろいこともたくさんあります。データ分析の結果を活かすことで、本当にいろんなことができるんですよ。例えばあるスーパーの店舗の場合、同じ壁面の棚でも1番下の棚にこの商品を置き、3列目の棚にこの商品を置くと、買い物客はとても便利に感じ、なおかつ売上も上がるというゾーニングもデータ分析によってわかります。データを使うとみんなにとってよい結果になるというマインドがあると、本当に楽しい仕事だと思います。

_dsc0009

コミュニケーション能力と自分で考える力を蓄える

―― データサイエンティストを目指している学生が、身に付けておいた方がよいスキルはありますか?

山本さん あります。青野さんは何だと思いますか? 大局的な視点や知識習得への情熱はもちろんですが、じつはコミュニケーション能力がとても重要です。私たちは一所懸命にデータ分析し、その結果をクライアントへ伝えるのですが、ここでうまく伝えられなければそれまでの努力が無駄になってしまいます。データを翻訳する能力も必要です。データマイニングの手法や統計を分からない人に、データを分かりやすく伝えなくてはなりませんから。また、マーケティングの世界で必要となる言葉の意味も今のうちから知っておいてもらいたいですね。データサイエンティストは様々な企業から課題を与えられてそれを解いていきます。その最終地点は企業にとっての収益を上げることですから、そもそも収益という言葉の意味も知っておく必要があるでしょう。最近はフリーの分析ソフトもたくさんあるので、今のうちからそれらを使って自分なりのデータマイニングに挑戦してもいいと思います。

―― ≪SPSS Datathon 2016≫に挑戦する学生、そしてデータサイエンティストを目指す学生にメッセージをお願いします。

山本さん IBM SPSS Modelerを知る学生なら、おそらくIBM Watson(ワトソン)も知っているでしょう。人工知能の目覚ましい進化に驚くと同時に、「これからは何でも人工知能が解決してくれる」と考える人もいるかもしれません。だからこそ私は「まずは自分で考えてみること」を強く皆さんに訴えたいです。そして常に10年先を見て、そのときに何が必要かも想像してもらいたいです。どんなに人工知能が進化しても最終判断をくだすのは人間。そのためにも自分の力で考える力を身に付けておくことが大事です。≪SPSS Datathon 2016≫への挑戦を、未来に必要な力を身に付けるきっかけにしてほしいですね。

_dsc0054


青野 将大の取材後記

_dsc0126

前回のIBMの取材に続いて、今回は利用者であるTポイント・ジャパン様にお伺いしましたが、SPSS利用者の視点からどうデータに向かい合うのか、いかに自分が求める分析結果を得るかということを聞き出すことができました! 実際のビジネスをやる中で得たコツなどはSPSS Marathonに参加する学生の皆さんにとってもヒントになったのではないでしょうか。取材を受けてくださった山本さんありがとうございました!

spss_ec_message

spss_ec_message

permalink.
PAGE TOP