勉強会に行ってみた!第47回「【SPSS ナイト】ビジネス成果を出すためのデータ分析活用講座 第一回」
event

勉強会に行ってみた!第47回
「【SPSS ナイト】ビジネス成果を出すためのデータ分析活用講座 第一回」

2016.12.26

データ分析についての勉強会です。データサイエンティストが集まるのでしょうか。この分野については馴染みが薄く、SPSSという言葉も知りませんでした。でも、面白そうです。データ分析ってどんな世界なのか、話を聞いてきました。

三土たつお

会場は渋谷の「イベント&コミュニティスペース dots.」でした。西武B館のすぐ隣です。

dots. といえばIT勉強会の情報サイトですが、勉強会のための場所の提供やコミュニティの運営などいろいろと展開をしていますね。この連載でこれまでに訪れた勉強会でもお世話になっています。

会場内はこのようになっています。スーツの方が結構多いですね。ウェブ系の勉強会とちょっと雰囲気が違うなと思いました。

「成功するデータ分析のためのメソドロジー」
日本IBM 西牧洋一郎氏

日本IBMの西牧洋一郎さん。SPSS IT スペシャリスト。

最初のお話は、日本IBMの西牧さん。SPSSというのはIBMによるデータ分析のためのソフトウェアですが、第一回の今日はその詳細ではなく、まずはデータ分析のキモについてのお話のようでした。ちょっと安心しました。

代表的なデータマイニングの方法に「CRISP-DM」というのがあるそうです。それは「ビジネスの理解」→「データの理解」→「データの準備」→「モデル作成」のようなステップで進められます。

みんなモデル作成のところを頑張るんですけど、大事なのは最初のビジネスの理解です。ここがしっかりしていなかったら後のプロセスを頑張ってもあんまり意味がありません。

具体例として引き合いに出したのは、有名な自動車会社が業務を効率化した事例です。

その会社では、特定の部品について、作られたものすべてについてX線検査を行って異常の有無を確認していました。そのため検査のためのコストは膨大なものになります。しかし多くの部品については実際には問題がないため、できればうまく効率化してコストを削減したいところです。

そこで、作られた部品についてのデータから出来具合を予測するモデルを作成してスコア化を行い、スコアが要注意となったもののみX線検査をすることにしました。スコアがNGとなったものは検査すらせず、溶かして再利用します。結果として大幅なコスト削減となりました。

この場合、そういう予測モデルを作成できたのはもちろん素晴らしいことですが、もっと大事なのは、すべての部品をX線検査するという現状の業務プロセスに課題がある、ということを発見できたことです。

最初から不良品を全部なくそうとは思いませんでした。その代わり効率化できるのではないかと思ったんです。業務全体を知っていたため、そう考えることができました。

業務に関する生のデータは膨大にあります。それを生のままいきなり分析にかけても意味のある答えは出ない。まずは業務を知り、課題を知り、データの意味を理解して、整備するという前段階こそが大切だということなんですね。

一回だけいいモデルができても意味はありません。業務についての課題を知っていることが重要です。課題を知っている人が、答えも知っているんです。

SPSSユーザー講演 日本航空 渋谷直正氏

日本航空 渋谷直正氏

次はSPSSのユーザーである日本航空の渋谷さんのお話です。渋谷さんは日本航空のウェブサイトのログなどデータ分析を行い、各種施策の立案などをされているそうです。「データサイエンティスト・オブ・ザ・イヤー 2014」に輝いたとか!

データサイエンティストには3種類ある、と渋谷さんはいいます。統計学の博士号を持っているような人、それからコンサルタントとして高度なスキルを持っている人、そして一般の会社でたまたまマーケティングをしている人。

1番目とか2番目のような人が注目されやすいけれども、3番目の人が増えることが重要です。

それはなぜか。分析を行うためにはチームを組む必要があります。分析手法に詳しい人やシステム担当、マーケティング担当などが参加する中で、核となるべきは誰でしょう。それはビジネス知識があり、問題意識があり、業務を一番わかっている、つまりマーケティングの人なのです。

マーケティング担当の人は業務知識があり課題を把握している、またデータサイエンティストとしての基本的なスキルを持っています。

ただし、数学や統計学に対する苦手意識があり、分析手法を知らない方が少なくありません。

統計をがんばって勉強しよう!と思うと、まず記述統計学、推測統計学、多変量解析、といった順番で学ぶ必要があります。実際に業務で必要になるのは多変量解析より上の知識です。

渋谷さんの経験では
・その手前の推測統計学の段階でつまずいてしまう人が多い。
・しかし実際には、推測統計学の知識(検定など)は業務ではほぼ使わない。

そのため、途中の知識はとりあえずスキップして、まずはツールを使って実際の業務の分析を行い、その後でゆっくり勉強するのがおすすめとのこと。

ここの実例が面白かったので紹介します。

仮説検定は、事前に立てた(ほぼ確信のある)仮説の真偽を確かめるためにあります。しかし実際の業務では、確信のある仮説を立てることこそに意義があり、その検定は副次的な意味しかありません。

「検定の結果、大阪より東京の売り上げのほうが有意に大きいです!」と言われても、「お、おう」となるわけです。

分析手法は多数ありますが、実務で使うためには5つくらい覚えればいい、と渋谷さんはいいます。

クロス集計はエクセルでもできるといって軽んじてはいけません。とても有用で、8割はクロス集計だと言ってもよいくらいです。

まとめとして、渋谷さんは次のように言っていました。

データサイエンティストへのハードルは高くありません。自社の業務知識や好奇心などが一番重要で、あとはツールの力と、数種類の分析手法を使えれば十分です。

まとめ

第一回ということで、データ分析のための心構えのような話が多かったのはありがたく、また分かりやすかったと思います。SPSSのSの字も出てきませんでしたしね。

お二人とも言っていましたが、何よりも業務に対する理解が必要、というのは本当にその通りだと思います。しかし慣れてくると当たり前すぎてむしろ見過ごしがちになるのかもしれません。

日々、業務に関する大量のデータを収集し、それを業務に生かすとなると、どうしても大勢の顧客がいる大企業の事例を連想します。しかしもっともっと小さな会社でもデータ分析の重要性はたぶん変わらずあるはずで、たとえば自分の会社だったらどういうことができるのかな、ということを思いました。

今回行った勉強会:「【SPSSナイト】ビジネス成果を出すためのデータ分析活用講座 第一回」(※SPSSとナイトの間に本来はハートの文字が入ります)
https://eventdots.jp/event/601486

三土たつお。1976年生まれ。プログラマー、ライター。プログラマーとしてはふだんPHPを書いてます。ライターとしてはニフティのデイリーポータルZとかで書いてます。近著「街角図鑑」(実業之日本社)。
http://mitsuchi.net/

この記事はどうでしたか?

おすすめの記事

キャリアを考える

BACK TO TOP ∧

FOLLOW