このエントリーをはてなブックマークに追加

PROTO総研/カーライフ インタビュー

星野 それはまさにおっしゃるとおりです。私はいま国の統計の在り方について議論する組織に関係しているのですが、まさしく統計学的な調査とリアルワールドとの一致をどう担保するのかがテーマとなっています。世帯が何に対してお金を使っているのかを調べる調査として、代表的なものとして家計調査、消費動向調査があるのですが、小売業に直接売上額を調査する、あるいは製造業に出荷額を調査して得られるような事業所統計との整合性が取れない場合があるということで、調査の信頼性について疑問が投げかけられているのです。たとえばパンを一般の家庭がいくらでどれくらい買っているのか、その推移はどうなっているのかといった情報は、パンを作っている会社にとっては非常に大事で、これはスーパーの全売上などではわかりません。そういった細かい品目の情報は家計調査が元となっています。これは調査対象の家庭に家計簿を記入してもらい、そのデータをまとめたものなのですが、家計簿をつけるのは面倒な作業なようで、調査に参加するとだんだん購入額が低下するように見えます。これを過少記入バイアスと呼び、昔から問題とされてきました。

清水 確かに手作業で毎日家計簿を記入していくのは大変ですものね。

星野 そこで、ビッグデータを活用して、消費統計を改善しようというプロジェクトが立ち上がりました。ところが、これも実際には難しい問題があります。なぜかといいますと、企業が業務で有するビッグデータからわかるのは、一般に自社での顧客の購買行動だけで大きな偏りがあります。ビッグデータと既存の調査データをつなげるというのは、世界的にもチャレンジングですが、経済状況のタイムリーな理解のためにも非常に重要です。今後精力的に研究を行って、政府や企業のより良い意思決定に貢献できる方法論や枠組みを作ることができればと考えております。

「行動経済学」的知見でユーザーニーズを予測

清水 弊社が提供したデータを用いた研究について、「行動経済学的な知見を用いた消費者の情報探索行動の予測とレコメンデーション法の開発」として発表なさいましたが、今回の研究でどのような成果が得られたのかお教えください。また、今回の共同研究について、ご感想がありましたらお聞かせください。

高畑 普段では扱うことのないような大規模な実データに触れることができまして、今後の研究を考えるうえでも非常にいい経験をさせていただきました。データについても、既存のモデルにただ数字を当てはめただけではだめで、消費者の行動やその構造をしっかりと理解したうえで、個々の問題にチューニングした形でモデルを適応させる必要があるということを非常に感じました。今回はまだ予備分析という状態ですが、なぜコンバージョンの予測が難しいのかという構造が見えてきて、今後やるべきことがしっかり定まってきたかなという印象があります。
MG_7169-1
大規模な実データに触れたことで、なぜコンバージョンの予測が難しいのかという構造が見えてきたと高畑さん

清水 コンバージョンの予測はまさに永遠のテーマですよね。サービス提供者側としては、消費者は想定どおりには動かないと分かってはいるはずですが、どうしても「こうあるべき、こうなるはず。」という思い込みがあり、結果として必要以上のコストをコンバージョンにかけてしまう傾向があります。今回の論文では、第一弾としてデータの裏付けが取れたということですね。

高畑 はい。まだ予測につなげる段階まで到達していませんが、コンバージョンをした人とそうでない人とでは、明らかに滞在時間や閲覧数などの分布に差がありましたので、そこをベースとして、「集中して介入を行うべき対象はどこか」をより明確にしてゆけるのではないかと思っています。

 私はこれまでアンケートなどから得られた調査データを扱って論文を書いてきたので、ポータルサイトのログというまさにビッグデータを触るのは今回が初めてでした。調査データとビッグデータを比べて感じたのは、それぞれに役割があるということです。ビッグデータには、全期間に対して即時的に全てのデータが抽出されているという性質があります。One to Oneのリコメンドのように、逐次的にデータを活用したいというときには、ビッグデータの持っている即時性や期間への全量性というものが必要だと思います。一方でビッグデータそれ自体はとても量の多い利用情報に過ぎません。なので、顧客ペルソナの策定などで顧客の像をしっかりと把握したいときにはビッグデータだけではだめで、それにはやはり量は少なくても、知りたいことに合わせた調査データが必要になると感じました。
_MG_7132

「知識」と「情報」とがつながると見えるもの

清水 我々企業は、目の前で起きている社会現象をキャッチアップしてライバルよりも一歩でも前に進みたいと考えています。また、皆さんにとっても研究に対するいい刺激になっています。それらが両輪となって、良いサイクルとなることが「企業共同研究」のあるべき姿だと思っています。そういった意味で、今後への期待も含めて、どう研究に役立てていかれたいと考えていらっしゃるのでしょうか。

高畑 経済学との関連で話しますと、標準的な経済学では完全に合理的な消費者を仮定しますが、必ずしもそれは適切ではないことが大規模データから見えてきます。それを考慮したうえで、どういう広告の出し方をしていったら会社にとって最適なところに消費者を導けるのか。逆に、消費者にとっていい買い物をしてもらうためにはどのような広告の出し方をしていけばいいのか。データによる裏付けのもと、人間の意思決定メカニズムより接近した研究ができればいいなと思っています。

 データ分析力とドメイン知識、その双方が必要になると考えています。統計モデルだけ理解していても、実務においては何らかの制約がかかることが多いです。そういう意味でも、いただいたデータで問題解決の道筋をつけつつ、現場の方々のドメイン知識を活かして、実務に意味のあるモデリングを今後は行っていきたいです。
MG_7176
データ分析力に加え、現場から得たドメイン知識の双方を活用することが大切になると柳さん

星野 カスタマージャーニーについては、いろいろな企業や研究者の方々が可視化という形で取り組まれていますし、我々もそのような研究を行ってはいますが、購入という結果に至るまでの過程を“記述するだけ”ではあまり面白くありません。
たとえば事前に提示するものを変えていくだとか、インセンティブを与えるなど消費者に介入するところまで踏み込める研究を行う機会はなかなかありません。今回のプロコーポレーションさんとの共同研究では、そのような機会も頂けるとのことですので、消費者行動の理解により深く迫る研究ができるものと大変期待をしております。

清水 本日はありがとうございました。

【対談者プロフィール】

略歴

星野 崇宏
2004年3月東京大学大学院総合文化研究科博士課程修了。博士(学術)。博士(経済学)。
情報・システム研究機構統計数理研究所、東京大学教養学部、名古屋大学大学院経済学研究科などを経て、慶應義塾大学 経済学部 教授。
シカゴ大学客員研究員、ノースウェスタン大学ケロッグ経営大学院客員研究員などを歴任。
行動経済学会、日本マーケティング・サイエンス学会、応用統計学会、日本行動計量学会のそれぞれ理事。8月から理化学研究所AIPセンターチームリーダーを兼務。
主な業績として“Semiparametric Bayesian Estimation for Marginal Parametric Potential Outcome Modeling: Application to Causal Inference”, Journal of the American Statistical Association, 2013, 108, 1189-1204.『調査観察データの統計科学:因果推論・選択バイアス・データ融合』岩波書店, 2009,「顧客行動の多様性変数を利用した購買行動の予測」人工知能学会論文誌, 2017,32(2) B-G63, 1-9,など。

高畑 圭佑
慶應義塾大学 大学院 経済学研究科 博士課程1年
主な業績として”Bayesian dynamic topic modeling with stable topics over time periods”,The 2017 conference of the International Federation of Classification Societies.

柳 博俊
慶應義塾大学 経済学部 学部4年
主な業績として「段階的潜在クラスモデルを用いた多年度分析 新商品の投入と浸透」(野村総合研究所 マーケティング分析コンテスト2016入賞)