I
N
T
A
G
E
INTAGE

統計的因果推論のマーケティング応用

統計的因果推論のマーケティング応用

様々なデータの利活用が進む昨今,データの関係を正しく捉えていくための方法として,「統計的因果推論」が注目されている。インテージグループR&Dセンターでは慶應義塾大学 星野崇宏教授と共同研究を実施し,統計的因果推論のマーケティングへの応用に挑戦している。本記事では,そのポイントと事例を星野崇宏教授,慶應義塾大学 博士後期課程 齊藤勇樹氏,インテージ 中野暁の対談により紹介していく。

 

(左から齊藤勇樹氏,星野崇宏教授,中野暁)

(左から齊藤勇樹氏,星野崇宏教授,中野暁)

 

中野:はじめに,統計的因果推論とはどのようなものか教えてください。

星野教授:データどうしの関係を捉える際に,相関を調べることはマーケティング実務でもよくやられるかと思います。一方で,その関係が相関関係なのか,因果関係なのかを知りたいといったニーズも現場では多いことかと思います。因果関係を調べる時の王道としては,ランダム化比較試験(RCT:Randomized Controlled Trial)があります。従属変数と説明変数の関係を捉えるために,対象者をランダムに集団に分け,説明変数のみの条件を変えた実験をするわけです。実務ではABテストと呼んだりもしますよね。

オンライン広告やECサイトなど実験ができる環境ではRCTをやれば良いのですが,リアル店舗などマーケティング現場の実態を鑑みると,必ずしも容易に実験をできるわけではありません。学術研究でも,喫煙の発がんへの影響を調べるためにたばこを吸わない人に10年間たばこを毎日吸わせる実験をする,失業給付の効果を調べるために失業した人の半数にあえて給付を与えない,といったことは倫理的に問題がありますし,実際にはできません。実務でもCRM施策で優良顧客の半分に優遇策を与えて実験する場合,その状況がSNSなどで拡散されて,対象ではない顧客から反感をかってしまうといったことも考えられます。また,実験をするには当然コストもかかります。

このような実験ができない状況で,統計的因果推論では,「もし実験ができたら」と考えて,データから統計的に因果関係を捉えていきます。

 

中野:既に収集できているデータからも統計的に関係を推測できるのは強力ですよね。大規模な実験をするとなると,特にリテイル分野などでは実施までにお金も,時間も,関係者を動かすコストもかかりますし・・・。

統計的因果推論の代表的な方法としてはどのようなものがあるのでしょうか?

 

星野:代表的なものとして,ルービン因果モデルという考え方に基づく方法論があります。星野(2016)と加藤・星野(2016)を例に簡単に説明したいと思います。

あるスマホゲームを運営する企業がテレビCMの効果検証をしたい場合を考えます。ここでは,ゲーム利用時間を効果検証のKPI(重要業績評価指標)としましょう。具体的にはある2週間の間にCM接触したらZ=1,非接触ならZ=0とし,その後の2週間の利用時間を調べます。ここで,KPIであるY1Y0はそれぞれ,ある人の

 

Y1:テレビCMを見た場合のゲーム利用時間

Y0:テレビCMを見なかった場合のゲーム利用時間

 

とします。この2つの値の差は「同じ人がCMを見た場合の結果と見なかった場合の結果の差」ですから,因果関係としてCM接触がゲーム利用時間をどれくらい増やしたか?を示す値となります。これを因果効果と呼びます。

ここで重要になるのは,実際にはある人はテレビCMを見たか,見ていないかのどちらかなので,Y1Y0は同時には測定できない,ということです(図1)。図2のように観測データ上はAさんはテレビCMを見てY1が観測された,Bさんは見ずY0が観測されたといった形になります。Y1Y0はZの値にかかわらず潜在的には存在し得るがZの値によって観測できるものが違う,ということから潜在的結果変数(Potential Outcome)と呼びます。

 

図1. 観測できるデータはどちらかだけ

 

このとき,ルービン因果モデルでは,“もしAさんがテレビCMを見ていなかったら”や “BさんがもしテレビCMを見ていたら”といった場合を仮定します。つまり,「もし実際と違って~していた場合の結果」(専門的にはこれを「反実仮想(Counterfactual)」と呼びます。)を仮定するわけです。

 

図2. 欠測データと潜在的結果変数

 

現状と反実仮想を比較することで因果効果が分かる,ということですが,実際には反事仮想の値はわかりません。CM接触者の個人ごとに「もしCM接触しなかったら」どうなったか自体はわかりません。そこで,集団での平均として,「すべての人がCM接触した場合のKPI平均とすべての人がCM接触しなかった場合のKPIの平均の差」を捉えるわけです。これがルービンの因果モデルにおける因果効果です。または「CM接触をしたグループ」においての因果効果を見るわけです。

 

中野:反実仮想を仮定した上で,「すべての人」で考えていくわけですね。この考え方が効果を発揮するのはどのようなときでしょうか?

 

星野:比較する集団の間にサンプルセレクションによるバイアスが生じているときです。先程の例でいえば,CM接触者と非接触者の間が大きく異なる場合です。加藤・星野(2016)の事例で見てみましょう。

例えば,CM接触者はそもそもテレビ自体を視聴している時間が長い層,具体的には比較的年齢が高い層であり,この層は一般的にスマホアプリを利用する人数が少ない層だと考えられます。

この時に,単純にCM接触者と非接触者のKPIの平均値を比較してしまうと,表1のようにCM非接触者の方がアプリ利用時間が短いという直感的にはおかしい結果になってしまいます。しかし,よく考えたらCM接触者はCM非接触者に比べてテレビ自体の利用時間が長い代わりにスマホ自体の利用時間が短いわけで,両者を単純に比較しても「集団の違いなのかCMの効果なのか」が分離できません。

一方,ルービンの因果モデルに基づいて2つの集団の違いが無視できるように適切な調整を施した上で,「平均処置効果」というものを計算してみると,表2のように確かにCM接触者のほうが利用時間が長くなるという直感的に妥当な結果となります。

 

表1. ゲーム利用変数の単純平均とその差 (加藤・星野, 2016より引用)

表2. 調整済みのゲーム利用変数平均とその差 (加藤・星野, 2016より引用)

 

このような現象は,実務上の様々なところで起きています。例えば,我々のグループの研究で飲食店の来店ログデータと位置情報の関連を見たものがあるのですが,ある程度以上人通りが多い地域に立地する店舗ほど来店者数が減る結果が出ました。一見不可解な結果ですが,人通りが多い地域にはそもそも競合店舗が多数出店してくるので当然で,その要因を除去すると人通りと来店者数の関係は高くなります。

 

中野:実務でよくやってしまいがちな誤りですよね。CM接触者と非接触者がランダマイズされているわけではないのに,その群間でゲーム利用時間のKPIを比べるとおかしな結果になってしまう。マーケティングの施策効果を適切に捉え方法としてルービン流の統計的因果推論が活用できるということがよくわかりました。

近年ですと,統計的因果推論を活用した研究が大変盛んになってきている印象を個人的に持っております。研究の潮流についても教えて頂けますか?

 

星野:そうですね。元々,医学や経済学などの分野で活用が進んでおりましたが,最近は様々な領域に応用されています。また,“AI”の流行と共に機械学習(特に統計的機械学習)の分野でも盛んになりつつありますね。NIPSやICMLといった機械学習の国際会議論文の傾向にもそれが表れています。

 

中野:なるほど,手法的な関心としてはどのようなものがありますか?

 

星野:過去の結果をもとに介入の方法を変えていく適応的デザインというものが盛んに研究されています。これまでも広告業界でよく使われていた文脈付きバンディットなどの方法論では近い目的で研究がされていたのですが,繰り返し消費者や患者に介入ができる場合に,前に行った介入の結果に基づいて次の介入方法を自動的に決めるといったもので,オフラインであってもマーケティング分野への親和性は高いと思います。複数時点で繰り返し,というのではなく,医療施設ごとに治療成績の高い治療法が異なる,自治体ごとに有効な施策が異なるといった“因果効果の異質性”にも関心がもたれています。

また,以上で説明した話はクロスセクショナルなデータへの応用の話でしたが,時系列データに対する応用も興味深い課題です。

 

中野:そこで,いよいよ今日の本題である我々の研究が登場するわけですね。さて,ここからは慶應義塾大学の星野研究室で博士後期課程に在籍していらっしゃる齊藤勇樹さんに研究を語ってもらいたいと思います。

まず,齊藤さんの研究では時系列データに対してどのような統計的因果推論を行っているのか,ご説明頂けますか?

 

齊藤:時系列データの因果推論ではGranger因果が有名です。Granger因果は「時系列データYの予測をするのに別の時系列データXを入れたほうがYの予測力が高まる」という意味でXからYへの因果関係を定義しています*

一方,私の研究では企業が施策をうった時に,その施策の効果を時系列的に捉えていくことに関心を置いています。例えば,企業がテレビCMのクリエイティブを変更した時に,それが売上の時系列に対して,どう影響を及ぼしているのかを知ることです。何らかの施策や介入,イベントの因果効果を時系列的に集計されたデータから探りたいということになります。この時に,先程の話にでてきたルービンの因果モデルを応用します。

つまり,「もし施策や介入が実際とは違って,あった場合/なかった場合」の時系列Yを推定していくというものです。すなわち,説明変数Xの値を変えた時にYの値がどう変わるかをYはXの関数Y(X)と置くならば,ある時点で実際に観測されたXとY(X)だけでなく,同時に観測できないが異なるXとそれに対応するY(X)(Potential Outcome)を考えて

 

Xの因果効果 := 実際に観測されたY(X) – Potential OutcomeとしてのY(X)

 

としてXからYに対する因果関係を定義しています。先程のテレビCMのクリエイティブの話で言えば,「変更した場合をX = 1, 変更していない場合をX = 0」として,(実際に変更したならば)

 

Y(X=1):  テレビCMのクリエイティブを変更した場合の売上

Y(X=0):  テレビCMのクリエイティブを変更していない場合の売上

 

とします。施策を実施したデータは観測できているが,施策を実施しなかったデータは(実際にはそうしていないので)観測できていない。だけれども,それを推定して効果を捉えていくというアプローチです。この意味で,Granger因果とは異なっています。

*Granger因果では,例えば「ある時点のYの値」を「その1時点前のYの値とXの値」で説明する時系列回帰モデルを仮定し,Xの係数に検定をおこなってXからYにGrangerの意味での因果性があるか否かを判断します。検定の結果,Xの係数が0である可能性を棄却できないのであれば,「Xについての情報があった方が将来のYを予測するのによい」という意味で因果関係を定義しています。企業の話で言えば,商品などのカテゴリーYの将来の売上予測を考える際,「カテゴリーYの過去の売上だけで説明する」より「カテゴリーYと一緒に,カテゴリーXの過去の売上も加えて説明する」方が良いならば,カテゴリーXの売上はカテゴリーYの売上に対してGranger因果があると判断します。

 

中野:なるほど。実際には企業が行えなかった方の施策を統計的に推定していくことで,その差分で因果効果を見ていくということすね。

 

齊藤:はい,今,実務上は必ずしも条件や状況が統制されていない,意図せずして集まるデータが増えています。こうしたデータをより活用していくことにも関心がありました。

時系列データにおける施策実施の効果を捉える方法論としては, 例えばAbadieら(2010, JASA)のSCM(Synthetic Control Methods)が有名です。一方,この方法論にも課題があります。そこで本研究では,SCMを軸にしながら,因果構造を仮定して出来ることの幅を拡げていくということで,以下のような取り組みをしています。

 

時系列集計データから施策の因果効果を探る方法

○研究概要
集まってきた時系列データに基づいて因果推論,施策評価を行っていく統計的手法の研究。今回,インテージとの共同研究では,時系列の売上データと販促施策(テレビCM施策)のデータを使って,その効果を捉えていくことを課題としている。ルービンの因果モデルで考えると,「もし施策を行わなかった場合」の反実仮想的な時系列データを推定することである。その方法論の一つとして社会科学の幅広い分野で応用されているのがAbadieら(2010, JASA)の Synthetic Control Methods(SCM)。実際に観測された売上の時系列と,SCMによって計算された「もし施策がなかった場合」の売上の時系列の差分をとれば,販促の効果ということになる。しかし,この方法論のみでは解決できない問題もあって,その一つに「因果効果の異質性」があると考えている。例えば,リテイルデータ分析では,販促の効果は店舗や商品ごとに異なる可能性があり,どういった店舗や商品に効果があったかを知りたい場合がある。これはSCMのみではカバーできない問題になっている。そこで単なるSCMによる解析のみならず,因果効果の構造を,主体間で異なる要因(店舗差,商品差など)を組み込んだ時系列的なモデルによって説明する方法論へとSCMを拡張することで問題を解決し,実務データへの適用を研究している。

○解析事例

 

中野:テレビCMのクリエイティブ素材の変更と売上の関係を見ていくために,もし素材変更を行わなかったら,売上はどうだっただろう?と考えていくと,とてもわかりやすいアウトプットが出せますね。本日は統計的因果推論の解説と事例を紹介しました。今後も様々なマーケティング課題への応用を図っていきたいと思います。ありがとうございました。

 

・参考文献

[1] 星野崇宏(2016). 統計的因果効果の基礎:特に傾向スコアと操作変数法を用いて. 岩波データサイエンスVol. 3, 62-90.

[2] 加藤諒・星野崇宏(2016). 因果効果推定の応用:CM 接触の因果効果と調整効果. 岩波データサイエンス Vol.3, 91-100.

[3] Abadie, A., Diamond, A., & Hainmueller, J.(2010). Synthetic control methods for comparative case studies: Estimating the effect of California’s tobacco control program. Journal of the American statistical Association, 105(490), 493-505.

[4] 齊藤勇樹, 星野崇宏, 中野暁(2018). SCMによる因果効果の階層モデルの複数店舗データへの適用. 日本行動計量学会第46回大会発表論文抄録集, 176-177.

 

・著者プロフィール

星野崇宏
2004年3月東京大学大学院総合文化研究科博士課程修了。博士(学術)。博士(経済学)。情報・システム研究機構統計数理研究所,名古屋大学大学院経済学研究科などを経て,慶應義塾大学経済学部教授。シカゴ大学客員研究員,ノースウェスタン大学ケロッグ経営大学院客員研究員などを歴任。行動経済学会常任理事。マーケティング・サイエンス学会理事。45歳未満の研究者に政府が授与する最も権威のある賞である日本学術振興会賞を受賞(2017年)。ほかに日本統計学会研究業績賞,日本行動計量学会優秀賞,日本心理学会国際賞,慶應義塾大学義塾賞など受賞多数。 また2017年から国内のAI研究の中核研究施設である理化学研究所AIPセンター経済経営情報融合分析チームリーダーを兼任。主な業績として,“Semiparametric Bayesian Estimation for Marginal Parametric Potential Outcome Modeling: Application to Causal Inference”, Journal of the American Statistical Association, 2013, 108, 1189-1204, 『調査観察データの統計科学:因果推論・選択バイアス・データ融合』岩波書店, 2009, 『Webマーケティングの科学』(共著)千倉書房, 2007, 『マーケティング・リサーチ入門』(共著)有斐閣, 2018など。ほかに心理学,脳科学,公衆衛生,疫学等での海外トップ雑誌への業績多数。

 

齊藤勇樹
慶應義塾大学経済学部卒業(2017年), 同大学院経済学研究科修士課程修了(2018年), 現在,同後期博士課程在籍。星野崇宏教授の指導の下,計量経済学,統計的因果推論・機械学習などを研究分野としている。またリテール企業でアソシエイトとしてデータ分析をおこなっている。

 

中野暁
株式会社インテージ クロスメディア情報部 シニアアナリスト。R&Dセンター所属。メディア領域に軸足を置きながら,シングルソースパネル(i-SSP)の設計/品質管理,データ解析,研究開発などに従事。現在は全数系ビッグデータ商品であるMedia Gaugeの価値開発事業やデータ融合技術の開発,R&Dセンターでの研究活動を担っている。現在,慶應義塾大学 産業研究所 共同研究員,筑波大学大学院 システム情報工学研究科 博士後期課程在学。直近の主な業績として,“Customer Segmentation with Purchase Channels and Media Touchpoints using Single Source Panel Data”, Journal of Retailing & Consumer Services,2018, “混合隠れマルコフモデルによるオンライン・オフラインチャネル選択行動のモデリング”,オペレーションズ・リサーチ,2018, “メディア利用時間における自己申告型調査と行動ログの乖離に関する研究”, 行動計量学, 2017。仕事の傍ら,夜な夜な研究活動に励んでいる。

 

Academic Programs