「属性」を活用したユーザーモデルの予測について考えてみましょう。
人の“気持ち”を「属性」で予測できたら、質問をしなくても良いから便利ですよね。
[予測対象]「消費行動傾向モデル」のクラスタ番号(4つのクラスタのどこに所属するか)
[分析環境]機械学習(ソニー製「Prediction One」使用:ニューラルネットワークと勾配ブースティング木のアンサンブル)
[予測に使用した変数]「性別・年代・居住地域・婚姻・住居形態・世帯年収・職業の7属性」の場合と「性別・年代・居住地域の3属性」の場合
結果としては、7属性によるクラスタ番号予測は、予測精度(Accuracy)が34.73%、3属性によるクラスタ番号予測は、予測精度が33.93%となりました。
やはり、人の“気持ち”を、「属性」“のみ”で、相応の精度で予測するのはなかなか困難ではあります。
但し、充分な精度が得られなくても、ランダムより高い確率が得られているのであれば、対象者の「属性」さえ得られていれば質問をしなくても良いのですから、まずは「属性」“のみ”から(予測精度が高くないことを前提にしても)自動的に心理プロファイルを得ておくことは、お客さまを知る上で意味のあることです。
次に、「属性」“のみ”でなく、質問(判別設問)も加えて考えてみましょう。
もちろん、判別設問を6つ使えば71.5%の精度で所属クラスタを予測できることは判っていますので、「属性」だけで得られている精度が質問を少しづつ加えていくことでどのように変化していくのかをみていきます。
[予測対象]「消費行動傾向モデル」のクラスタ番号(同様)
[分析環境]機械学習(同様)
[使用した変数]「性別・年代・居住地域の3属性」に、推定問題に対して予測精度の高い設問を1設問づつ加えて使用
結果としては、3属性のみでクラスタ番号を予測した場合の予測精度は33.93%でしたが、この3属性に1設問だけ加えて予測すると、その予測精度は50.27%(+16.34%)に高まりました。
以降、少しづつ質問を加えていくと…
・3属性+2設問によるクラスタ番号予測→予測精度:57.67%、
・3属性+3設問によるクラスタ番号予測→予測精度:62.27%
・3属性+4設問によるクラスタ番号予測→予測精度:65.20%
・3属性+5設問によるクラスタ番号予測→予測精度:67.60%
…のように徐々に高まっていきます。
ネットでショッピングするお客さまを想定するだけであれば、現れたポップアップ質問にもオファー次第で興味をもって対応してもらえることもあると思いますが、リアルな店舗での接客時にいきなりスタッフからいくつも質問するのが難しいのはいうまでもありません。
例えば、ファッション・自動車・旅行・住宅・銀行等、リアルな店舗に来店予約をしてくれたお客さまをスタッフがお待ちするような状況を想定すると、まずは判っている「属性」のみを使って自動的に得られた心理プロファイルをベースに接客しながら、お客さまとのインタラクションが可能な場面で接客の流れに合わせて少しづつ質問していくことができれば、無理なくお客さま理解の解像度を上げていくことができるようになるでしょう。