因子得点を機械学習で予測してみた…

ユーザーモデルを活用する際に、対象者のクラスタを判定することで総合的な心理特性を把握すると同時に、クラスタを構成する各因子に対する傾向性や度合いを個別に把握するために重回帰分析を使って因子得点を直接予測することがあります。

例えば下記は、「消費行動傾向モデル」「食に対する意識モデル」「車に対する意識モデル」それぞれのモデルにおけるそれぞれの因子得点を目的変数として、説明変数にそれぞれのモデルの所属クラスタ判定を想定した判別設問(判定精度70%以上で最小数の設問群)への回答をステップワイズ方式で投入、重回帰分析した時の決定係数です。

この因子得点の予測に、同じ説明変数で機械学習(PredictionOne)を使ってみます。
PredictionOne(Sony Network Communications Inc.)は、ニューラルネットワークと勾配ブースティング木のアンサンブルで予測を行うAutoML(Automated Machine Learning)です。

因子得点の予測問題においては、重回帰分析と機械学習における決定係数に大きな差はなさそうですね。

重回帰分析は予測式の解釈が容易ですし、予測はエクセルがあれば誰でも行うことができますが、機械学習の場合はそうはいきません。
ただ、この予測問題における説明変数は判別設問への回答だけでしたが、説明変数に多様なデータを使用するようなことを想定する場合には、機械学習の方が使い勝手が良さそうです。

この記事を書いた人