コラム
2024-07-25
因子分析と主成分分析の違いとは?それぞれのメリットや事例をわかりやすく解説
因子分析や主成分分析はアンケートや市場調査の実施に役立つ分析手法ですが、両者の違いをご存知でしょうか。本記事では、混同しやすい因子分析と主成分分析の違いをわかりやすく解説します。意味やメリットなどについて事例を交えて紹介しますので、ぜひ参考になさってください。
目次
因子分析と主成分分析の違い
因子分析と主成分分析は、それぞれどのような手法なのかご存知でしょうか。両者を使い分けるために、定義や主な違いについて解説します。
因子分析とは
因子分析とは、実験や観測などで得られたさまざまな要素(観測変数)の背後にある潜在的な原因(因子)を明らかにする方法です。
因子分析は、およそ120年前、英国ロンドン大学の心理学の教授であったチャールズ・スピアマンによって提唱されました。元々は生徒たちの「知能」という目に見えないものを測定するために生まれたといわれています。
例えば4教科のテストを実施した場合、各教科の点数は目に見えてわかりますが、なぜその成績になったのか、なぜ教科で点数差があるのかといった要因は点数だけで説明できるものではありません。
そこで、成績の背後にある読解力や発想力などの「共通因子」や各教科固有の能力としての「独自因子」を見出し、各生徒の成績を説明できるようにするのが因子分析です。
このように、因子分析は元々教育の分野で生まれた手法ですが、現在ではマーケティングリサーチの分野で広く活用されています。
主成分分析とは
主成分分析とは、情報量の多いビッグデータを要約し、データの本質を捉える手法です。主成分分析は因子分析が創案される3年前に、ロンドン大学の応用数学教授であるカール・ピアソンによって提唱されました。
主成分とは、データを理解しやすくするために新しく作成する変数のことです。ビッグデータを扱う際、アンケートの項目や要素(次元)が多いとそのままでは理解が困難なため、主成分分析によって主成分を算出して、元のデータをなるべく保ちながら誰もが理解しやすい形にします。
例えば10科目から成る期末テストの学力を知りたい場合、数学や国語といった10個の次元のままだと何を基準に学力を判断していいのかわかりにくいものです。そこで「総合成績」や「文系/理系」といったシンプルな指標を使ってデータを要約し、学力を比較しやすくします。
10科目のテストを主成分分析する場合
・要素:国語、数学、理科、社会、英語、体育、美術、技術、家庭科、音楽
・第1主成分:総合成績
・第2主成分:文系/理系
因子分析と主成分分析の主な違い
因子分析と主成分分析はデータを説明できる要素を作るという点で共通していますが、分析目的や考え方に違いがあります。
因子分析の目的は、端的にいうと「共通因子」を見つけることです。何らかの因子(原因)がデータ(結果)に影響を与えていると考え、観測変数を分解し、共通因子を抽出して市場の需要やユーザーの心理を探るのに活用されます。
一方、主成分分析の目的は、情報量の多いデータを圧縮して情報量の少ない「主成分」を作り出し、データの理解を容易にすることです。主成分分析では、データ(原因)から主成分(結果)が作られると考え、データの特徴を可視化します。
健康調査の例に見る因子分析と主成分分析の違い
・因子分析:食事や運動などの観測変数を分解し、共通因子を見つける
・主成分分析:食事や運動などの観測変数を組み合わせて新たな指標を作る
因子分析のメリット・デメリット
因子分析には、次のようなメリット・デメリットがあります。
因子分析のメリット
因子分析を行うメリットは、潜在的なニーズを定量的に効率よく調査できることです。
因子分析では、収集したデータを使って定量的に因子を特定するため、起こっている現象の原因を、思い込みに頼らずに調査できます。また、共通因子を抜き出してデータを簡素化できるため、質問項目が多く解釈が困難なデータであっても、労力を減らして分析を行うことが可能です。
因子分析のデメリット
どんなデータでも因子分析をすれば潜在的ニーズを調査できるわけではなく、使用できるデータには限りがある点がデメリットです。まず、共通因子を含まない変数で因子分析をしても、有効な共通因子は見つかりません。また、データ数が少なすぎるとうまくいかない場合があります。
主成分分析のメリット・デメリット
主成分分析のメリット・デメリットは以下の通りです。
主成分分析のメリット
主成分分析のメリットは、大きく分けて2つあります。まずは、ビッグデータの情報を損なわずに効率よく調査できることです。主成分分析によって観測変数をまとめるとデータを理解しやすくなり、短時間で効率よく分析作業を進められるでしょう。
また、主成分分析は、理解が難しい膨大なデータをわかりやすいグラフとして可視化できます。一般的に項目が2つ以上あるデータを2次元のグラフにするのは困難ですが、主成分分析を通じて情報量を集約すれば、グラフ化を実現できます。
主成分分析のデメリット
主成分分析を行うと大量のデータを要約できる一方で、一部のデータを切り捨てなくてはならないというデメリットも生じます。主成分分析の特徴を考えると仕方のないことですが、切り離したデータの中に重要な情報が含まれている可能性もゼロではありません。
因子分析と主成分分析の活用事例
因子分析と主成分分析は活用方法にも違いがあり、主にマーケティングの分野で使い分けられています。簡潔にいうと、因子分析は原因を探るとき、主成分分析は総合的に評価したいとき使用するのがおすすめです。具体的な事例を見ながら、両者の使い分け方について理解を深めましょう。
因子分析の活用事例
因子分析は教育の分野で生まれた手法ですが、データの背景にある原因を探るときに役立つため、現代ではアンケートの回答の背後にある消費者の潜在ニーズを調査するときに活用されています。
ビジネスにおける因子分析の一般的な活用事例
・消費者心理を探る
・価値観や意識に基づいてグループ分けを行う
・売れている商品の理由を理解する
・顧客の考える商品・サービス・ブランドのイメージを探る
共通ポイントサービス「Ponta(ポンタ)」を運営する弊社は、消費者動向や生活者トレンドを「Pontaリサーチ」で自主調査しています。下記の「インターネット利用に関する調査」では因子分析を行った結果を公開していますので、分析事例として参考になさってください。
主成分分析の活用事例
主成分分析では主成分の抽出によって複数の主成分を生成しますが、特に最初に求められる第1主成分は分析対象の総合力を表します。したがって、ビジネスでも下記のように分析対象の総合力を調査するのに有効です。
ビジネスにおける主成分分析の一般的な活用事例
・商品やサービスに対する顧客の総合的な評価を調査する
・総合的に見て顧客満足度が高い店舗を調べる
・社内の総合力が高い人物を調べ、人事に活用する
主成分分析×因子分析の活用事例
弊社は、5万人のPonta会員から抽出した価値観セグメントを使用して広告配信できるサービス「PERSONA+(ペルソナプラス)」において、主成分分析と因子分析を活用しています。
まずPonta会員5万人を対象に200設問のアンケートを実施し、因子分析により価値観因子を特定することで、15の価値観クラスターを構築しました。また、主成分分析で200設問を4設問に圧縮することで、様々なアンケートに組み込みやすくなり、活用の幅が拡大しています。
基本属性や購買情報だけでは見えてこなかった顧客の価値観を明らかにし、マーケティングに活かしたいと考える方は、下記をご覧ください。
因子分析と主成分分析の手順
因子分析と主成分分析の基本の分析手順は、以下の通りです。
基本の分析手順
1.調査の設計
2.調査の実施・収集
3.統計ソフトを使った分析
調査設計の段階で、因子分析や主成分分析を行う目的をはっきりさせましょう。目的が明確にならなければ、分析は変数を縮小する作業で終わってしまいます。目的を踏まえて、アンケートやインタビューといった調査方法を決定することが大切です。
続いて、計画に基づいて調査を実施し、結果を回収します。収集したデータは、因子分析や主成分分析の前に「標準化」させましょう。標準化とはデータ平均を0、標準偏差(分散)を1にする変換方法です。データを標準化すると、異なる項目でも大小を比較できるようになります。
最後に、統計用ソフトを使った分析です。因子分析や主成分分析の結果は数値で示されるため、グラフ化して解釈を加え、マーケティングに活用しましょう。
因子分析の手順
主な分析の流れは因子分析と主成分分析で共通していますが、統計ソフトを使った具体的な分析の仕方に違いがあります。まずは、因子分析の手順を統計ソフトの使い方を絡めて説明します。
①共通因子の数を決める
調査設計・実施を終えたら、 因子分析をする価値がある「共通因子」の数を決定しましょう。
決定方法はさまざまで、例えば「固有値」を見つける方法などがあります。固有値とは、各因子が全項目に対してどれくらい支配しているかを示すものです。固有値が大きいほど重要な因子ということになります。統計ソフトで固有値が算出されたら、1以上の固有値を採用しましょう。
②因子負荷量を抽出する
因子負荷量とは、観測変数に対して共通因子がどれくらい影響しているかを表す数値のことです。一般的な統計ソフトには、最尤(さいゆう)法や主因子法、主成分法など複数の種類の抽出方法が用意されています。
③因子軸を回転させる
因子負荷量を抽出したらグラフ化し、各因子の数値が軸に沿うように、グラフの軸を回転させましょう。元のままでは共通因子が何を示しているのかがわかりにくいためです。回転の計算方法として、バリマックス法やプロマックス法などがあります。
④因子に名前をつける
解釈が容易になったら、共通因子名を決めましょう。名前の決め方に正確な答えや決まりはなく、分析者の主観で名付けることになります。
⑤因子得点を算出する
因子得点とは、各調査対象者が共通因子をどれだけ持っているかを表す値のことです。調査対象者の特徴を分析するために因子得点を算出しましょう。具体的な算出方法として、回帰法やバーレット法などが挙げられます。
主成分分析の手順
続いて、統計ソフトを使った主成分分析の手順は以下の通りです。
①主成分を算出する
統計ソフトでは、元の変数から新たな変数(主成分)を算出する作業が行われます。多次元の情報をより少ない主成分で表現するためです。新しく作られた変数(主成分)は、第1主成分や第2主成分、第3主成分などと呼ばれます。
統計ソフトが実行する主成分分析の流れ
1.全データの平均値を算出する
2.第1主成分を算出する
3.第2主成分を算出する
4.第3主成分を算出する
5.以降、データの次元の数だけ繰り返す
②第2主成分以降に解釈を加える
第1主成分は元のデータが強く反映されるため、一般的に分析対象の「総合評価」を示します。一方、第2主成分以降は具体的な意味を持たないことが多いため、分析者の解釈が必要です。
因子分析と主成分分析の注意点
最後に、因子分析と主成分分析を行うにあたって押さえておきたい注意点を紹介します。
因子分析の注意点
因子分析ではどんなデータでも使えるわけではなく、適切なデータ選択が必要となります。使えるのはボリュームがあり、数量的で、かつ変数間の相関関係が確認できるデータのみです。因子分析の前に「十分なデータが確保できるか」「共通因子を持つ変数があるか」を確認しましょう。
また、作成した共通因子の意味を考察する力も必要です。因子分析をすると自動的に共通因子を作成できますが、共通因子がどの変数と関係しているかは主観で左右されます。チームで結果を共有したり、専門家に意見を求めたりといった工夫をして、慎重に意味付けを行いましょう。
主成分分析の注意点
主成分分析では、新たに生成された変数に元の情報が含まれているかどうかの確認が必要です。主成分分析がデータを要約する手法である以上、元の情報がきちんと反映されないこともあり、そのまま使用すると期待した結果が得られない可能性があります。
また、因子分析と同様に主成分分析でもデータを解釈する力が必要です。計算で主成分を作成できても得られるのは数値のみで、人間の主観による意味づけをしなければ知見を得られません。結果を社内で共有したり専門家の力を借りたりして、得られた結果に対して解釈を加えましょう。
分析を有効活用して顧客に響くアプローチをするならロイヤリティ マーケティングへ
因子分析や主成分分析は、膨大なデータの中から潜在的なニーズや総合的に評価の高い店舗などを見つけ出すのに有効です。データの流通量が増加する現代において、大量のデータを効率よく分析してマーケティングに活用できる因子分析や主成分分析は便利な手法であるといえます。
しかし、因子分析や主成分分析によって得られた結果をマーケティング活動に活かすためには、情報を解釈する力が必要です。社内で時間をかけて人材を育てる方法もありますが、困難な場合は分析のプロに頼るという手もあります。
弊社は、Pontaならではの購買・行動データを活用し、アンケートの実施から、分析、プロモーションまでを幅広くサポートしています。アンケートの設計やデータ分析、データの活用方法にお悩みの方は、お気軽にご相談ください。
お気軽にお問い合わせください
詳しくお知りになりたい方はお問い合わせ