コラム
2024-08-26
回帰分析とは?やり方や事例、注意点を押さえてビジネスの課題を解決しましょう
回帰分析はビジネスの課題解決に役立つ手法ですが、具体的にどのようなものなのかをご存知でしょうか。本記事では、基本的な用語や身近な事例を踏まえながら、回帰分析についてわかりやすく解説します。回帰分析のやり方や注意点も紹介しますので、ぜひ最後までご覧ください。
目次
回帰分析とは?
回帰分析とは、特定の結果に対して、他の要素がどの程度影響を与えるかを分析する手法です。例えば、「天気」「商品の価格」「広告」といった要素と店舗の売上の関係を知りたいとき、回帰分析を使うことで、各要素が売上にどのくらいの影響を与えているのかを予測できます。
回帰分析の理解に役立つ用語
回帰分析を専門的な言葉で説明すると、「目的変数」と「説明変数」との関係を関数で表して分析する手法といえます。では、目的変数や説明変数とは一体何なのでしょうか。ここでは、回帰分析の理解に役立ついくつかの用語を解説します。
変数
変数とは、データの中で異なる値を取る数です。逆に、既に決定している数のことは定数と呼びます。変数はx・y・zなどで表し、データを代入することで使用可能です。回帰分析では、目的変数と説明変数という2種類の変数を使用します。
目的変数
目的変数とは、回帰分析によって予測したい結果の変数です。例えば店舗のマーケティングにおいて、「売上」という結果に対する天気の影響を調べる場合、売上が目的変数となります。
説明変数
説明変数とは、目的変数に影響を与える変数のことです。例えば、店舗の売上に対する商品の価格の影響を調べる場合、商品の価格が説明変数となります。
回帰直線・回帰係数
回帰直線とは、回帰分析の結果を示す直線のことで、横軸がx、縦軸がyのグラフにおいて「y=a+bx」の1次方程式で表現されます。回帰係数とは、y=a+bxの直線の傾きbのことであり、説明変数が目的変数に対していかに影響を与えるかを示すものです。
回帰係数が大きいほど回帰直線が急になり、説明変数の影響が大きいことを意味します。例えば、広告費と売上の関係を回帰直線で表すとしましょう。広告費が増加すると売上が増えるかどうかは、回帰直線を用いると一目でわかります。
回帰分析によって分かること2つ
では、回帰分析を実施するとどのようなことが分かるのでしょうか。ここでは、回帰分析によって分かることを紹介します。
現在の傾向を把握する
回帰分析を用いるとデータのパターンが明らかになり、現在の傾向を把握することが可能です。例えば、売上に対する広告費の影響を分析すると、売上と広告費の関係が数値で明らかになり、現状のマーケティング施策が適切かどうかを確認できます。
未来の傾向を予測する
回帰分析によって把握した現状からパターンや特徴を読み取ると、未来の傾向を予測することも可能です。例えば、過去の売上データと季節変動を考慮すると、次の季節の売上を予測できます。データに基づいた適切な在庫管理に役立ち、意思決定の精度が向上するでしょう。
なお、実際に機械学習を用いて見込み客の予測を行った例について知りたい方は、弊社の「アナリティクスサービス」によるトータル支援の事例をご覧ください。
回帰分析のメリット・デメリット
回帰分析には多くのメリットがある一方で、デメリットも存在します。メリットとデメリットの両方を把握し、回帰分析について理解を深めましょう。
回帰分析のメリット
回帰分析のメリットは、データに基づいた根拠のある推論を得られることです。マーケティング施策によって期待できる利益を客観的なデータに基づいて合理的に予測でき、マーケティング戦略の効果を高めるための具体的な指針が得られる可能性があります。
また、回帰分析はデータに基づいた合理的な判断につながるため、意思決定の精度が向上することもメリットです。結果に対して影響力のある要素が明確になり、改善の優先順位をつけることで業務の効率化につながるでしょう。
回帰分析のデメリット
回帰分析のデメリットは、剰余変数を見逃すと誤った分析結果になる可能性があることです。剰余変数とは、説明変数以外で結果に影響を及ぼし得る余計な変数を意味します。剰余変数に気づかなければ、目的変数の予測を正しく行えなくなるため、分析者によるコントロールが必要です。
また、回帰分析には専門的知識が求められ、計算処理が複雑であることから、簡単にできるものではないこともデメリットといえます。さらに、表計算ソフトやツールを使って数値の入力はできたとしても、適切な解釈ができる分析スキルがなければ結果を有効活用できないでしょう。
回帰分析の種類と活用事例
回帰分析にはいくつかの種類があり、それぞれ異なる状況で活用されます。ここでは、回帰分析の主な種類と身近な場面で活用されている回帰分析の事例について見ていきましょう。
単回帰分析
単回帰分析は、1種類の説明変数と1種類の目的変数の関係を分析する手法です。シンプルで理解しやすく、基本的な回帰分析として広く活用されます。
単回帰分析は、下記のように1つの結果に対して1つの要素の関係を調べるときに使われます。
単回帰分析の活用事例
・小売店の売上に対する立地の影響力を予測する
・教科の習熟度と学習時間の関係を検証する
・気温と温室効果ガス排出量との関係を調査する
重回帰分析
重回帰分析は、複数の説明変数と1つの目的変数の関係を分析する手法です。1つの結果に対して、複数の要素がどう影響しているのかを調べるときに役立ちます。現実にある問題は複数の種類の要因が影響を与えるため、単回帰分析より重回帰分析が適している場面の方が多いです。
重回帰分析が活用されるのは以下のような場面です。
重回帰分析の活用事例
・新しく出店した店舗の売上を複数の要因から予測する
・顧客満足度へ影響を与える要素を把握する
・周辺施設や築年数などから不動産の価格を予測する
重回帰分析の具体的な事例
ここで、重回帰分析の具体的な事例として、弊社が手掛けた「職場の満足度と転職行動に関する調査」を紹介します。共通ポイントサービス「Ponta(ポンタ)」を運営する弊社は、Pontaリサーチ会員(※)に対し、下記の内容で転職意向に影響する要素を調査しました。
※Ponta会員で「Pontaリサーチ」への会員登録をしていただいている方
「職場の満足度と転職行動に関する調査」の概要
・調査方法:インターネット調査
・調査期間:2023年10月26日~10月31日
・パネル:「Pontaリサーチ」会員
・調査対象:男女20歳~59歳の現在就業者
・有効回答数:6,724名
※調査対象は会社員・公務員・自営業・パート・アルバイト・専門職・教職・その他
※日本の人口における性年代分布を考慮してウェイトバック集計
※調査結果は小数点第2位を四捨五入しています
本調査では、「転職行動」を目的変数、「同僚との関係」や「仕事の自由度」などを説明変数とした重回帰分析を実施し、「転職行動にどのような要素が影響するか」を調査しました。
調査によると、転職行動に影響する要素は「研修・学びの機会」や「仕事内容が明瞭」といった業務上のものだけではないことが明らかになっています。「上司との関係」や「同僚との関係」など、人間関係に関する不満も転職行動につながることが示唆されました。
本調査では、他にも大規模組織と小規模組織の職場満足度の比較や、新興企業と老舗企業の満足度の比較などを行っています。詳細を知りたい方は、下記の調査報告をご覧ください。
ロジスティック回帰分析
ロジスティック回帰分析は、「はい」「いいえ」で答えられる結果を予測する分析手法です。例えば、ユーザーが広告をクリックするかしないかといった2択の結果を予測するときに使用します。「はい・いいえ」は数値ではありませんが、「1・0」に置き換えることで数値化され、分析データとして活用可能です。
ロジスティック回帰分析は、事象が発生する確率を予測するときに便利です。例えば次のような活用事例があります。
ロジスティック回帰分析の活用事例
・新商品の購買率(商品を購入するかどうか)を調べる
・受験生の合格率(合格するかどうか)への学習時間の影響を調べる
・特定の気温や湿度の下での発雷率(雷の有無)を予測する
回帰分析のやり方
回帰分析は表計算ソフトでも実施できますが、精度の高い結果を得るには専門的知識が必要です。プロに依頼する場合でも、何も知らずに託すより大まかなやり方を理解しておいた方が円滑に進められるでしょう。
ここでは、回帰分析の基本的なやり方について順を追って説明します。
①目的変数を決定する
回帰分析のやり方の最初のステップは、予測したい結果となる目的変数を設定することです。例えば店舗の売上を予測する場合、売上額が目的変数となります。
②説明変数を決める
続いて、目的変数に影響を与えていそうな要因の説明変数を決めましょう。例えば回帰分析で売上予測を行う場合、アクセスや広告費、客単価などが説明変数として設定できます。
説明変数を決めるときは、候補となるたくさんの要素を集めた上で慎重に選んでいくとよいでしょう。決定方法として、説明変数を追加したり除去したりしながら回帰モデルを作成する方法もあります。
重回帰分析やロジスティック回帰分析で説明変数を選ぶときの注意点は、多すぎたり少なすぎたりしないようにすることです。変数が多すぎると分析が複雑になり、少なすぎると重大な要素を見逃す可能性があります。
③分析データを用意する
変数を設定したら、分析に必要なデータを収集します。例えば、店舗の売上と座席の関係を回帰分析で調査する場合、売上額のデータと座席数のデータが必要です。
収集の際、散布図で確認するなどしてデータが外れ値にならないように確認しましょう。外れ値とは、他のデータと比べて極端に大きすぎたり小さすぎたりする値のことです。外れ値が含まれていると外れ値に寄った回帰式になり、分析精度が下がる可能性があります。
質的データを分析したい場合は、数値化を行いましょう。例えば「あり・なし」や「はい・いいえ」は「1・0」、「大・中・小」であれば「3・2・1」などと表現できます。
④回帰分析を実行する
データが揃ったら、回帰分析のやり方の最終ステップとして分析を実行しましょう。表計算ソフトや分析ツールにデータを入力し、出力すると得られるのが一次関数で表される回帰式です。回帰式の妥当性を評価した上で、解釈を加えます。
結果を解釈するときは、回帰分析はあくまで統計的な関連性を示唆するもので、データの因果関係を証明するわけではないことを念頭に置きましょう。例えば売上と座席数の多さに関係性があるとわかっても、席を増やせば売上が増加するとは断定できません。
回帰分析を行う際の注意点
回帰分析を適切に実施するためには、いくつかの注意点を押さえておくことが不可欠です。最後に、回帰分析で特に気をつけたい2つの注意点について説明します。
正しいデータを用意する
注意点の1つめは、正確で信頼性のあるデータを用意することです。不正確なデータは、分析結果を誤った方向に導きます。特に重回帰分析やロジスティック回帰分析では複数の説明変数を使用するため、誤ったデータが重なると見当違いの結果になりがちです。
正しいデータを得るためには、データの重複や誤入力などの不備を修正し、データを使える状態にする作業(データクレンジング)が必要となります。表計算ソフトやデータクレンジングツールを活用してデータを整備し、精度の高い分析結果を得られるようにしましょう。
トレンドは除外する
注意点の2つめは、変数の設定時にトレンドを取り除くことです。回帰分析はトレンドに弱い側面があり、変数として除去しなければ分析結果を歪ませる恐れがあります。例えば、以下のような要因には注意しましょう。
注意が必要なトレンドの例
・テレビや雑誌で取り上げられた
・SNSでインフルエンサーが紹介した
データの力でビジネスの課題を解決するならロイヤリティ マーケティングへ
回帰分析を活用すると、データに基づいた合理的な推論によりマーケティングの課題解決につながります。データドリブンなやり方が可能となり、客観的な意思決定によって費用対効果の高い施策が実施できるでしょう。
しかし、精度の高い回帰分析を実施するには、統計学や数学といった専門的な知識や、データから導き出した回帰式を解釈する分析力が必要です。専任のデータアナリストの確保が難しい場合は、データ分析のプロへの依頼も検討してみましょう。
弊社ではPontaデータの解析を通じて、自社データだけでは見えてこなかった市場の動向や企業の顧客ニーズを明らかにし、課題解決に向けて効果的な施策実行の支援が可能です。経験豊富な専任アナリストがヒアリングからデータの分析までお客様に寄り添ってサポートいたします。
Pontaを活用したデータ分析に関心がある方は、お気軽にお問い合わせください。
お気軽にお問い合わせください
詳しくお知りになりたい方はお問い合わせ