Excelで回帰を実行する方法

Excelの回帰は、の統計的プロセスを自動化する方法です。 いくつかの情報セットを比較する 独立変数の変更が従属変数の変更にどのように影響するかを確認します。 2つのことの相関関係を見つけたい場合は、Excelで回帰分析を使用するのが最善の方法の1つです。

この記事の手順は、Excel 2019、Excel 2016、Excel 2013、Excel2010に適用されます。

回帰の意味は何ですか?

回帰は、分析者が複数の変数間の関係を決定するために使用する統計モデリングアプローチです。

回帰分析は、分析しようとしている単一の変数と、それらがその単一の変数に影響を与えるかどうかを確認するためにテストしている独立変数から始まります。 分析では、独立変数の変化を調べ、それらの変化を単一の(従属)変数の結果の変化と相関させようとします。

これは高度な統計のように聞こえるかもしれませんが、 Excel これを作ります 複雑な分析 誰でも利用できます。

Excelで線形回帰を実行する

回帰分析の最も単純な形式は線形回帰です。 単純線形回帰は、2つの変数間の関係のみを調べます。

たとえば、次のスプレッドシートは、人が1日に食べたカロリー数とその日の体重を含むデータを示しています。

体重とカロリーのスプレッドシートのスクリーンショット

このスプレッドシートには2列のデータが含まれており、一方の変数が他方に影響を与える可能性があるため、Excelを使用してこのデータに対して回帰分析を実行できます。

AnalysisToolPakアドオンの有効化

Excelの回帰分析機能を使用する前に、Excelの[オプション]画面でAnalysisToolPakアドオンを有効にする必要があります。

  1. Excelで、 ファイル メニューと選択 オプション.

    Excelのオプションのスクリーンショット
  2. 選択する アドイン 左側のナビゲーションメニューにあります。 次に、確認してください Excelアドイン で選択されている 管理 分野。

    Excelオプション
  3. 最後に、 行け ボタン。

    Excelアドインオプションと移動ボタン
  4. [アドイン]ポップアップウィンドウ。 有効 分析ツールパック その前のボックスをクリックしてチェックマークを追加し、 わかった.

    Excelアドオンポップアップウィンドウ

Analysis ToolPakが有効になったので、Excelで回帰分析を開始する準備が整いました。

Excelで単純な線形回帰を実行する方法

例として体重とカロリーのスプレッドシートを使用すると、次のようにExcelで線形回帰分析を実行できます。

  1. を選択 データ メニュー。 次に、 分析 グループ、選択 データ分析.

    Excelでのデータ分析の選択
  2. の中に データ分析 ウィンドウで、 回帰 リストからクリックします わかった.

    Excelでの回帰データ分析の選択
  3. NS 入力Y範囲 従属変数を含むセルの範囲です。 この例では、それが重みです。 NS 入力X範囲 それは セルの範囲 独立変数が含まれています。 この例では、それがカロリー列です。

    Excelで回帰範囲を入力するためのフィールド
  4. 選択する ラベル ヘッダーセルの場合は、 新しいワークシート 結果をに送信するには 新しいワークシート. 選択する わかった Excelに分析を実行させ、結果を新しいシートに送信します。

    ラベルを適用し、新しいワークシートに回帰を送信するためのExcelフィールド
  5. 新しいワークシートを調べます。 分析出力には、結果を解釈するために理解する必要のあるいくつかの値があります。

    Excelでの回帰分析出力のスクリーンショット

    これらの各番号には、次の意味があります。

    • 複数のR:相関係数。 1は、2つの変数間に強い相関関係があることを示し、-1は、強い負の関係があることを示します。 0は、相関関係がないことを意味します。
    • Rスクエア:決定係数。2つの変数間のポイントが回帰直線上にいくつあるかを示します。 統計的には、これは平均からの偏差の2乗の合計です。
    • 調整済み決定係数:選択した独立変数の数に合わせて調整された、決定係数と呼ばれる統計値。
    • 標準エラー:回帰分析の結果の正確さ。 このエラーが小さい場合、回帰結果はより正確になります。
    • 観察:回帰モデルの観測数。

    回帰出力の残りの値は、回帰分析のより小さなコンポーネントに関する詳細を提供します。

    • df:に関連する自由度として知られる統計値 変動の原因.
    • NS: 平方和。 ほとんどのデータが回帰直線に適合する場合は、残差平方和とSSの合計の比率を小さくする必要があります。
    • MS:回帰データの平均二乗。
    • NS:帰無仮説のF統計量(F検定)。 これは、回帰モデルの重要性を提供します。
    • 有意性F:FのP値として知られる統計値。

    統計と回帰モデルの計算を理解していない限り、要約の下部にある値はあまり意味がありません。 ただし、複数のRとRの2乗が最も重要な2つです。

ご覧のとおり、この例では、カロリーは総重量と強い相関関係があります。

Excelでの多重線形回帰分析

同じ線形回帰を実行しますが、複数の独立変数を使用するには、範囲全体(複数の列と行)を選択します。 入力X範囲.

入力X範囲の範囲を選択するスクリーンショット

複数の独立変数を選択する場合、変数が非常に多いため、強い相関関係が見つかる可能性は低くなります。

ただし、Excelの回帰分析は、データを手動で確認するだけでは、存在することに気付かない可能性のある1つ以上の変数との相関関係を見つけるのに役立ちます。