現在、ブログトラフィックのモニタリングに熱心に励んでいる人は挙手してください。
無料
Webサイトの分析を簡易化し、効率的な運営を実現
無料ダッシュボード
・現状分析を容易にするダッシュボード
・ページ別のPVや離脱率の表示
・時間帯別、曜日別ユーザー数のグラフ表示
・チャネル別CVRの自動表示
さて、あなたの手は挙がっているでしょうか? 私も毎日、ときには日に何度も、トラフィックを確認しています。そうやってこまめにチェックしておけば、突然ページビューが落ち込んだとしてもすぐに手を打てるので、決して悪いことではありません。
しかし、一歩引いて見るほうがずっと参考になるときもあります。大局的な視点を持つと、ブログの成長速度など、本当に大切なパターンが見えてきます。それを踏まえて、チーム編成を最適化したり、予算を取ってきたり、リソースを割り当てたりできるのです。
成長速度を理解するには、月次トラフィックの回帰分析が有効です(何年も数学から遠ざかっていても、とても簡単なので心配はいりません)。
この記事では、回帰分析とは何か、どのような場合に重回帰分析を使用するか、回帰分析の結果をどう解釈するかを説明します(ここではブログの成長を例に取り上げていますが、回帰分析は業務で扱う多くの測定指標に適用できます)。
回帰分析とは
回帰分析とは、2つの変数の間に関係、つまり「相関」があるかどうかを調べるための統計手法です。降雨量と作物の発育に相関関係はあるか、ブログが時間と共にどのように成長しているかなど、さまざまな関連性を調べるのに活用できます。
WEBサイト トラフィック分析ダッシュボード
可視化されたデータをもちいて最善のSEOとコンテンツ戦略を導き出しましょう。
- 現状分析を容易にするダッシュボード
- ページ別のPVや離脱率の表示
- 時間帯別、曜日別ユーザー数のグラフ表示
- チャネル別CVRの自動表示
今すぐダウンロードする
全てのフィールドが必須です。
独立変数1つ(例:時間)と従属変数1つ(例:ブログトラフィック)、そして相当量のサンプルがあれば、回帰分析でブログトラフィックの増加について多くのことがわかります。
2つの変数の関係を判断するために、そのデータに最も当てはまりの良い線を探します。この線はデータが今後どう変化しそうかおおよその方向を示すものです。トラフィックの増加速度を知るには、回帰分析の要素を理解する必要があります。
回帰分析の仕組み
正しく分析するために、回帰分析に関する3つの要素を理解しておきましょう。次の図を参考にご覧ください。
1. 散布図
回帰分析を行うには、まずデータの点を座標に示す必要があります。そして、データを表すのに最も適しているのが散布図です。X軸が独立変数、Y軸が従属変数を表します。
2. 最も当てはまりの良い線
最も当てはまりの良い線がどのようなものなのかは既に簡単に説明しましたが、どのような種類の線を探すべきなのかも知っておかなければなりません。検討すべき主な種類は次の3つです。
線形
まず直線です。着実に増加していることを示し、どの時点でも同じペースで成長しています。たとえば下図のようになります。
指数
急速に上向きのカーブを描き、横ばいにならない線です。だんだん速度を上げながら成長しています。たとえば下図のようになります。
対数
だんだんと横ばいになる曲線です。時間が経つにつれ、増加の速度が低下して「天井」に突き当たり、それ以上の成長が見込めません。たとえば下図のようになります。
他にもさまざまな種類の線がありますが、この3つは特に重要なので覚えておいてください。
3. R²
R²(R二乗値)は、0から1の間の値を取る数値で、線がデータにどれだけよく当てはまっているかを示します。1に近いほどデータへの当てはまりが良いということです。相関関係があるという結論をグラフから引き出すには、かなり1に近い値であることが望まれます。たとえばR²が0.98であれば、Yの分散の98%をXの分散で説明できると言えます。
重回帰分析
回帰分析は2つの変数を比較するだけのものではありません。複数の独立変数(「予測変数」とも言います)がデータに影響している場合、結果に現れた傾向に個々の変数が影響を与えているかどうかを確認したいと思うはずです。それには重回帰分析を行う必要があります。
重回帰分析は、複数の従属変数が何かのパフォーマンスに影響を与えているかどうかを判断するのに役立ちます。線形回帰分析を複数回行うと考えてください。2つ以上の独立変数それぞれについて、同じ従属変数に対する回帰を確認するのです。具体的に言うと次のようになります。
- 線形回帰分析:Y軸がブログトラフィック、X軸が時間
- 重回帰分析:Yがブログトラフィック、X¹が時間、X²が有料広告、X³がニュース記事
重回帰分析の解釈
上記の1番目の例では、ブログトラフィックの増加に時間が関係しているかどうかを確かめるだけです。2番目の例では、時間と、有料広告のプロモーションと、ニュース記事が、それぞれブログトラフィックの増加にどう役立っているかを確認します。
さて、ブログの成長を分析するために、まずExcelでYとX¹の間の線形回帰テストを行います。Yの値は、X²(有料プロモーション)およびX³(ニュース記事)からのトラフィックを除いた残りすべてのトラフィックになるでしょう。そして回帰テストでR²を調べます。その後、X²を含むトラフィックで、さらにX³を含むトラフィックで回帰テストを行います。
まず記事冒頭に示した元の回帰分析のグラフを見てください。それから、この新しくデータを追加したグラフを見てください。左側の赤い丸の部分は、おそらく有料広告プロモーションから生じたトラフィックです。また、右側の丸の部分は、ニュース記事から生じたトラフィックと思われます。
どちらの独立変数も近似曲線のR²値を変化させる可能性があり、ここではニュース記事とブログトラフィック全体の間に指数回帰が突然発生しています。
Excelで回帰分析を行う方法
- データをExcelにエクスポートする
- 散布図の機能を使用してデータをグラフ化する
- 近似曲線のオプションを開く
- 試したい近似曲線の種類を選択する
- R²値を調べる
- スプレッドシートにR²を記録する
- 近似曲線を削除する
- 新しい種類の近似曲線を指定して4~7を繰り返す
- R²値を比較する(1に近いほど当てはまりが良いことを表します)
トラフィックの傾向を知るには、基本的に、前述の3種類の線それぞれについて回帰分析を行い、そのR²値を比較する必要があります。R²が最も大きい線が、データに最も当てはまりの良い線です。
注意:どれもR²が大きくない場合や、R²の最高値があまり1に近くないという場合もあります。それはつまり、どの線もよく当てはまっていないということです。そうした場合は、さらにデータを収集して回帰分析をやり直すことをお勧めします。
Excelを使用して回帰分析を行う方法について詳しくご説明します。
1. データをExcelにエクスポートする
この例では、ブログのトラフィック数をExcelに読み込みます(HubSpotをお使いの方は、ソースレポートからこの情報を入手できます。上部のドロップダウンでブログのサブドメインを選択してから、エクスポートしてください)。
エクスポートしたデータをExcelで開いたら、月の行とトラフィックの行以外のすべての情報を削除してください。HubSpotをお使いの場合、必要な情報はすべて[訪問]タブにあります。
2. 散布図の機能を使用してデータをグラフ化する
エクスポートしたファイルを指定すると、Excelの新しいスプレッドシートとしてデータが開かれます。データを必要な形に整理してください。たとえばブログのトラフィックがどう変化しているかを分析する場合には、X軸に「時間」、Y軸に「トラフィック」を配置するのが妥当です。そこで、この測定指標をExcelの2つの行に割り当てます。
3. 近似曲線のオプションを開く
Excel上部のリボンで[グラフ レイアウト]、[近似曲線]の順に選択すると、近似曲線のオプションが表示されます。以下のオプションが選択できます。
- 線形
- 指数
- 線形予測
- 平均の推移
[その他の近似曲線オプション]を選択すると、ニーズに合わせて近似曲線をさらに詳しく設定できます。
4. 試したい近似曲線の種類を選択する
[種類]の中から回帰分析に使用したい線の種類を選択します。今回のブログトラフィックのテストでは、次のスクリーンショットのとおり[線形近似]を使用します。
5. R²値を調べる
R²とは何だったでしょうか。近似曲線が実際に散布図の形にどれだけ当てはまっているかを0から1の間で示す数値です。[オプション]を選択して[グラフにR-2乗値を表示する]を選択します。すると、線の横にR²が表示されます。終わったら[OK]をクリックしてください。
6. スプレッドシートにR²を記録する
グラフの左側のセルに、散布図の近似曲線の横に表示されたR²値を記録します。
近似曲線の種類を変えて何度か回帰分析を実行し、それぞれのR²値をスプレッドシートのセルに記録していってください(下図を参照)。そうすると、どの種類の近似曲線が散布図の形に最もよく当てはまるかを判断できます。R²が1に最も近いものが、最も当てはまりの良い近似曲線です。
7. 近似曲線を削除する
線をクリックし、キーボードの[Delete]キーを押します。その後は、データの傾向をもっとよく表す近似曲線がないかを確認します。
8. 新しい種類の近似曲線を指定して4~7を繰り返す
指数近似と対数近似について、ステップ4~7を繰り返します。より多くの近似曲線でR²値を確認したほうが、回帰分析の精度は上がります。データがどの種類の傾向を示しているかは確実に把握しておきたいところです。一度線形回帰分析を実行しただけでやめてしまっては、結論を引き出すのに十分とは言えません。
9. R²値を比較する(1に近いほど当てはまりが良いことを表します)
線形近似であれば、安定したペースで成長しています。指数近似であれば、加速度的に成長しています。対数近似であれば、成長が減速しています。
どの線もあまり当てはまりが良くない場合もあります。これについては、前述の「注意」を参照してください。
ここで使用した例では、すべて比較的1に近い値が出ていますが、指数回帰のR²が0.896と最大であり、最も当てはまりが良いことがわかりました(下図はクリックして拡大表示できます)。つまり、指数近似曲線がブログの成長を最もよく表しており、指数的に増加していることから、ブログは急速な成長を遂げていると判断できます。
これで以上です。ブログがどの程度の速度で成長しているか見当がついたかと思います。ただし、回帰分析からわかるのはあくまでも過去の成長の傾向です。これからの未来に何が起こるかを完全に予測できるわけではありません。
画像著作権:Math is Fun、SOS Math