平均だけ見ていると判断を誤る|マーケ実務で使える基礎統計値の読み方5選

平均だけ見ていると判断を誤る|マーケ実務で使える基礎統計値の読み方5選

顧客分析

「先月の売上平均は○○円でした」「スタッフの対応満足度は平均4.2点です」。こういった数字を、経営の判断材料として使っている方は多いと思います。平均値はデータ全体をひとつの数字に要約できる、非常に便利な指標です。

ただし、平均値には致命的な弱点があります。異常値(極端に大きい・小さい値)があると、そちらに引っ張られてしまうのです。たとえば、従業員10名の会社で9名の年収が300万円、1名だけが3,000万円だとします。このとき平均年収は約570万円。「うちの平均年収は570万です」は事実ですが、実態とはかなりズレています。

さらに怖いのは、グループを合算したときに逆転現象が起きるケースです。これを「シンプソンのパラドックス」といいます。たとえば、AクリニックとBクリニックをそれぞれ見ると、どちらも治療成功率でAが上回っているのに、全体を合算するとBのほうが高くなる、といった現象が起きます。患者数の構成比(軽症・重症の割合)が違うために生まれる逆転です。「全体で見た数字」と「中身を分解した数字」が食い違うことは、現場でも珍しくありません。

平均だけを見て判断することのリスクを理解したうえで、次からは「もう一段加える指標」を5つ紹介します。

中央値: 異常値に強いもうひとつの「真ん中」

平均値と中央値が大きくズレている例:9名300万・1名3000万の年収分布

中央値とは、データを小さい順に並べたときの真ん中の値です。先ほどの年収の例で言えば、中央値は300万円。こちらのほうが実態に近い数字です。

平均値と中央値が大きくズレているときは、データの中に極端な値が混ざっているサインです。 たとえば、顧客単価の平均が8,000円なのに中央値が4,000円なら、高単価のごく一部の顧客が平均を押し上げている可能性があります。その場合、「平均8,000円の顧客」に向けた施策を打っても、大多数には刺さりません。

平均と中央値を並べて眺める習慣をつけるだけで、数字の「実態感」がかなり変わります。特に売上・客単価・問い合わせ件数など、ひとつの大きな案件が全体を動かしやすい指標は要注意です。

標準偏差: ばらつき=リスクを数値で捉える

5月と6月の店舗売上比較:平均は同じ50万でも標準偏差3万と15万でばらつきが違う

標準偏差とは、データが平均からどれくらい散らばっているかを表す数値です。難しく聞こえますが、要は「平均からの平均的なズレの大きさ」です。これが大きいほど、日ごとや月ごとのブレが大きいことを意味します。

具体的な例で考えます。ある店舗の5月と6月、1日あたり売上の平均がどちらも50万円だったとします。数字だけ見ると「同じ調子」に見えます。しかし標準偏差を計算すると、5月は3万円、6月は15万円だったとしたらどうでしょう。

6月は平均こそ同じでも、日によって35万円の日もあれば65万円の日もある、不安定な状態です。 5月は「安定して50万円を稼ぐ月」であり、6月は「運がよければ稼げるが、悪ければ大きく下振れする月」です。平均値だけを見ていると、このリスクの違いは一切見えません。

売上・来客数・スタッフの稼働状況など、安定性がビジネスに直結する指標は、平均と合わせて「ばらつき」を見ることが大切です。

変動係数: 規模が違うものを公平に比べる

大型店舗と小型店舗の標準偏差・変動係数の比較表

標準偏差には、ひとつ注意点があります。規模の大きいものほど、ばらつきの絶対値も大きく出やすいという性質です。

たとえば、大型店舗と小型店舗を比較するとします。ある月の1日あたり売上の平均が、大型店舗は100万円、小型店舗は20万円だったとします。標準偏差を計算すると、大型店舗が20万円、小型店舗が6万円でした。「大型店舗のほうがばらつきが大きい=リスクが高い」と言えるでしょうか。

実はそうとは限りません。変動係数(標準偏差÷平均値)を見ると、大型店舗は20÷100=0.20、小型店舗は6÷20=0.30。 規模を揃えて比べると、小型店舗のほうが売上のブレが相対的に大きく、経営上のリスクが高い状態です。規模の違うものを比べるときは、変動係数で「比率のばらつき」を確認する必要があります。

もうひとつ、変動係数が活きる使い方があります。特定の指標を週単位で追うケースです。

たとえばコールセンターで、ある問い合わせカテゴリの「解決率」を週ごとに記録していたとします。変動係数が低い場合は、週によらず解決率が均一に低い状態です。オペレーターの個人差ではなく、対応マニュアルや仕組み自体に問題があると読めます。変動係数が高い場合は、解決できる週とできない週がある状態です。特定のオペレーターが担当した週だけ解決率が高い、といったスキルや教育のばらつきが原因である可能性が高くなります。同じ「解決率が低い」という問題でも、変動係数によって打ち手がまったく変わります。

標準化: バラバラな指標を1つの優先度に束ねる

件数と解決率を標準化して1つの改善優先度リストに整理する流れ

コールセンターに20種類の問い合わせカテゴリがあるとします。「問い合わせ件数が多くて、解決率が低いカテゴリ」を優先的に改善したい。シンプルな目標ですが、件数は「件」、解決率は「%」と単位が異なるため、そのまま並べて比べることができません。

標準化とは、異なる単位・スケールのデータを「平均0、ばらつき1」という共通の基準に変換する操作です。数式は不要です。感覚だけ掴んでください。標準化すると「平均からどれくらい離れているか」が同じ尺度で比べられるようになります。

件数と解決率を標準化したうえで合算すれば、「件数が多くて解決率が低いカテゴリ」を数値で順位づけできます。 20種類がひとつの優先度リストに整理されます。エクセルやスプレッドシートで処理できるレベルの計算ですので、自社のデータに応用してみてください。

偏差値: 母集団のなかでの位置づけを直感で掴む

10店舗の月間売上を偏差値化したランキング:上位グループから要てこ入れまで

偏差値は、受験で馴染みのある指標です。難易度の異なるテストの結果を比べるとき、単純に点数を並べても意味がありません。平均70点のテストで80点を取るのと、平均40点のテストで60点を取るのとでは、どちらがより「できた」のかが点数だけでは判断できません。

偏差値を使えば、どちらのテストでも「集団の中でどの位置にいるか」を同じ基準で表現できます。 ビジネスでも同じ考え方が使えます。たとえば10店舗を運営している場合、各店舗の月間売上を偏差値化すれば、「C店は偏差値65で上位グループ」「F店は偏差値42で平均以下」のように、どの店舗が業績好調で、どの店舗がてこ入れを要するのかが一目で分かります。単純な売上順位だけでは、上位と下位の差がどれくらい開いているかが見えづらいのですが、偏差値ならその「離れ具合」まで含めて把握できます。

まとめ: 目的別の使い分けと、意思決定の前に1つ加える習慣

6つの指標を整理します。

  • 平均値: データ全体を1つの数字でぱっとつかみたいとき。ただし異常値の影響を受けやすく、分布の中身は見えないので、他の指標と組み合わせて使う
  • 中央値: 異常値・外れ値があるなかで、平均よりも実態に近い「真ん中」を知りたいとき
  • 標準偏差: 売上・品質など、同じ規模のデータ間でばらつきの大きさを比較したいとき
  • 変動係数: 規模が違うもの同士を比べたいとき、または時系列の安定度からリスクの原因(仕組みかスキルか)を切り分けたいとき
  • 標準化: 単位の違う複数の指標を統合して優先度をつけたいとき
  • 偏差値: 集団の中での相対的な位置づけを把握したいとき

どれも、「平均値だけでは見えなかったことを見えるようにする」ための道具です。難しい数式を覚える必要はありません。「今見ているこの数字は、ばらつきも見ているか?規模の違いを揃えているか?」という問いを持つだけで、データから引き出せる情報の量はかなり変わります。

平均値はあくまで入口です。意思決定の前にもう1つの数字を重ねる習慣が、判断の精度を上げていきます。

Fluxx Growth Partner

広告運用から集客設計、業務の自動化まで

ツール選びから業務設計、自動化の実装まで——
すべて1社で完結できるのが私たちの強みです。

ツール選定・業務設計
広告・マーケ・集客
自動化・AI活用
まずは30分の無料相談から

Author

竹内 亮太

竹内 亮太

Marketer

大学卒業後、株式会社マクロミルに入社。3年間リサーチャーとして消費者データの分析に従事。マクロミル在籍中に大手広告代理店へ出向し、TV/WEB広告などの複数媒体の効果検証をメインで担当する。その後、CDPベンダーへアナリストとしてjoinし、耐久消費財を軸とした幅広いテーマでの分析を行う。

Related Articles

10年使ったSlackの有料プランに別れを告げた日
カスタマージャーニーをつくる前にやってほしいたったひとつのこと
NPSスコア「取っただけ」で終わっていませんか?