最近、PPCマーケティングで平均値を使用することに関する問題について話しているツイートやブログ記事が大量に発生しています。たとえば、Julie Bacchiniが「平均は気の利いた尺度である」と主張している例です。
時には平均値が非常に誤解を招く可能性があることは事実ですが、上記のデータセットの問題は、標本の膨大な母集団の分散と標準偏差です。
$config[code] not foundこの記事では、ここで取り上げている数学についてお話しし、平均値の値を求めるケースを作ります。また、最近PPCコミュニティで見た平均値の報告に対する批判の一部にも回答します。
分散、標準偏差、および分散係数
標本分散 データセット内の値が、データセットの平均値とどの程度異なる可能性があるかによって、分散の尺度です。平均から各データポイントの差の二乗の平均を取って計算されます。差を二乗することで、負の偏差と正の偏差が互いに相殺されることはありません。
したがって、クライアント1の場合は、0.5パーセントと3.6パーセントの平均変化との差を計算し、その数値を2乗します。すべてのクライアントに対してこれを行い、次に分散の平均を取ります。それがサンプル分散です。
サンプル標準偏差 は単に分散の平方根です。
簡単に言うと、平均して、このデータセットの値は通常、全体の平均3.6%から5.029%離れています(つまり、数値は非常に分散しています)。つまり、この分布から多くの結論を得ることはできません。
標準偏差が「高すぎる」かどうかを推定する簡単な方法(正規分布を探していると仮定して)は、標準偏差を平均で割ったものである分散係数(または相対標準偏差)を計算することです。
これはどういう意味ですか、なぜ私たちは気にする必要がありますか?それは平均で報告する価値についてです。 WordStreamがクライアントデータを使用して調査を行うとき、私たちは小さなデータセットから平均値を計算して大きな結論を出すだけではありません - データの分布については気にかけます。数字があちこちにある場合は、それらを捨てて、サンプルを別の方法で(業界、支出などによって)セグメント化して、より自信を持って結論を出すことができるより意味のあるパターンを見つけるようにします。
定義上、意味のある平均であっても平均を上回る、または下回る値を含む
反平均的なキャンプからの批判のもう一つの線は、平均が全人口のために話さないという概念です。もちろん、これは当然です。
はい、平均には平均値の上下にあるデータポイントが含まれています。しかし、これは平均値を完全に排除するための優れた議論ではありません。
正規分布を仮定すると、図のように、データポイントの約68パーセントが平均から±1標準偏差、95パーセントが±2標準偏差、99.7パーセントが±3標準偏差に収まると予想されます。ここに。
お分かりのように、異常値は確かに存在しますが、データセットに標準的な分布が狭い場合は、予想されるほど一般的ではありません。そのため、数学に注意を払っている場合でも、平均値は依然として大多数の広告主にとって非常に有用な情報となり得ます。
PPCマーケティングでは、数学が勝利
風呂水で平均を捨てないようにしましょう。結局、AdWordsの掲載結果指標のほとんどすべて(CTR、CPC、平均掲載順位、コンバージョン率など)は平均値として報告されます。
平均を無視するのではなく、見ている平均が意味があるかどうかを判断するために数学の力を使用しましょう。
許可を得て再発行しました。ここはオリジナルです。
Shutterstockによる平均写真
もっと:出版社チャンネルのコンテンツ