Google Data Mineを活用する

Anonim

あなたは今日「グーグル」しましたか?このページには "googling"でアクセスしましたか?

もしそうなら、あなたは未来を見ました、そして、あなたはまだそれに気づいていなくても、あなたはそれの一部です。実際、Googleでは検索だけでなく、もっと多くのことが行われています。私は、Googleが何をしているのか、知っているのか、そしてそれを最大限に活用するために何をすべきか、知っているのかについてお話します。

$config[code] not found

確かに、Googleは強力な検索エンジンで最もよく知られています。検索エンジンは、Webページ、ビデオ、画像、株価情報、電話番号、住所、その他のメディアやデータの塊を利用して関連情報を提供します。キーを打つのにかかる時間。

世界最大の検索エンジンの名前は、インターネットの検索と同義語になりました。それは私たちの日常的な言語の動詞にもなっています(Googleがそのように使用するのを好まない場合でも)。私たちは自動車のレビュー、子供の頃の友人の現在の住所、そして空想と壮大さの飛行では自分自身。

私たちが探しているのは私たちだけではないことを忘れがちです。 Google環境内で行うすべてのこと(およびその外部で行ういくつかのこと)は、記録、保存、および分析されます。ある会社がそれほど多くのデータを利用できることを知ったら、これらすべての情報が単なる快適な検索エクスペリエンス以外にもはるかに多くの用途に使用される可能性があることを認識するのにはそれほど時間はかかりません。

Googleの潜在的な力を十分に理解するために、しばらくの間座って、Googleがどのように機能するかをもう少し詳しく検討してください。 Googleのしくみ

何気なく検索する人には、Googleがどのように急速にインターネットを検索し、そのような良い結果を出したのかはすぐにはわからない。その秘訣は、あなたが質問を入力したとき、彼らがインターネットを全く検索していないということです。その代わりに、Googleは1日24時間、週7日、絶えず成長し更新しているデータベースを検索しています。

これはすべて人間の介入なしに起こります。 「スパイダー」または「クローラ」と呼ばれる小さなプログラムは、あるページから別のページへのリンクを個別にたどります。これは、スパイダーがWebのスレッドをたどる方法です。クモがWebページを横切ってクロールするとき、彼らはあらゆる文章、画像、電話番号および彼らが遭遇するかもしれない他の何かについての情報を収集します。彼らは彼らが訪れる各ページをスキャンし、キーワードを索引付けしそしてそのページから及びそのページへのリンクに注意する。その後、この情報は大規模なデータベースに保存されます。同じリンクとページが何度も何度もクロールされるため、Googleの情報は最新の状態に保たれます。

Googleは、スパイダーが収集した情報を使用してページをランク付けしています。このランキングプロセスに含まれるものは以下のとおりです。

  • キーワードの頻度と場所(より目立つ場所にあるキーワードの数が多いほど)。
  • ページの年齢(ページが確立されているほど、優れています)。
  • ページにリンクしているページ数(リンク数が多いほど良い)。

グーグルが考慮する他の要因があるが、これらはシステムをゲームしようとし、実際に有用な情報を提供せずに高いランクを獲得しようとする人々を妨げるために秘密にされている。さらに、あなたがそれをやり過ぎて、単に冗長な情報、キーワードのリスト、そしてジャンクリンクであなたのページをいっぱいにするならば、グーグルはあなたを罰するか、あるいはデータベースからあなたのサイトを落とすかもしれません。明らかに、すばらしいバランスが打たれなければなりません。ページ上の要素のそのバランスは科学と同じくらい芸術です。

これらの基準に従ってページのスコアが高ければ高いほど、検索結果でランクが高くなります。最高ランクのページは、Google検索の最初のページに表示されます。ほとんどのGoogleユーザーはその最初のページを通過することは決してないので、これらの上位ページには、過度のインターネットトラフィックが発生します。

これは、Googleで検索を実行すると、その時点でインターネット全体を検索しようとしていないため、すばやく応答できることを意味します。高度に整理された優先順位の高いデータベースを調べています。しかし、非常に高速な検索を作成するよりもさらに重要なことは、Googleにはインターネット上にあるものに関するデータの膨大なリポジトリがあり、さらに重要なのは、誰が何をいつ、何の目的に使用しているかということです。

Googleは何を知っていますか?

実際、Googleは多くのことを「知って」います。 Googleは検索を追跡し、さらにIPアドレスやGoogleログインに基づいて特定の検索に関するファイルを保存します。それは彼らにあなたの心への小さな窓を与え、あなたがどのような興味を示し、あなたを心配させ、あなたを興奮させ、そしてあなたを怖がらせます。これだけでも強力なマーケティング情報です。

あなたがそのデータベースを利用することができれば、あなたは個人についての詳細なプロフィール - 彼らの興味、購買習慣、健康への関心、家族の問題など - を構成することができるでしょう。会社が成功しているか失敗しているか、合併または買収を検討しているかどうか、およびどの製品ラインに拡大しているのかを示唆する兆候を見出すことができます。選挙、経済学、医療、そして社会的、財政的、そして政治的に重要な価値を持つその他の分野の過去の傾向を追跡することができます。

さらに、あなたが、知らないうちに知らないうちに、他のGoogleサービスを利用するのであれば、あなたはさらに多くの情報を提供しています。彼らはGmailをスキャンし、あなたの検索からあなたの通信から、そしてあなたの友人や共同編集者が誰であるかと同じ情報を得ます。あなたがGoogleの文書を通して文書を共有するならば、彼らはあなたが働いている人、そしてどんなプロジェクトについて知っています。 Google Checkoutには、購買パターン、支出習慣、予算に関するデータが追加されています。

あなたがそうしていることに気付いていなくてもあなたがGoogleに送信するという情報もあります。 Googleは、他のインターネットサービスと同様に、あなたのIPアドレスとおそらくあなたのMACアドレスを収集します。あなたのIPアドレスは、あなたが地理的に世界のどこにいるのかをおおまかに伝えます、そしてあなたのMACアドレスはあなたのマシンに固有の署名です。これにより、常に同じマシンを使用しているかどうか、使用しているマシンの数などを追跡できます。だから、グーグルはあなたが何を探しているのか、そして誰と通信しているのかを知っているだけでなく、あなたがどこにいるのか、そしてあなたがどのマシンを使っているのかも知っている。

もちろん、少し後退して、ほとんどすべてのインターネットサイトがこの情報の一部または全部にアクセスできることを認めましょう。たとえば、IPアドレスはハッカーやサービス拒否攻撃から守るために定期的に収集されます。誰かのサイトを訪れる場所、出入りする場所、出入りする場所に関する情報はすべて、最小の個人用サイトでも入手可能な標準のウェブ統計情報です。

グーグルが異なるのは、その膨大なサイズと多様なサービスであり、それによってより多くの人々からより多様な情報を収集することが可能になる。

あなたの隠し場所が何百ものデータから数十億のデータに渡るとき、あなたは他に誰もしていないという洞察を持っています。グーグルを本当に強力にしているのは、他の誰よりも多くの文脈で人々を観察できるということです。コンピュータに接続していなくても、Googleはあなたを監視しています。 Googleマップは、米国のほとんどの地域、およびその他の地域の高解像度の写真を提供しています。あなたの家はグーグルマップで見ることができるでしょう、そしてもし衛星が飛んだときにあなたがたまたま庭に散水していたなら、あなたはまたあなたの最新のショートパンツのペアであなた自身を見ることができるかもしれません!

Googleにできること

Googleのデータベースにはかなり明白な用途がいくつかありますが、現時点ではAdWordsがおそらく最も人気があり目に見えるものです。

Googleで検索を実行するたびに、ページ上部の最初の数個のリストと右側のリストは「スポンサーリンク」で、自分のように検索を実行していると考える人が購入する有料広告です。彼らの商品やサービスに興味があるでしょう。この手法は他のWebページにも広がっています。これは、他のWebサイトのページに関連性の高い広告を配信していると思われる「Ads by Google」の説明です。

明らかに、この広告スペースを売ることはグーグルにとって素晴らしい収入源です。 2007年、AdWordsは160億ドルを超える収益をGoogleにもたらし、これまでのところGoogleの最大の収入源となっています。それとは対照的に、Googleのデータストアはほとんど盗用されていない金鉱です。

これまでのところ、私たちが見てきたGoogleの機能は主に現在の市場動向に対応することに焦点を当ててきました。新しいバージョンのX-Box、オンラインの電気技師の発見、Super Bowlの記念品などに興味を持つようになりました。Googleは、潜在的な顧客とのつながりを手助けする立場にあります。

しかし、十分な情報があれば、グーグルのような会社はただ単に現在に反応する以上のスピードでスピードを上げることができます。未来を見たり、未来を創造することもできます。あなたがこれが単なる妄想的な空想科学小説の夢想だと思う前に、問題にいくらかの考慮を与えてください。

簡単な例を見てみましょう。ランクの高いページで失敗した検索で、本当に有用な情報を検索者に提供していない検索に注意を向けるようにプログラムを設定したとします。これらの失敗を追跡するプログラムは、検索者が何を望んでいたかを記録し、それらの失敗した検索をカテゴリに入れます。

これらの集計を見てみると、GoogleがWYのThermopolisに自分でできるスーパーストアを見つけることに関係する失敗した検索が多数あることに気付いたとしたらどうでしょう。もう少し見て、私は多くの失敗したDIYスーパーストアロケーター検索がある場所のリストを持っています。このリストは、DIYストアをフランチャイズする企業にとっては非常に価値があります(名前を付けずに、あらゆる郊外にある大きなオレンジ色の倉庫を考えてみてください。彼らは知りたくありませんか?)

彼らはそこにDIYの店がなかったことを知っているだけでなく、特定の数の人々がそのような店を探していたことを知っているでしょう。家電製品、建築材料、ガスグリルなど、彼らはそこで購入したいものをいくつか考えているでしょう。これは痛みを伴わない市場調査で、Googleによって自動的に分類され分析されます。

同様に、この情報は、特定の商品の潜在的な購入者を特定し、児童ポルノに従事している犯罪者を追跡し、自宅や店舗に侵入している潜在的な泥棒を捕まえるためにも使用できます。それは開発者が新しい家や店のための場所を選ぶのを助け、あなたの地域の厳しい天気についてあなたに警告し、登録された有権者を見つけ、そして彼らの習慣や興味について学ぶ。解釈の誤りもあるかもしれません:小さな町からの癌についてのたくさんの検索は多くの癌患者を意味するかもしれません、しかしそれはまさにそこに医学校があることを意味するかもしれません。

ご覧のとおり、この情報の用途の一部を称賛したり、他の利用者を復号化したりすることがあります。しかし、それらはすべて可能であり、すべて同じ基本技術を使用しています。あなたが欲しいものはほとんど何でも見つけることができます、あなたはそれを探す方法を知っていなければなりません。

次回の記事では、個人として、そして起業家として、これがすべてあなたに意味することを見ていきます。移動:Googleデータマインとあなたのビジネス

* * * * *

著者について: Hamlet Batistaは、起業家や中小企業が自然な検索トラフィックの質を向上させると同時に、彼らが最も得意とすることに注力する、SEO自動化ソフトウェアのプロバイダーであるNEMedia S.Aの社長です。 Hamletのブログ、Hamlet Batista dot Comは、最先端のSEO調査、ならびに競合他社に対する重要な優位性を与えることができる戦略と戦術を探ります。

17コメント▼