Google検索エンジンの仕組みを分かりやすくご紹介

Google検索エンジンの検索結果の表示プロセス

SEOを行うには、Google検索エンジンの仕組みについて理解しておく必要があります。Google検索エンジンは、3つのプロセスを経て、検索結果を表示します。

検索結果を表示する3つのプロセス

  • WEBページをクロールして情報を取得する
  • 取得した情報をインデックスする
  • 検索ニーズに合致したページを返す

WEBページをクロールして情報を取得する

Googleは、「WEBクローラ」といわれるソフトウェア(通称:Googlebot)を使用して、インターネットのWEBページの情報を取得します。 Googlebotは基本的に既存のWEBページ内のリンクをたどって、新たなWEBページを発見していきます。

リンクをたどるGooglebotの動作

リンクをたどるGooglebotの動作

 

取得した情報をインデックスする

Googlebotが取得したデータは、検索エンジンが処理できる形式に変換されて、データベースに保存されます。このような処理を「インデックス(index)」と呼ばれています。 インデックスされた時には、ページの情報をそのまま保存するだけでなく、ページに含まれる公開からの経過時間やキーワードなど、さまざまな情報が一緒にデータとして保存されます。

検索ニーズに合致したページを返す

ユーザーが入力した検索キーワードに対して、Googlebotがインデックスし保存した情報の中から、ユーザーに有益で関連性の高いページを返します。 このような最適なページを抽出をすることができるのは、Googleが開発した検索アルゴリズムです。検索アルゴリズムは下記の3つの処理を含みます。

  1. 検索キーワードの分析
  2. 検索キーワードの照合
  3. ページのランキング

検索キーワードの分析

ユーザーが入力したキーワードの意図・意味を把握します。このような分析・処理には高度な自然言語技術が応用されて、同音異義語も精度が高く区分することができるのです。

検索キーワードの照合

検索キーワードの意図・意味を理解して、ユーザーの要求を満たすものをインデックスされたページから抽出します。検索キーワードが含まれたページをひっぱるイメージです。

ページのランキング

Googlebotによってインデックスされたページから、ユーザーの有益度に応じて順位をつけていきます(ランキング)。このランキングアルゴリズムに変数として与えられるものを「評価要素」といいます。評価要素は200以上あるといわれていますが、Googleは内容をほとんど非公開にしています。 この評価要素を推測することは、SEOにとって非常に重要です。

Google クローラの概要(ユーザー エージェント)

https://developers.google.com/search/docs/advanced/crawling/overview-google-crawlers?hl=ja