SMの専門サイト
言語切り替え

Googlebotの苦手なタグや同一とみなすタグ

SM藍/全てのSM記事/SMサイトの運営に欠かせないSEO対策

Googlebotはいわゆるクローラーと呼ばれている自動でサイトを巡回し、その情報をデータベースに蓄積する役割をしている。

Googlebotの好み

Googlebotにも好みが存在し、好みのHTMLバリデーションは最後まで読むが、好みではないHTMLは最後まで読み込まない。最後まで読み込まないのはWEBサイト運営者にとって損な感じがするが、HTMLタグの話なのでさほど問題にはならない。記事やページの質の評価とHTMLタグにはなんら関係がないためだ。

記事の品質評価はHTMLだけではなく、PDFファイルの記事内容も読み込む、但し、PDFファイルを画像連結で作製した記事内容まではクロールされない。

クローラーが主に不得手とされているのは、フレーム関係のタグになる。たとえば、<frame>や<iframe>などが代表的な不得手タグになる。フレームは中身を読まない事もあり得ると公式では公言されている。

Googlebotが同一とみなすタグ:

<strong>と<b>はどちらも文字を太字にするタグ要素となるが、他には<small>や<big>についてもスタイルシートで設定されたサイズと照合するため、CSSでもタグでもどちらでもよいと発言している。

但し、<strong>は1ページに多くても3つまでが妥当とされており、あまり多いとそのページのテーマが拡散していると判断され、評価があがらない可能性もあり、乱用すればペナルティにもなりかねない。

<h1>は1ページに1つと言われているが、公式ではいくつ使っても問題はないとされている、しかし、実際にSEO対策した場合にはやはり1ページにテーマは1つ、h1も1つが一般的である。h要素はh1~h6までを重要順に判断されるが、h1以外はさほど差はないと考えてよいだろう。

ペナルティとなるのは主に下記の様なタグのつかい方。

ペナルティとされるタグ

・CSSで文字を隠している(文字と背景が同じ/サイズ指定を0pxとして表には見えない)

・CSSでdisplay:noneを使用するのも上記同様に表には見えないのでペナルティになる事がある。

・1ドットの画像

Googleはレンダリングという名称の仕組みを使用し、WEBページがどのように表示されているかを検証する、その際に内部に仕込まれた記事やキーワードが表示していないと判断すればその照合をおこなう。文字があって<!--あいうえお-->のようにすれば問題はないが、たとえば<strong style="font-size:0px;">あいうえお</strong>とした場合、ユーザーにはその文字が見えない、それと同様にレンダリング側も見えないと判断するので、ペナルティの対象となる。

ペナルティの実験

実際に実験をしてみた:

WEBページ内にペナルティとされる見えない文字を仕込んだページをクロールさせて、数日待つ。すると、圏外もしくは掲載順はほぼいちばん最後の方まで落ちた。そこで、今度はペナルティ要素をすべて排除し、ふたたびクロールさせた。

ページが元の順位の”範囲”に戻るまでには2~3週間以上かかる、”範囲”と書いたのは、今まで1ページ目のいちばん上にでていたのが、2~3ページ目に出るようになるということである。完全には元の順位に戻らないようになっている、それどころかそのページにアンカーを貼ったページまで落とされているのが現状だ。

他のテストも大体似たような順位になった。

他のテストとは1ページに200のリンクを貼ったページをペナルティ扱いされて、3リンクに修復後どの程度順位が戻るか?またはiframeだらけのページで本体には記事がない等をテストした所、200のリンクページは再クロールしても圏外のまま、iframeだけのページも圏外のままだった。そのテストページは2~3ケ月前に作成し、ペナルティを受けたのを確認した上でページを編集し、再クロールを試みたのだが未だに表示はされていない。もしくは、ペナルティを受けているサイトだけをあつめたリンク集のページを作成してテストしたのだが、このページについても完全に圏外のまま2~3ケ月が過ぎてしまった。

実験結果と結論

初めからペナルティの対象ページを作ってしまうとそのページは2度と掲載順位があがらない。

という事になる、正確にはいつの日か順位が戻るかもしれないが、その頃にはパンダアップデートが何度もされているので、おそらく順位浮上は不可能だろう。今までも何度もクロールをかけているが、一向に変化がないので、今の時点では確定事項だといえる。このテストはGoogleのユーザーログイン/未登録、OS、ブラウザは数種類でテストした結果なので、堅い情報だと判断できよう。

また、低品質サイトをいくつも適当に作り、リンクを貼っていくとリンク先も低品質サイトに近い扱いを受ける場合があるので要注意だ。
[SMサイトの運営に欠かせないSEO対策]

↑ページの先頭へ