Nucleus

新手のスパムに注意

2007年4月23日

サーバログを見ていて、おかしなことが起こっていることに気がついた。

 このブログのあるページへのアクセスで、リファラとして Google のサイトの検索結果ページが指定されているのであるが、ここで用いられている検索語が、当ブログとはまったく関係のない言葉なのである。仮に、ここで用いられている検索語を『そんな 検索語は 含まれていません』だとしよう。当ブログでは、『そんな 検索語は 含まれていません』という表現はまったく使っておらず、Google の検索でヒットするはずはない。

 もう一つおかしなことは、『そんな 検索語は 含まれていません』で Google で検索すると、Nucleus で構築されているいくつかのサイトがヒットすることである。

 『これはクラッキングか、それとも Nucleus で増殖するワームか?』と、一瞬ヒヤリとしたけれど、調べてみるとそうではなかった。

 結論から言うと、これは新手のスパムである。このスパム業者がやろうとしていることをかいつまんで説明すると次のようになる。このブログのトップページ、http://www.rad51.net/nucleus/ の検索エンジンでの順位を上げることが目的であるとして、どのようなことが出来るかを考えてみる。

1)まず、目的のページが Google でトップになるような検索語を探す。

 私のブログの場合、『目から鱗 SQLite』で検索すれば、トップになる。 Google で検索した場合、検索結果表示ページの URL の例として、

http://www.google.com/search?hl=ja&q=%E7%9B%AE%E3%81%8B%E3%82%89%E9%B1%97+SQLite">http://www.google.com/search?hl=ja&q=%E7%9B%AE%E3%81%8B%E3%82%89%E9%B1%97+SQLite

が挙げられる。

『そんな 検索語は 含まれていません』なら、

http://www.google.com/search?hl=ja&q=%E3%81%9D%E3%82%93%E3%81%AA+%E6%A4%9C%E7%B4%A2%E8%AA%9E%E3%81%AF+%E5%90%AB%E3%81%BE%E3%82%8C%E3%81%A6%E3%81%84%E3%81%BE%E3%81%9B%E3%82%93


2)上記の URL を、HTTP ヘッダの Referer: に持たせた状態で、手当たり次第にさまざまなブログにアクセスする。

 これだけである。ブログの中には、サーバ変数の HTTP_REFERER を読むことで、どんなページ(検索エンジンの検索結果など)から訪問してしてきたかを調査するものがある(NP_SearchedPhrase など)。検索エンジンでの検索結果上位のwebページへのリンクが記述されるような設定になっていると、スパムとなる。もしこの情報がサイドバーなどに表示されていると、ブログのいくつかページが『そんな 検索語は 含まれていません』の検索結果として Google に登録されてしまう。こうなると、 普通のネットサーファーが『そんな 検索語は 含まれていません』を検索語として検索した結果のページから訪問することになるので、スパム業者が何もしなくても、感染症のように増殖する。

 これを防ぐには、Google の検索結果に、確かに自分のブログが含まれているかを調査する(site:www.example.com を検索語に加える)か、記事の中に実際にその検索語が含まれているかを調査すればよいと思われる。

 他には、単に HTTP_REFERER へのリンクが表示されるような設定になっているブログだと、スパムロボットに巡回させるときに、ヘッダの Referer: に宣伝する URL を記述するだけでよい。このようなスパムを防ぐ方法は、思い当たらない。

コメント

コメントはありません

コメント送信