アキラのITメモ:さくらのサブドメインのインデックス数を調べる

IT関係、技術関係のメモです。

さくらのサブドメインのインデックス数を調べる

さくらのレンタルサーバを使っているのですが、さくらのレンタルサーバでは、特典でさくらが管理しているドメインの中から2つサブドメインを貰うことができます。せっかくなので取得してみようということで、どのドメインがいいのかなあと思いつつ見ていたのですが、どのドメインがどれくらい使われているのだろうとふと気になりました。それぞれのドメインがGoogleにどれくらいインデックスされているかみることで、ドメインの人気の参考にしようと思い、簡単なコードを書いて調べてみました。

コードは最後に付記しておきますがかなり汚いです。Google Web API?でしたっけ?を使えばAPIで取得できるようなのですが、なくなったという情報やブラウザで行う検索と結果が異なるという情報が頭の記憶の片隅にあったので、HTTPを使ってGoogleに直接聞きに行くことにしました。連続して聞きに行くのも悪いなあと思い、1秒おきに情報を取得しています。なお、結果はこのような感じになりました。

URLnumber of indexURLnumber of index
uh-oh.jp11700jeez.jp34900
websozai.jp162002-d.jp41300
netgamers.jp106000tank.jp126000
razor.jp17000rulez.jp99500
matrix.jp99900spawn.jp9220
dojin.com25500sakuratan.com22000
halfmoon.jp273000ivory.ne.jp37300
opal.ne.jp39600topaz.ne.jp17900
mints.ne.jp52000sumomo.ne.jp36700
mokuren.ne.jp0mail-box.ne.jp1090
sakuraweb.com79100jpn.org588000
x0.com226000squares.net144000
rgr.jp62900rdy.jp139000
skr.jp130000eek.jp195000
flop.jp106000whoa.jp21700
noob.jp61800achoo.jp52600
bona.jp64300chew.jp27400
crap.jp51800grats.jp19800
grrr.jp16200rash.jp48400
thyme.jp728amaretto.jp2350
mimoza.jp13100nyanta.jp9910
xii.jp145000deko8.jp37900
o0o0.jp3080undo.jp12600
saloon.jp52100rojo.jp2860
daynight.jp9900gokujou.biz2320
saikyou.biz3310fubuki.info1560
180r.com26200rossa.cc13600
kokage.cc9070nazo.cc26500
x0.to27100silk.to11100
rusk.to42400sakura.tv11200
from.tv57900kirara.st26700
total3649298

さて、これを参考にしつつ、どこで取るか決めるかな。どうせならあまり人がいないドメインの方が面白いかなあと。mokuren.ne.jpが0なのは、誰もいないのか、まだ新しいドメインなのか、スパム認定されたのか、どうなんでしょう???使いやすそうなjpn.orgは一番インデックス数が多いですね。

なお、以下はスクリプトです。GoogleのHTMLの表示の仕様が変わると使えなくなるという代物です。一応動いているし使い捨てスクリプトだしいいかなと。HTTP::Liteを使ってます。

#!/usr/bin/perl

use HTTP::Lite;

my $baseurl = 'http://www.google.co.jp/search?q=site:';
my @url = (
'uh-oh.jp','jeez.jp','websozai.jp','2-d.jp','netgamers.jp',
'tank.jp','razor.jp','rulez.jp','matrix.jp','spawn.jp',
'dojin.com','sakuratan.com','halfmoon.jp','ivory.ne.jp',
'opal.ne.jp','topaz.ne.jp','mints.ne.jp','sumomo.ne.jp',
'mokuren.ne.jp','mail-box.ne.jp','sakuraweb.com',
'jpn.org','x0.com','squares.net','rgr.jp','rdy.jp',
'skr.jp','eek.jp','flop.jp','whoa.jp','noob.jp','achoo.jp',
'bona.jp','chew.jp','crap.jp','grats.jp','grrr.jp',
'rash.jp','thyme.jp','amaretto.jp','mimoza.jp','nyanta.jp',
'xii.jp','deko8.jp','o0o0.jp','undo.jp','saloon.jp','rojo.jp',
'daynight.jp','gokujou.biz','saikyou.biz','fubuki.info','180r.com',
'rossa.cc','kokage.cc','nazo.cc','x0.to','silk.to','rusk.to',
'sakura.tv','from.tv',
'kirara.st');

print "<table><tr><th>URL</th><th>number of index</th></tr>\n";
my $total = 0;
for ($i=0;$i<@url;$i++) {
 my $http = new HTTP::Lite;
 my $req = $http->request("$baseurl$url[$i]");
 if ($req eq "200") {
  my $body = $http->body();
  if ($body =~ /<b>$url[$i]<\/b>(.*?)<b>([0-9,]+)<\/b>/m) {
   $num = $2;
   $num =~ s/,//g;
   $total += $num;
  }
  else {
   $num = 0;
  }
  print "<tr><td>@url[$i]</td><td>$num</td></tr>\n";
  sleep(1);
 }
}
print "<tr><th>total</th><td>$total</td></tr></table>\n";

カテゴリ: コネタ 投稿日: 2007年02月10日 03:43
Trackback URL: http://akira-site.net/cgi-bin/mt/mt-tb.cgi/459

コメント

コメントを投稿





カテゴリ「コネタ」内の記事

サイト内検索

カテゴリ

最近のエントリ

関連商品

アバウト

Atom RSS
Powered by MT3.33-ja
合計:total
今日:today 昨日:yesterday