検索語ランキング
最近"アースソフト"とか"PT1"を検索して飛んでくる人が多いみたいだ。
![]() |
| googleで"アースソフト PT1"を検索 |
googleで"アースソフト PT1"を検索してみると、本家に続く6番目に表示されていたよ。
8月に発売情報を書いただけなのに、申し訳ない事だ。この夏、"名古屋港花火大会"絡みでショボイ携帯投稿ページに1000/日以上のアクセスが集中したのを思い出したよ。
騙された人、ご愁傷様です。
そういえば、Analogの検索語句レポートは大文字小文字を同一視できないのを思い出したので、その辺をごにょごにょする事に。
awkでAnalogの吐き出したHTMLページから「検索語句レポート」を抽出し、sedで"検索語"と"数"をピックアップ。perlのuc関数で"検索語"を大文字に揃えて連想配列で集計し、降順に出力するという処理がこれだ。
# 検索語ランキング抽出
$AWK '
/検索語<\/th>/ {on=1;next;}
/その他/ {on=0;}
{ if (on) {print;}
}' /usr/share/analog/index.html \
| $SED -e 's/<\/td>/\t/g' -e 's/.*"R">//g' -e 's/<\/td>.*//g' \
| $PERL -e '
my @n;
while () {
chomp;
@a=split(/\t/);
$word = uc $a[1];
$n{$word} += $a[0];
}
foreach (sort { $n{$b} <=> $n{$a} } keys %n){
print "$_\t$n{$_}\n";
}
' > $TMPFILE
# 上位10傑
head -10 $TMPFILE \
| $SED -e 's/^\([^\t]*\)\t\(.*\)$/\1 \(\2\)<\/li>/' > $RANKLIST
rm -f $TMPFILE headでTop10だけ取り出し、sedを使って行としてHTMLを吐き出す後処理を加え、Analog起動のcronシェルに追加。 キター!!
山本高広のブログが・・・来たー!!より でお馴染みの織田裕二。
…
のマネでお馴染み、ワタナベエンターテインメントの山本高広。
聞くところによると今は無き戸畑中学校出身との噂も…
残念ながら9歳違いなので具体的な繋がりは無さそうだが、取り敢えず贔屓にしといてやるか。(笑)
【参照】
●ワタナベエンターテインメント http://www.watanabepro.co.jp/
┗WE!マイページ: 山本高広
●山本高広のブログが・・・来たー!! http://blog.watanabepro.co.jp/yamamototakahiro/
┗地元 戸畑 2008年7月21日
●織田裕二 http://www.yuji-oda.com/
●Wikipedia http://ja.wikipedia.org/wiki/
┣戸畑区
┣織田裕二
┗山本高広

