<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
  <channel>
    <title>2007/01/22 on Yano&#39;s digital garage</title>
    <link>https://www.bravotouring.com/~yano/archives/2007/01/22/</link>
    <description>Recent content in 2007/01/22 on Yano&#39;s digital garage</description>
    <generator>Hugo</generator>
    <language>en-us</language>
    <lastBuildDate>Mon, 22 Jan 2007 21:52:58 +0900</lastBuildDate>
    <atom:link href="https://www.bravotouring.com/~yano/archives/2007/01/22/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>検索市場はどこへ向かう</title>
      <link>https://www.bravotouring.com/~yano/diary/it/20070122baidu.htm</link>
      <pubDate>Mon, 22 Jan 2007 21:52:58 +0900</pubDate>
      <guid>https://www.bravotouring.com/~yano/diary/it/20070122baidu.htm</guid>
      <description>&lt;p&gt;昨夜オンエアされた&lt;a href=&#34;http://www.nhk.or.jp/special/onair/070121.html&#34; target=&#34;SubWindow&#34;&gt;&lt;span class=&#34;TvTitle&#34;&gt;『グーグル革命の衝撃　～あなたの人生を“検索”が変える～』&lt;/span&gt;&lt;/a&gt;。業界人的には特に目新しいモノもなくちょっと期待しすぎたかな。でも検索結果がビジネスに直結してお金になるという事を知らない多くの人には驚くべき事実の連続だったかもしれない。見逃した人は1/23(火)深夜の再放送をチェキ。&lt;/p&gt;&#xA;&lt;p&gt;例え&lt;a href=&#34;http://www.google.co.jp/&#34; target=&#34;SubWindow&#34;&gt;Google&lt;/a&gt;が良心的であったとしても「人の集まるところ」には多様な思惑が渦巻く事は避けられないわけで、&lt;a href=&#34;http://www.google.co.jp/&#34; target=&#34;SubWindow&#34;&gt;Google&lt;/a&gt;のみならず検索サイトを過信するのは考えものだ。&lt;/p&gt;&#xA;&lt;p&gt;さて、無節操なクローラー行動から&lt;a href=&#34;https://www.bravotouring.com/~yano/diary/it/20070113baidu.htm&#34;&gt;13日&lt;/a&gt;以降&lt;a href=&#34;http://www.baidu.com/&#34; target=&#34;SubWindow&#34;&gt;百度&lt;/a&gt;の&lt;span class=&#34;Warning&#34;&gt;アクセス規制&lt;/span&gt;を開始したものの、&lt;span class=&#34;Software&#34;&gt;apache&lt;/span&gt;で弾くと言うことはGETリクエスト自体は飛んで来てしまうわけで、邪魔なトラヒックでリソースを浪費されている事には変わりない。&lt;/p&gt;&#xA;&lt;p&gt;というわけでブロードバンドルーターでフィルタリングしようと思ったが、それでもルーターやADSLの帯域を浪費されてしまう事は避けられない事になる。まがりなりにもサービスを提供している者としてはこれもまた望ましい解決策とは言えないわけであり、とどのつまり&lt;span class=&#34;Software&#34;&gt;Baiduspider&lt;/span&gt;が来ないようにして貰うしかないわけである。&lt;/p&gt;&#xA;&lt;p&gt;断りもなく勝手に検索するロボットに対して、サイトが意識的に規制を行う為の仕組みとして&lt;a href=&#34;http://www.robotstxt.org/wc/exclusion.html&#34; target=&#34;SubWindow&#34;&gt;&lt;span class=&#34;Software&#34;&gt;Robots Exclusion&lt;/span&gt;&lt;/a&gt;という決め事がある。簡単に言うと&lt;span class=&#34;Path&#34;&gt;robots.txt&lt;/span&gt;に&lt;blockquote class=&#34;Log&#34;&gt;User-agent: Baiduspider&lt;br/&gt;Disallow: /&lt;/blockquote&gt;と書いて、サーバーのrootに置けば「Baiduspiderは不許可」というお達しになるというわけだ。しかし&lt;a href=&#34;http://www.robotstxt.org/wc/exclusion.html&#34; target=&#34;SubWindow&#34;&gt;&lt;span class=&#34;Software&#34;&gt;Robots Exclusion&lt;/span&gt;&lt;/a&gt;は「業界ルール」や「紳士協定」の類であり実装状況に関してはバラツキがあり、残念ながら&lt;span class=&#34;Path&#34;&gt;robots.txt&lt;/span&gt;が期待通りに効かなかった。&lt;/p&gt;&#xA;&lt;p&gt;という経緯から、やむなく&lt;span class=&#34;Software&#34;&gt;apache&lt;/span&gt;で弾く事を余儀なくされたわけだが、&lt;a href=&#34;http://www.baidu.com/search/spider_jp.html&#34; target=&#34;SubWindow&#34;&gt;Baiduspider Q&amp;A&lt;/a&gt;をよく読んだら、&#xA;&lt;dl class=&#34;List&#34;&gt;&#xA;&lt;dt&gt;百度スパイダーがrobots.txtでの名前は何ですか。&lt;/dt&gt;&#xA;&lt;dd&gt;全部アルファベット小文字の “baiduspider” です。&lt;/dd&gt;&#xA;&lt;/dl&gt;と書いてある事に気付いた。&lt;/p&gt;&#xA;&lt;p&gt;&lt;span class=&#34;Strong&#34;&gt;なんで&lt;span class=&#34;Software&#34;&gt;User-Agent&lt;/span&gt;の&#34;Baiduspider+&#34;と違うんだよ！&lt;/span&gt;と怒ったところで空しいばかりなので、潔く&lt;span class=&#34;Path&#34;&gt;robots.txt&lt;/span&gt;を&#xA;&lt;blockquote class=&#34;Log&#34;&gt;&#xA;User-agent: baiduspider&lt;br/&gt;Disallow: /&lt;br/&gt;&lt;br/&gt;&#xA;User-agent: yodaobot&lt;br/&gt;Disallow: /&lt;br/&gt;&lt;br/&gt;&#xA;User-agent: YodaoBot&lt;br/&gt;Disallow: /&#xA;&lt;/blockquote&gt;と書き直した。&lt;/p&gt;&#xA;&lt;p&gt;ちなみに&lt;span class=&#34;Software&#34;&gt;YodaoBot&lt;/span&gt;というのは&lt;a href=&#34;http://www.yodao.com/&#34; target=&#34;SubWindow&#34;&gt;有道&lt;/a&gt;という検索サイトのロボット。&lt;a href=&#34;http://www.baidu.com/&#34; target=&#34;SubWindow&#34;&gt;百度&lt;/a&gt;の後を追うようにアクセス急増中。ドメインこそ.comだがこいつも中国なので、まとめて規制することにした。小文字でも書いているのは念の為。&lt;/p&gt;&#xA;&lt;p&gt;取り敢えず引き続き&lt;span class=&#34;Software&#34;&gt;apache&lt;/span&gt;で403を返し続けているので毎日2000～4000あったリクエスト数は10程度にまで減ってきているのだが、&lt;span class=&#34;Software&#34;&gt;YodaoBot&lt;/span&gt;は2～3日で速攻効いたのに&lt;span class=&#34;Software&#34;&gt;Baiduspider&lt;/span&gt;は一週間経っても&lt;span class=&#34;Path&#34;&gt;robots.txt&lt;/span&gt;を読みに来ないのはどういう事よ！？&lt;/p&gt;&#xA;&lt;p&gt;折しも昨日は&lt;a href=&#34;http://www.tbs.co.jp/houtoku/main.html&#34; target=&#34;SubWindow&#34;&gt;&lt;span class=&#34;TvTitle&#34;&gt;『報道特集』&lt;/span&gt;&lt;/a&gt;でも「中国人の公衆マナー」を取り上げていたが、この勢いだとオンラインでも注目を集めるのは時間の問題だろうなぁ。&lt;/p&gt;&#xA;&lt;p class=&#34;Reference&#34;&gt;【参照】&#xA;&#x9;&lt;br/&gt;●百度(Baidu) &lt;a href=&#34;http://www.baidu.com/&#34; target=&#34;SubWindow&#34;&gt;http://www.baidu.com/&lt;/a&gt;&#xA;&lt;br/&gt;┗&lt;a href=&#34;http://www.baidu.com/search/spider_jp.html&#34; target=&#34;SubWindow&#34;&gt;BaiduspiderQ&amp;A&lt;/a&gt;&#xA;&lt;br/&gt;●有道(yodao) &lt;a href=&#34;http://www.yodao.com/&#34; target=&#34;SubWindow&#34;&gt;http://www.yodao.com/&lt;/a&gt;&#xA;&lt;br/&gt;●ITmedia &lt;a href=&#34;http://www.itmedia.co.jp/&#34; target=&#34;SubWindow&#34;&gt;http://www.itmedia.co.jp/&lt;/a&gt;&#xA;&lt;br/&gt;┣&lt;a href=&#34;http://www.itmedia.co.jp/news/articles/0406/16/news007.html&#34; target=&#34;SubWindow&#34;&gt;Google、中国の検索大手Baiduに出資&lt;/a&gt; 2004年6月16日&#xA;&#x9;&lt;br/&gt;┣&lt;a href=&#34;http://www.itmedia.co.jp/news/articles/0606/23/news030.html&#34; target=&#34;SubWindow&#34;&gt;中国の検索市場、Googleはシェア3位&lt;/a&gt; 2006年6月23日&#xA;&#x9;&lt;br/&gt;┣&lt;a href=&#34;http://plusd.itmedia.co.jp/pcuser/articles/0609/25/news023.html&#34; target=&#34;SubWindow&#34;&gt;検索サイト「百度」がえらいことになっている&lt;/a&gt; 2006年9月25日&#xA;&#x9;&lt;br/&gt;┣&lt;a href=&#34;http://www.itmedia.co.jp/news/articles/0612/04/news065.html&#34; target=&#34;SubWindow&#34;&gt;中国の検索エンジンBaidu、日本進出へ&lt;/a&gt; 2006年12月4日&#xA;&#x9;&lt;br/&gt;┗&lt;a href=&#34;http://www.itmedia.co.jp/news/articles/0612/15/news074.html&#34; target=&#34;SubWindow&#34;&gt;MS、中国でBaiduと戦略的提携&lt;/a&gt; 2006年12月15日&#xA;&#x9;&lt;br/&gt;●NHKスペシャル &lt;a href=&#34;http://www.nhk.or.jp/special/&#34; target=&#34;SubWindow&#34;&gt;http://www.nhk.or.jp/special/&lt;/a&gt;&#xA;&lt;br/&gt;┗&lt;a href=&#34;http://www.nhk.or.jp/special/onair/070121.html&#34; target=&#34;SubWindow&#34;&gt;グーグル革命の衝撃　～あなたの人生を“検索”が変える～&lt;/a&gt; 2007年1月21日&#xA; ■再放送■ 1/23(火)深夜 0時～0時49分&#xA;&lt;/p&gt;</description>
    </item>
  </channel>
</rss>
