English
Tkensaku Web Robot 情報 (サーバ管理者の方へ)
Tkensaku って何
Tkensaku は、
検索エンジン
のインデックスを作成するために
自動的にWWWを探索する
ウェブロボットです。
Tkensaku の特徴
世の中には多くのウェブロボットがあります。
Tkensaku の特徴は以下のとおりです。
幅優先探索
Tkensaku は幅優先の探索を行います。
そのため、もしあなたのサーバにたくさんの内部リンク
(同一サーバ上にあるページへのリンク)
があった場合でも、ロボットのアクセスが一時に集中するような
ことはありません。
テキストのみ
ウェブロボットの中には、サーバ上のすべてのコンテンツ
を収集しようとするロボットもあります。
しかし、Tkensakuは テキストしか収集しません。
もしあなたのサーバに画像や音楽などたくさんのコンテンツ
が保存されていても Tkensaku のアクセスにより
サーバに負担がかかることはありません。
Tkensaku にページを収集されないようにするには
Tkensaku があなたのサーバに害になることは
ないと信じておりますが、
Tkensaku がサーバを訪れないようにすることも可能です。
以下のような方法があります。
robots.txt
ウェブサーバのルートにrobots.txt というファイル
を置くことによりロボットの動きを制御できます。
たとえば、以下のように記述すればサーバのすべての
コンテンツが Tkensaku により収集されないようになります。
User-agent: Tkensaku
Disallow: /
詳しく
http://www.robotstxt.org/wc/norobots-rfc.html
を参照してください。
Meta robot tag
robot Meta tag もコンテンツを保護する方法のひとつです。
次のようなタグをページのヘッダ内に記述することにより、
<META NAME="robots" CONTENT="noindex,nofollow">
Tkensaku や他の
ガイドラインを守るロボット
はインデックス作成やリンクの追跡を行いません。
使用言語の明示
Tkensaku は日本語のウェブページを収集しています。
そのため、あるページが明らかに日本語以外だと
わかる情報があれば
Tkensaku はそのページを除外します。
たとえば、ヨーロッパ言語を使うページで、
以下のように記述されていれば、
Tkensaku はインデックス作成もリンク追跡も行いません。
<META HTTP-EQUIV="Content-Type" content="text/html; charset=ISO-8859-1">
連絡先
info@tkensaku.com
TKENSAKU top へ