English

Tkensaku Web Robot 情報 (サーバ管理者の方へ)

Tkensaku って何

Tkensaku は、 検索エンジン のインデックスを作成するために 自動的にWWWを探索する ウェブロボットです。

Tkensaku の特徴

世の中には多くのウェブロボットがあります。 Tkensaku の特徴は以下のとおりです。

幅優先探索

Tkensaku は幅優先の探索を行います。 そのため、もしあなたのサーバにたくさんの内部リンク (同一サーバ上にあるページへのリンク) があった場合でも、ロボットのアクセスが一時に集中するような ことはありません。

テキストのみ

ウェブロボットの中には、サーバ上のすべてのコンテンツ を収集しようとするロボットもあります。 しかし、Tkensakuは テキストしか収集しません。 もしあなたのサーバに画像や音楽などたくさんのコンテンツ が保存されていても Tkensaku のアクセスにより サーバに負担がかかることはありません。

Tkensaku にページを収集されないようにするには

Tkensaku があなたのサーバに害になることは ないと信じておりますが、 Tkensaku がサーバを訪れないようにすることも可能です。 以下のような方法があります。

robots.txt

ウェブサーバのルートにrobots.txt というファイル を置くことによりロボットの動きを制御できます。
たとえば、以下のように記述すればサーバのすべての コンテンツが Tkensaku により収集されないようになります。
User-agent: Tkensaku
Disallow: /
詳しく http://www.robotstxt.org/wc/norobots-rfc.html を参照してください。

Meta robot tag

robot Meta tag もコンテンツを保護する方法のひとつです。 次のようなタグをページのヘッダ内に記述することにより、
<META NAME="robots" CONTENT="noindex,nofollow">
Tkensaku や他の ガイドラインを守るロボット はインデックス作成やリンクの追跡を行いません。

使用言語の明示

Tkensaku は日本語のウェブページを収集しています。 そのため、あるページが明らかに日本語以外だと わかる情報があれば Tkensaku はそのページを除外します。 たとえば、ヨーロッパ言語を使うページで、 以下のように記述されていれば、 Tkensaku はインデックス作成もリンク追跡も行いません。
<META HTTP-EQUIV="Content-Type" content="text/html; charset=ISO-8859-1">

連絡先

info@tkensaku.com
Tkensaku

TKENSAKU top へ