めも帖

「めも帖」代わりにダラダラと書いていったり、めもしたりしているだけです。

GoogleSiteMapを作る

ふと思い立ちGoogle SiteMapを用意してみることにしました。
参考サイトを見ながら、無事に設定できました。
実行してみて気づいたのは、

  • 登録できるのは50000URLという制限があること(分割して登録することも可能)
  • アクセスログから優先(重要)度を割り出すらしく、負荷がかかります

ですね。あとは、どれぐらい効果があるのか?かな。

スクリプトを持ってくる

http://downloads.sourceforge.net/goog-sitemapgen/sitemap_gen-1.4.tar.gz?modtime=1133817645&big_mirror=0

解凍ディレクトリに移動して設定ファイルを用意する

cd sitemap_gen-1.4
cp example_config.xml config.xml

設定ファイル(1)

base_url="http://192.168.1.196/blogtest/"
store_into="/home/httpd/html/blogtest/sitemap.xml"

設定ファイル(2)

urlタグを自分のサイトに変更する

url="http://192.168.1.196/blogtest/"
store_into="/home/httpd/html/sitemap.xml.gz"

設定ファイル(3)

urllist タグ部分をコメントアウト。

設定ファイル(4)directory タグ情報の編集

accesslog タグ情報の編集

Apacheのログのパスをファイル名まで記述

sitemap タグ情報の編集

いらないのでコメントアウト

filter タグ情報の編集

とりあえず使わないので、コメントアウト

テストする

chmod 755 sitemap_gen.py
python sitemap_gen.py --config=config.xml --testing

Number of errors: 0となると成功。

実行する

python sitemap_gen.py --config=config.xml