«前の日記(2004-08-18 (水)) 最新 次の日記(2004-08-22 (日))»  

まちゅダイアリー


2004-08-20 (金)

Estraier でサイト内検索

以前からこの日記の検索に Estraier を使っていたけど、 サイト全体(tDiary と BitChannel のコンテンツ)を検索対象にするようにした。

tDiaryのコンテンツは、squeezeプラグインを使って静的な HTML に変換している。 BitChannelのコンテンツは、添付の misc/tohtml.rb を改造して ファイルごとに静的 HTML を出力するようにした。

検索インデックスを生成するために、このようなシェルを毎晩 cron で動かしている。

#!/bin/sh

cd $HOME/var/bitchannel/misc
./tohtml2.rb -o $HOME/var/bitchannel/html

cd $HOME/www/search/
estindex register -relax -hsuf '*' index $HOME/var/tdiary/cache/html/
estindex register -relax -hsuf '*' index $HOME/var/bitchannel/html/
estindex relate -relax index
estindex purge -relax index
estindex optimize -relax index

今のところ、ちゃんと動いているみたい。

Tags: memo

アクセスログ

さくらのレンタルサーバには、標準でアクセスログ解析ツールがついてきているけど、試しに AWStats という解析ツールを入れてみた。 インストールにはCYBERAM Documentsのコンテンツが参考になった。

さくらのログは、最新の一日分のログが $HOME/log/access_log_YYYYMMDD というファイル名で残るようになっている。 一日経つと、 access_log_YYYYMMDD.gz というファイル名で圧縮されるようになるけど、圧縮される前にログ解析すれば問題なし。

また、検索語の日本語を表示させるために、 ログに解析前にconv_weblog_to_utf8.plというフィルタを通すようにしている。 設定ファイルの変更点は以下のとおり。

@@ -48,7 +48,7 @@
 # If there is several log files from load balancing servers :
 # Example: "/pathtotools/logresolvemerge.pl *.log |"
 #
-LogFile="/var/log/httpd/mylog.log"
+LogFile="conv_weblog_to_utf8.pl /home/machu/log/access_log_%YYYY-0%MM-0%DD-0 |"


 # Enter the log file type you want to analyze.
@@ -140,7 +140,7 @@
 # Example: "ftp.domain.com"
 # Example: "domain.com"
 #
-SiteDomain=""
+SiteDomain="www.machu.jp"


 # Enter here all other possible domain names, addresses or virtual host
@@ -198,7 +198,7 @@
 # Example: "/awstats"
 # Default: "/cgi-bin"   (means awstats.pl is in "/yourwwwroot/cgi-bin")
 #
-DirCgi="/cgi-bin"
+DirCgi="/admin/awstats"


 # Relative or absolute web URL of your awstats icon directory.
@@ -850,7 +850,7 @@
 #  First available language accepted by browser=auto
 # Default: "auto"
 #
-Lang="auto"
+Lang="jp"


 # Set the location of language files.

これで、下記のシェルを毎日実行して、最新のアクセスログを登録するようにしている。

#!/bin/sh

PATH=$PATH:$HOME/bin
cd $HOME/www/admin/awstats
./awstats.cgi -config=awstats.conf -update

アクセスログは朝の5時前に更新されているようなので、 このシェルも5時ごろに実行するようにしている。

Tags: memo
本日のツッコミ(全1件) [ツッコミを入れる]
とるち (2005-02-03 (木) 12:06)

こんにちは。レンタルサーバにawstatsを<br>導入することはできるのでしょうか?<br>いろいろなところを見ていますが<br>どうも自宅サーバに設置している人が多いようで。<br>お返事お待ちしております。