Webalizer

Last update : July 6 2002
Doc for : v1.3

Cactusについて
  • Cactus とは
  • ニュース
  • 変更履歴
  • 特徴/開発状況
  • 目標
  • ロードマップ/ToDo
  • 協力者
  • 協力者募集
  • Cactus ユーザ
  • テスト済環境 ...
  • ライセンス


  • ダウンロード
  • ダウンロード


  • ドキュメント
  • Cactus の仕組み
  • さぁ始めよう
  • モック対コンテナ
  • Javadocs
  • └Javadocs
  • よくある質問


  • Howto ガイド
  • クラスパス Howto
  • 設定 Howto
  • アップグレードHowto
  • テストケース Howto
  • セキュリティHowto
  • Ant Howto
  • HttpUnit Howto
  • サンプル Howto
  • EJB Howto
  • IDE Howto
  • JUnitEE Howto


  • サポート
  • Bug DB
  • メーリングリスト


  • その他
  • 名前の由来
  • ロゴコンテスト
  • 参考文献
  • アクセス状況
  • └WebAlizer


  • 開発者向け
  • CVS
  • コード規約
  • ビルドの結果


  • Webalizer

    Webalizer is an httpd logfile analysis tool, which the Cactus web site uses to track website traffic.

    Webalizer は Cactus ウェブサイトでサイトトラフィックを追うのに使っている HTTPD ログファイル解析ツールです。

    Webalizer の集計項目の定義/Webalizer Definitions

    From the Webalizer Readme :

    Webalizer README より:

    Hits : Any request made to the server which is logged, is considered a 'hit'. The requests can be for anything... html pages, graphic images, audio files, CGI scripts, etc... Each valid line in the server log is counted as a hit. This number represents the total number of requests that were made to the server during the specified report period.

    Hits : サーバーに対し行われたログされるどんなリクエストでもヒット('hit')と見なされます。 HTML ページ、画像、音声ファイル、CGI スクリプト等、リクエストは解析されます。 サーバーログの個々の有効な行は、hit として計上されます。 この数は、指定されたレポート期間の間でサーバーがリクエストされた総数を表しています。

    Files : Some requests made to the server, require that the server then send something back to the requesting client, such as a html page or graphic image. When this happens, it is considered a 'file' and the files total is incremented. The relationship between 'hits' and 'files' can be thought of as 'incoming requests' and 'outgoing responses'.

    Files : HTML ページや画像などサーバーに対してリクエスト要求があった時、 リクエストしたクライアントに何かが送信されます。 これが起きたときが 'file' と見なされ、'file' の総数のカウントが増えます。 'hits' と 'files' の関係は、 'リクエスト入力' と 'レスポンス出力' と考えることもできます。

    Pages : Pages are, well, pages! Generally, any HTML document, or anything that generates an HTML document, would be considered a page. This does not include the other stuff that goes into a document, such as graphic images, audio clips, etc... This number represents the number of 'pages' requested only, and does not include the other 'stuff' that is in the page. What actually constitutes a 'page' can vary from server to server. The default action is to treat anything with the extension '.htm', '.html' or '.cgi' as a page. A lot of sites will probably define other extensions, such as '.phtml', '.php3' and '.pl' as pages as well. Some people consider this number as the number of 'pure' hits... I'm not sure if I totally agree with that viewpoint. Some other programs (and people :) refer to this as 'Pageviews'.

    Pages : Pages とは正しくページです。 一般に、どんな HTML ドキュメント、あるいは HTML ドキュメントを生成するものでも page と見なされます。 ドキュメントに含まれる画像や音声などの他のものは、 これには含まれません。 この数は 'page' がリクエストされた数のみを表し、 ページ中の他のものは含みません。 'page' が何によって構成されるかは、サーバーによって様々です。 デフォルトの動作では、拡張子が '.htm' 、'.html'、'.cgi'であるものは全て page として扱います。 多くのサイトでは恐らく '.phtml'、'.php3'、'.pl' といった他の拡張子もページとして扱うよう定義しているでしょう。 ある人は、この数を '純粋な' ヒット数だと考えています。 この見解に完全に賛成できるかはわかりません。 他のプログラム(や人)では、これをページビューとして参照しているものもあります。

    Sites : Each request made to the server comes from a unique 'site', which can be referenced by a name or ultimately, an IP address. The 'sites' number shows how many unique IP addresses made requests to the server during the reporting time period. This DOES NOT mean the number of unique individual users (real people) that visited, which is impossible to determine using just logs and the HTTP protocol (however, this number might be about as close as you will get).

    Sites : ホスト名や究極的には IP アドレスから参照される、 特定の'サイト' からサーバーへの個々のリクエストがなされます。 'sites' 数は、 指定されたレポート期間の間、 幾つの IP アドレスがサーバーへリクエストしたかを表す数です。 この数は個々のユーザ(実際の人)の数ではありません。 ユーザ数はログやHTTPプロトコルだけでは判定することができません。 (しかしながら、この数はあなたが得る数に殆ど近いです。)

    Visits : Whenever a request is made to the server from a given IP address (site), the amount of time since a previous request by the address is calculated (if any). If the time difference is greater than a pre-configured 'visit timeout' value (or has never made a request before), it is considered a 'new visit', and this total is incremented (both for the site, and the IP address). The default timeout value is 30 minutes (can be changed), so if a user visits your site at 1:00 in the afternoon, and then returns at 3:00, two visits would be registered. Note: in the 'Top Sites' table, the visits total should be discounted on 'Grouped' records, and thought of as the "Minimum number of visits" that came from that grouping instead. Note: Visits only occur on PageType requests, that is, for any request whose URL is one of the 'page' types defined with the PageType option. Due to the limitation of the HTTP protocol, log rotations and other factors, this number should not be taken as absolutely accurate, rather, it should be considered a pretty close "guess".

    Visits : 与えられた IP アドレス(サイト) からサーバーへリクエストがあったら何時でも、 そのアドレスの直前のリクエストからの時間の累計が(もしあれば)計算されます。 もし、あらかじめ設定された 'visit timeout' の値よりも時間が長い場合、(あるいは、前には何もリクエストが無い場合)、 これは 'new visit(新規訪問)' であると見なされ、 この総数が増えます。(サイトおよびIPアドレスの双方に対して) デフォルトのタイムアウト値は30分です。(変更可能です) ですから、あるユーザが午後1時にサイトを訪問し、 午後 3 時に帰ってきた場合、2 つの訪問が登録されます。 メモ: 'Top Sites' の表において、 訪問者総数は 'Groupd' record よりも少なく、 代わりの groupping から発生する "最低訪問者数" と考えるべきです。 メモ: Visit は PageType リクエストが起きた場合にのみ計上されます。 即ち、URL が PageType オプションで定義された 'page' タイプであるような全てのリクエストに対して計上されるのです。 HTTPプロトコルやログの整理、他の要因により、 この値は絶対的に正確だとはいえないでしょう。 むしろ、かなり近い "予測値" であると言えます。

    KBytes : The KBytes (kilobytes) value shows the amount of data, in KB, that was sent out by the server during the specified reporting period. This value is generated directly from the log file, so it is up to the web server to produce accurate numbers in the logs (some web servers do stupid things when it comes to reporting the number of bytes). In general, this should be a fairly accurate representation of the amount of outgoing traffic the server had, regardless of the web servers reporting quirks.

    KBytes : KBytes (キロバイト)の値は、 指定された期間にサーバーから送信されたデータの総量を示します。 この値はログファイルから直接生成されます。 そこで、ログ中に正しい数を生成するかは、ウェブサーバーに依存します。 (ウェブサーバーによっては、バイト数をレポートする時、おかしな事をするものもあります) 一般的に、 サーバーが気まぐれにレポートしているにも関わらず、 この値は、 サーバが行った出力トラフィックの総量をかなり正確に表現しています。

    Note: A kilobyte is 1024 bytes, not 1000 :)

    メモ: 1 キロバイトは 1024 バイトです。1000 ではありません。:)





    [訳注:これは 漆島賢二 が翻訳しました。日本語訳に対するコメントがあれば こちらに送ってください]
    Copyright © 2000-2002 The Apache Software Foundation. All Rights Reserved.