<?xml version="1.0" encoding="Shift_JIS"?>

<!DOCTYPE document SYSTEM "./dtd/document-v10.dtd">

<document>
  <header>
    <title>Webalizer</title>
    <authors>
      <person name="Vincent Massol" email="vmassol@apache.org"/>
    </authors>
    <translators><person name="漆島賢二"/></translators>
  </header>

  <body>

    <s1 title="Webalizer">

      <p>
        Webalizer is an httpd logfile analysis tool, which the Cactus web site
        uses to track website traffic.
      </p>
      <p>
	Webalizer は
	Cactus ウェブサイトでサイトトラフィックを追うのに使っている
	HTTPD ログファイル解析ツールです。
      </p>

      <s2 title="Webalizer の集計項目の定義/Webalizer Definitions">

        <p>
          From the
          <link href="ftp://ftp.mrunix.net/pub/webalizer/README/">Webalizer
          Readme</link> :
        </p>
        <p>
          <link href="ftp://ftp.mrunix.net/pub/webalizer/README/">Webalizer
          README</link> より:
        </p>

        <p>
          <strong>Hits</strong> : Any request made to the server which is
          logged, is considered a 'hit'. The requests can be for anything...
          html pages, graphic images, audio files, CGI scripts, etc... Each
          valid line in the server log is counted as a hit. This number
          represents the total number of requests that were made to the server
          during the specified report period.
        </p>
        <p>
          <strong>Hits</strong> : 
	  サーバーに対し行われたログされるどんなリクエストでもヒット('hit')と見なされます。
	  HTML ページ、画像、音声ファイル、CGI スクリプト等、リクエストは解析されます。
	  サーバーログの個々の有効な行は、hit として計上されます。
	  この数は、指定されたレポート期間の間でサーバーがリクエストされた総数を表しています。
        </p>

        <p>
          <strong>Files</strong> : Some requests made to the server, require
          that the server then send something back to the requesting client,
          such as a html page or graphic image. When this happens, it is
          considered a 'file' and the files total is incremented. The
          relationship between 'hits' and 'files' can be thought of as
          'incoming requests' and 'outgoing responses'.
        </p>
        <p>
          <strong>Files</strong> : 
	  HTML ページや画像などサーバーに対してリクエスト要求があった時、
	  リクエストしたクライアントに何かが送信されます。
	  これが起きたときが 'file' と見なされ、'file' の総数のカウントが増えます。
	  'hits' と 'files' の関係は、
	  'リクエスト入力' と 'レスポンス出力' と考えることもできます。	  
        </p>

        <p>
          <strong>Pages</strong> : Pages are, well, pages! Generally, any HTML
          document, or anything that generates an HTML document, would be
          considered a page. This does not include the other stuff that goes
          into a document, such as graphic images, audio clips, etc... This
          number represents the number of 'pages' requested only, and does not
          include the other 'stuff' that is in the page. What actually
          constitutes a 'page' can vary from server to server. The default
          action is to treat anything with the extension '.htm', '.html' or
          '.cgi' as a page. A lot of sites will probably define other
          extensions, such as '.phtml', '.php3' and '.pl' as pages as well.
          Some people consider this number as the number of 'pure' hits... I'm
          not sure if I totally agree with that viewpoint. Some other programs
          (and people :) refer to this as 'Pageviews'.
        </p>
        <p>
          <strong>Pages</strong> : 
	  Pages とは正しくページです。
	  一般に、どんな HTML ドキュメント、あるいは HTML ドキュメントを生成するものでも page と見なされます。
	  ドキュメントに含まれる画像や音声などの他のものは、
	  これには含まれません。
	  この数は 'page' がリクエストされた数のみを表し、
	  ページ中の他のものは含みません。
	  'page' が何によって構成されるかは、サーバーによって様々です。
	  デフォルトの動作では、拡張子が '.htm' 、'.html'、'.cgi'であるものは全て page として扱います。
	  多くのサイトでは恐らく
	  '.phtml'、'.php3'、'.pl' といった他の拡張子もページとして扱うよう定義しているでしょう。
	  ある人は、この数を '純粋な' ヒット数だと考えています。
	  この見解に完全に賛成できるかはわかりません。
          他のプログラム(や人)では、これをページビューとして参照しているものもあります。
        </p>

        <p>
          <strong>Sites</strong> : Each request made to the server comes from
          a unique 'site', which can be referenced by a name or ultimately, an
          IP address. The 'sites' number shows how many unique IP addresses
          made requests to the server during the reporting time period. This
          DOES NOT mean the number of unique individual users (real people)
          that visited, which is impossible to determine using just logs and
          the HTTP protocol (however, this number might be about as close as
          you will get).
        </p>
        <p>
          <strong>Sites</strong> : 
          ホスト名や究極的には IP アドレスから参照される、
	  特定の'サイト' からサーバーへの個々のリクエストがなされます。
	  'sites' 数は、
	  指定されたレポート期間の間、
	  幾つの IP アドレスがサーバーへリクエストしたかを表す数です。
          この数は個々のユーザ(実際の人)の数では<strong>ありません</strong>。
	  ユーザ数はログやHTTPプロトコルだけでは判定することができません。
	  (<suspect>しかしながら、この数はあなたが得る数に殆ど近いです。</suspect>)
        </p>

        <p>
          <strong>Visits</strong> : Whenever a request is made to the server
          from a given IP address (site), the amount of time since a previous
          request by the address is calculated (if any). If the time
          difference is greater than a pre-configured 'visit timeout' value (or
          has never made a request before), it is considered a 'new visit',
          and this total is incremented (both for the site, and the IP
          address). The default timeout value is 30 minutes (can be changed),
          so if a user visits your site at 1:00 in the afternoon, and then
          returns at 3:00, two visits would be registered. Note: in the 'Top
          Sites' table, the visits total should be discounted on 'Grouped'
          records, and thought of as the "Minimum number of visits" that came
          from that grouping instead. Note: Visits only occur on PageType
          requests, that is, for any request whose URL is one of the 'page'
          types defined with the PageType option. Due to the limitation of the
          HTTP protocol, log rotations and other factors, this number should
          not be taken as absolutely accurate, rather, it should be considered
          a pretty close "guess".
        </p>
        <p>
          <strong>Visits</strong> : 
	  与えられた IP アドレス(サイト) からサーバーへリクエストがあったら何時でも、
	  そのアドレスの直前のリクエストからの時間の累計が(もしあれば)計算されます。
	  もし、あらかじめ設定された 'visit timeout' の値よりも時間が長い場合、(あるいは、前には何もリクエストが無い場合)、
	  これは 'new visit(新規訪問)' であると見なされ、
	  この総数が増えます。(サイトおよびIPアドレスの双方に対して)
	  デフォルトのタイムアウト値は30分です。(変更可能です)
	  ですから、あるユーザが午後1時にサイトを訪問し、
	  午後 3 時に帰ってきた場合、2 つの訪問が登録されます。
	  <suspect>
	  メモ: 'Top Sites' の表において、
	  訪問者総数は 'Groupd' record よりも少なく、
          代わりの groupping から発生する "最低訪問者数" と考えるべきです。
	  </suspect>
	  メモ: Visit は PageType リクエストが起きた場合にのみ計上されます。
	  即ち、URL が PageType オプションで定義された 'page' タイプであるような全てのリクエストに対して計上されるのです。
	  HTTPプロトコルやログの整理、他の要因により、
	  この値は絶対的に正確だとはいえないでしょう。
	  むしろ、かなり近い "予測値" であると言えます。
        </p>

        <p>
          <strong>KBytes</strong> : The KBytes (kilobytes) value shows the
          amount of data, in KB, that was sent out by the server during the
          specified reporting period. This value is generated directly from the
          log file, so it is up to the web server to produce accurate numbers
          in the logs (some web servers do stupid things when it comes to
          reporting the number of bytes). In general, this should be a fairly
          accurate representation of the amount of outgoing traffic the server
          had, regardless of the web servers reporting quirks.
        </p>
        <p>
          <strong>KBytes</strong> : 
	  KBytes (キロバイト)の値は、
	  指定された期間にサーバーから送信されたデータの総量を示します。
	  この値はログファイルから直接生成されます。
	  そこで、ログ中に正しい数を生成するかは、ウェブサーバーに依存します。
	  (ウェブサーバーによっては、バイト数をレポートする時、おかしな事をするものもあります)
	  一般的に、
	  <suspect>サーバーが気まぐれにレポートしているにも関わらず、</suspect>
	  この値は、
	  サーバが行った出力トラフィックの総量をかなり正確に表現しています。
        </p>

        <p>
          Note: A kilobyte is 1024 bytes, not 1000 :)
        </p>
        <p>
          メモ: 1 キロバイトは 1024 バイトです。1000 ではありません。:)
        </p>

      </s2>

    </s1>

  </body>
</document>
