Web Connectivity Analysis Bibliography
- Link Popularity
- HITS
- PageRank
- Web Archeology
- Web Mining
- Content Similarity & Anchor Text
- Page Grouping
- Visualization
- [Spertus 1997]
- Ellen Spertus:
ParaSite: Mining Structural Information on the Web,
In Proceedings of the 6th International World Wide Web Conference,
1997.
http://www.scope.gmd.de/info/www6/technical/paper206/paper206.html
- Classical HypertextとWebの比較
- 4種類のハイパーリンク (upward, downward, outward, crosswise)
- heuristicの導入
- アプリケーション
- [Carriere & Kazman 1997]
- J. Carriere,
R. Kazman:
Webquery: Searching and Visualizing the Web Through Connectivity,
In Proceedings of the 6th International World Wide Web Conference,
pp. 701-711,
1997.
http://www.cgl.uwaterloo.ca/Projects/Vanish/webquery-1.html
- 検索結果をリンクしている/されている集合(neighbor set)を求める
- 各ノードの接続を計算し,ランキングする
- [PageRank]はこのrecursive variation (by Monika R. Henzinger)
- [Rankdex]
- Rankdex
http://rankdex.gari.com
- [LinkPopularity.com]
- The PC Edge, Inc.:
LinkPopularity.com.
http://www.linkpopularity.com/
- サーチエンジン(AltaVista, Infoseek, Hotbot)を使ったLink Popularityの計算
- [Sullivan-1]
- Danny Sullivan :
Measuring Link Popularity,
Search Engine Watch.
http://searchenginewatch.internet.com/webmasters/popularity.html
- [Sullivan-2]
- Danny Sullivan :
How Search Engines Rank Web Pages,
Search Engine Watch.
http://www.searchenginewatch.com/webmasters/rank.html
- [Sullivan-3]
- Danny Sullivan :
Search Engine Features Chart,
Search Engine Watch.
http://searchenginewatch.internet.com/webmasters/features.html
- [Grantastic Designs]
- Grantastic Designs:
Link popularity and search engines,
http://www.grantasticdesigns.com/linkpopularity.html
- [Boser 1998]
- Greg Boser:
Link Popularity,
I-search Discussion List No. 60,
1998.
http://www.audettemedia.com/i-search/archives/060.htm
- [Goo 1999]
- ポータルサイト"goo"の検索機能を大幅に強化,
1999.
http://www.goo.ne.jp/help/n_991005.html
- サイトの人気度 = Link Popularity? (+ α?)99
- [Kleinberg 1998]
- Jon M. Kleinberg:
Authoritative sources in a hyperlinked environment,
Proceedings of the 9th ACM-SIAM Symposium on Discrete Algorithms,
pp. 668 - 677,
1998.
http://simon.cs.cornell.edu/home/kleinber/auth.ps
- HITSの元論文
- Web Connectivity Analysis
- [Bharat & Henzinger 1998]
- Krishna Bharat,
Monika R. Henzinger:
Improved Algorithms for Topic Distillation in Hyperlinked Environments,
Proceedings of the 21st International ACM SIGIR Conference on
Research and Development in Information Retrieval,
1998.
ftp://ftp.digital.com/pub/DEC/SRC/publications/monika/sigir98.pdf
- [Kleinberg 1998] + simularity (Connectivity Analysis + Content Analysis)
- Topic Drift Problem
- Digital researchのWeb Archeology project
- [Dean & Henzinger 1999]
- Jeffrey Dean,
Monika R. Henzinger:
Finding Related Pages in the World Wide Web,
The 8th International World Wide Web Conference,
1999.
ftp://ftp.digital.com/pub/DEC/SRC/publications/monika/www8.ps
- Companion algorithm =
[Kleinberg 1998]
+ vicinity graph
- Cocitation algorithm…URL共起
- [Clever Project]
- CLEVER Searching
http://www.almaden.ibm.com/cs/k53/clever.html
- Clever Projectのホームページ
- IBM Almaden Research Center
- [Ohno et al. 1999]
- 大野潮満,
黄瀬浩一,
松本啓之亮:
参照重要度に基づくWWW検索,
SIGNL 135-1,
2000.
- [Brian 1999]
- Brian. D. Davison et. al.:
DiscoWeb: Applying Link Analysis to Web Search,
http://www.cs.rutgers.edu/~davison/pubs/www99.html
- [PageRank]
- Lawrence Page,
Sergey Brin,
Rajeev Motwani,
Terry Winograd:
The PageRank Citation Ranking: Bringing Order to the Web,
Work in progress.
http://www-db.standord.edu/~backrub/pageranksub.ps
- PageRank
- "random surfer" user behavior model
- [PageRank 2]
- Lawrence Page:
PageRank: Bringing Order to the Web
http://hci.stanford.edu/~page/papers/pagerank/
- [Haveliwala 1999]
- Taher H. Haveliwala:
Efficient Computation of PageRank,
Standord Technical Report,
1999.
http://dbpubs.stanford.edu:8090/pub/1999-31
- [Brin & Page 1998]
- Sergey Brin,
Lawrence Page:
The Anatomy of a Large-Scale Hypertextual Web Search Engine,
The 7th International World Wide Web Conference,
1998.
http://www7.scu.edu.au/programme/fullpapers/1921/com1921.htm
- [Google]
- Google
http://www.google.com/
- [Henzinger et al. 1999]
- Monika R. Henzinger,
Allan Heydon,
Michael Mitzenmacher,
Marc Najork:
Measuring Index Quality Using Random Walks on the Web,
The 8th International World Wide Web Conference,
1999.
http://www8.org/w8-papers/2c-search-discover/measuring/measuring.html
- 小規模 & 質の高い索引 > 大規模 & 質の低い索引
- [PageRank] + random walk (Markovian)
- [Zhang & Dong 2000]
- Dell Zhang,
Yisheng Dong:
An Efficient Algorithm to Rank Web Resources,
The 9th International World Wide Web Conference,
2000.
http://www9.org/w9cdrom/251/251.html
- [Bharat et al. 1998]
- Krishna Bharat,
Andrei Broder,
Monika Henzinger,
Puneet Kumar,
Suresh Venkatasubramanian
The connectivity server: Fast access to linkage information on the Web,
Proceedings of the 7th International World Wide Web Conference,
pp. 469-477,
1998.
http://www7.scu.edu.au/programme/fullpapers/1938/com1938.htm
- [Cai et al. 1998]
- Allen Cai,
Terry Siu,
Julie Sun:
Web Mining: Why, What, hoW,
1998.
http://algonquin.uwaterloo.ca/~alcai/school/cs748/WebMiningSurvey/sld001.htm
- Web Mining
- Web Content Mining
- Agent Based Approach (Web robot)
- Database Approach (Search Engine)
- Web Usage Mining
- プレゼン用の資料?
- [McBryan 1994]
- Oliver A. McBryan:
GENVL and WWWW: Tools for Taming the Web,
The 1st International Conference on the World Wide Web,
1994.
http://www.cs.colorado.edu/home/mcbryan/mypapers/www94.ps
- [Chakrabarti et al. 1998]
- Soumen Chakrabarti,
Byron Dom,
Prabhakar Raghavan,
Sridhar Rajagopalan
David Gibson,
Jon Kleinberg:
Automatic resource list compilation by analyzing hyperlink structure and associated text,
Proceedings 7th International World Wide Web Conference,
1998.
- ARC (Automatic Resource Compiler)
- [Kleinberg 1998]をベース
- あるページを参照しているリンク周辺(anchor window)のテキスト中のマッチした文字列数をスコアに加算
- [Ohomori et al. 1999]
- 大森貴博, 笹塚清二, 水谷正大:
リンク情報を考慮したWeb検索システム,
SIGNL 129-8, 1999.
- [Susaki & Muramoto 1999]
- 鷲崎誠司,
村本達也:
ハイパーリンクの構造を利用した検索結果の選択手法,
SIGFI 55-10, 1999.
- アンカーテキストの分析
- アンカーテキストの拡張
- 検索結果と同時に表示
- [Mauldin & Leavitt 1994]
- Michael Mauldin,
John R. R. Leavitt:
Web Agent Related Research at the Center for Machine Translation
In Proceedings of the ACM Special Interest Group on Networked Information Discovery and Retrieval,
1994.
http://www.fuzine.com/mlm/signidr94.html
- 文書構造ごとに重みを設定
- 未収集のページの検索にanchorを使用
- Lycos
- [Rowe & Frew 1998]
- Neil C. Rowe,
Brian Frewp:
Automatic Caption Localization for Photographs on World Wide Web Pages,
Information Processing & Management,
Vol. 34,
No. 1,
pp. 95-107,
1998.
http://www.cs.nps.navy.mil/research/marie/webpics.html
- [Kobayashi & Kitagawa 1999]
- 小林伸行, 北川文夫:
WWW上のページセットの抽出とそれを用いた検索,
第10回データ工学ワークショップ,
1999.
- Webページのグループ化 (リンク構造 + 経験則 + ページ内容の類似性)
- アルゴリズムは再帰的
- 結果は望ましくない (類似性計算が失敗の原因?)
- [Kazama et al. 2000]
- 風間 一洋,
原田 昌紀,
佐藤 進也:
サーチエンジンの検索結果のマルチレベル・グルーピングの評価,
コンピュータソフトウェア,
2000.
- Webページのグループ化 (リンク構造 + 経験則)
- アルゴリズムは再帰的ではない
- 過度のグループ化を避け,グループの異なる抽象レベルを表示可能
- マルチレベルGUI (ページ<->ページグループ<->サイトグループ)
- ODINの使用履歴解析
- [Takano & Kubo 2000]
- 高野元,
久保信也:
リンク解析を用いたWWWランキングシステム,
SIGDB 120-2,
2000.
- Webページのグループ化 ([PageRank])
- インフォメーション・ユニット
- アルゴリズムは再帰的
- [Zamir & Etzioni]
- Oren Zamir,
Oren Etzioni:
Grouper: A Dynamic Clustering Interface to Web Search Results,
The 8th World Wide Web Conference,
1999.
http://www8.org/w8-papers/3a-search-query/dynamic/dynamic.html
- 検索結果のクラスタリング
- STC Algorithm (a linear time clustering algorithm)
- リンクは考慮していない
- [Hirokawa et al. 2000]
- 廣川佐千男,
池田大輔,
田口剛史 :
リンク情報からの知識網構成,
発見科学とデータマイニング,
pp. 272 - 281,
共立出版,
2000.