Unicodeを用いたN-gram索引の
一実現方式とその評価
内容
- スライド 1 Unicodeを用いたN-gram索引の一実現方式とその評価
- スライド 2 発表内容
- スライド 3 研究の背景
- スライド 4 全文検索モジュールJerkyの開発方針
- スライド 5 索引づけ方式の検討(1)
- スライド 6 索引づけ方式の検討(2)
- スライド 7 N-gram転置索引の構成
- スライド 8 N-gram方式のUnicodeベースでの実現
- スライド 9 文字シーケンスの正規化(1)
- スライド 10 文字シーケンスの正規化(2)
- スライド 11 Unicode文字ブロックごとに分割単位を設定
- スライド 12 N-gramへの分割アルゴリズム
- スライド 13 N-gram長パラメータの設定
- スライド 14 N-gram転置索引の構成(再掲)
- スライド 15 実データに基づくN-gram長の推定
- スライド 16 検索語における漢字連続長
- スライド 17 検索語におけるひらがな連続長
- スライド 18 検索語におけるカタカナ連続長
- スライド 19 転置索引(参照ファイル)の占有率
- スライド 20 言語に依存した検索処理の追加
- スライド 21 おわりに
Converted from Powerpoint Presentation to HTML by PPT2HTML AddIn.
PPT2HTML : by AGATASHI