Unicodeを用いたN-gram索引の 一実現方式とその評価

UP 1 Level


内容

  1. スライド 1 Unicodeを用いたN-gram索引の 一実現方式とその評価
  2. スライド 2 発表内容
  3. スライド 3 研究の背景
  4. スライド 4 全文検索モジュールJerkyの開発方針
  5. スライド 5 索引づけ方式の検討(1)
  6. スライド 6 索引づけ方式の検討(2)
  7. スライド 7 N-gram転置索引の構成
  8. スライド 8 N-gram方式のUnicodeベースでの実現
  9. スライド 9 文字シーケンスの正規化(1)
  10. スライド 10 文字シーケンスの正規化(2)
  11. スライド 11 Unicode文字ブロックごとに分割単位を設定
  12. スライド 12 N-gramへの分割アルゴリズム
  13. スライド 13 N-gram長パラメータの設定
  14. スライド 14 N-gram転置索引の構成(再掲)
  15. スライド 15 実データに基づくN-gram長の推定
  16. スライド 16 検索語における漢字連続長
  17. スライド 17 検索語におけるひらがな連続長
  18. スライド 18 検索語におけるカタカナ連続長
  19. スライド 19 転置索引(参照ファイル)の占有率
  20. スライド 20 言語に依存した検索処理の追加
  21. スライド 21 おわりに

Converted from Powerpoint Presentation to HTML by PPT2HTML AddIn.
PPT2HTML : by AGATASHI