RPの作成方法
リソースからテキストを抽出
文書構造解析
エンコーディング検出、言語検出
テキストを解析し、単語を抽出
英語
スペースで分割
acronym検出
日本語
形態素解析
成句検出
品詞情報から名詞、動名詞、形容詞を抽出
単語の頻度から、全体頻度表を使い重みを計算(tf・idf法)
重みの上位の単語を抽出(最大100タームブロック)
閾値以上の重みの単語数を計算(最大32タームブロック)
[←]
[目次]
[→]