ロケール依存の文字列操作
問題点
文字列操作は言語に依存する
複数の文字を一つに/一つの文字を複数にみなすことがある
UnicodeのDynamic CompositionとEquivalent Sequence
比較、ソート
java.text.Collator
クラス
繰り返し比較する時は、
java.text.CollationKey
クラスを使用すると高速化できる
日本語では読みでソートされることもあるが、未対応
文字、単語、行、文の境界
java.text.BreakIterator
クラス
禁則処理に対応できる
日本語形態素解析のような辞書を使う単語分割処理もあるが、未対応
[←]
[目次]
[→]