2005-04-01から1ヶ月間の記事一覧

validation

あるスカラー値がUTF-8として正しいかどうかを判定したい。その場合に使えそうなのは、utf8::is_utf8 や utf8::valid といったものだ。Encode::is_utf8 というものもある。ビットパターンを見る限りはUTF-8っぽいが、実際にはUTF-8であってはならないもの、…

Unicode と perl

perl 5.8 から Unicode 対応が強化されている。いままでは文字列なのか、たんなるバイト列なのかは区別されていなかった。そこで、日本語を扱うのであれば、EUC-JP のような encoding を使い、それをただのバイト列として扱うのが定番な方法であった。最近の…

Unicode と perl

ちょっとずつメモをしていく。