読者です 読者をやめる 読者になる 読者になる

EUCの正規表現

EUCの環境で正規表現(カナ文字以外をスルー)をする必要があったので
どうやったらいいかを調べてみます。

まずは文字コード
http://charset.7jp.net/euc.html
EUCの全角文字は2バイト

全角カタカナ表記は区(a5)点(a1)〜(f6)なので
preg_matchを使ってチェックすると

if (preg_match("/^(\xa5[\xa1-\xf6]+$/",$str))

合ってるかな。