Python 3 の正規表現 \w 文字クラス

http://docs.python.jp/3/library/re.html

\w
ユニコード (str) パターンに対して:
任意の Unicode 単語文字にマッチします。これにはあらゆる言語で単語の一部になりうる文字、数字、およびアンダースコアが含まれます。ASCII フラグを使用すると [a-zA-Z0-9_] のみにマッチします。ただし、このフラグは正規表現全体に作用しますので、明示的に [a-zA-Z0-9_] と指定する方が良い場合があるかもしれません。

どうして \w が日本語にもマッチするんじゃい!? と調べていたら、こういうことだった。

Last updated on May 31, 2016