次の例で使用している正規表現[\u3040-\u30ff]+
は、ひらがなとカタカナが連続する箇所にマッチします。 この正規表現は、ひらがな(U+3040~U+309F)およびカタカナ(U+30A0~U+30FF)に該当するコードポイントの文字([\u3040-\u30ff]
)が1文字以上連続する(+
)箇所にマッチします。
正規表現を使って文字列中のひらがなとカタカナが連続する部分を抽出する
using System;
using System.Text.RegularExpressions;
class Sample {
static void Main()
{
var text = "Regexにマッチした箇所を一つのグループとしてキャプチャする";
var pattern = @"[\u3040-\u30ff]+";
foreach (Match m in Regex.Matches(text, pattern)) {
Console.WriteLine(m.Value);
}
}
}
実行結果
にマッチした を つのグループとしてキャプチャする