- 漢字と漢字の間にあるスペース(空白)を削除したい。
- でも、英語の単語間のスペース(空白)は削除したくない!
と思うときはありませんか?
今日はデータのクリーニング(クレンジング)にとっても手軽で便利な方法をお教えします。
例えば、次の例のように本来は「東京」という一つの単語なのですが、「東」と「京」の間にスペース(空白)が入ってしまっている場合があります。
私は東 京に住んでいる
I live in tokyo
I live in tokyo
このようなケースで全角文字(漢字や平仮名など)の間にあるスペース(空白)だけを一気に消すことができれば便利ですね。
このようなときは秀丸の置換機能を使えば簡単にできてしまいます。
難しいプログラムを書く必要もありません。
さっそくやってみましょう。
ファイルを開きます。
秀丸の検索機能で半角スペースで検索すると、黄色く表示されますので、半角スペースが含まれていることがわかります。
秀丸の置換ダイアログを開いて、以下のように入力します。
このブログ上では、バックスラッシュに見えるかもしれませんが、入力するときは半角の¥マーク(¥)を入力してください。
検索(S): ([^\x01-\x7E])\s+([^\x01-\x7E])
置換(E): \1\2
正規表現(R): チェックを入れる
置換(E): \1\2
正規表現(R): チェックを入れる
検索(S)に記述した括弧で囲った部分(全角文字にマッチします)が、置換(E)に記述した\1と\2に対応します。
実際の画面では次のようになります。
秀丸の検索機能で半角スペースで検索してみると、「東京」の間の半角スペースだけ削除できていることがわかります。