4 articles 2.名寄せ・クリーニング

漢字と漢字の間のスペース(空白)だけを削除する|秀丸の場合

漢字と漢字の間にあるスペース(空白)を削除したい。 でも、英語の単語間のスペース(空白)は削除したくない! と思うときはありませんか? 今日はデータのクリーニング(クレンジング)にとっても手軽で便利な方法をお教えします。…

データのクレンジング作業のまとめ

データのクレンジングで必要になる主な作業をまとめてみました。 ■名前クレンジング 旧字→新字変換 姓名分割 法人格の統一 法人名部署等の分離 ■住所クレンジング 住所妥当性判断 旧住所→新住所変換 住所補完(住所辞書から…

無料の名寄せツールの決定版 OpenRefine(Google Refine)とは?

概要 OpenRefine (Google Refine)は、汚いデータのクリーニング(クレンジング)やフォーマット変換に威力を発揮してくれる無料のツールです。顧客データの名寄せなどが得意なツールです。EXCELにはない…