上の図のように重複したデータを削除して、重複がないデータを作成したいことがよくあります。
一番簡単な方法は、やはりエクセルです。
EXCELによる重複データの削除
EXCEL 2010以降から便利な重複データの削除機能が追加されています。
EXCELの場合は、以下の手順で操作します。
- データタブをクリック
- 重複データを削除したい列を選択
- 「重複の削除」ボタンをクリック
3以降の操作はEXCELのメッセージにしたがって操作するだけです。
重複データの削除が完了すると、以下のように重複データが削除されたデータの完成です。
とても簡単ですね。
EXCEL以外の方法
大抵の場合はEXCELでやるのが簡単で早いので、EXCELを利用するのがよいでしょう。
しかし、以下のような場合は他のツールを探す必要がでてきます。
- EXCELをもっていない
- 大きなデータを処理したい
1のEXCELをもっていない場合は、フリーで探すことになります。
若干スキルが要求されますが、ギリギリ非ITエンジニアでも使えるというところで、Pentaho Data Integrationでしょうか。
次に2の場合ですが、このような場合は、AccessやPentaho Data Integrationが候補になってくると思います。
Pentaho Data Integrationのインストール方法については以下の記事をご参考ください。