重複データを削除したい|簡単にできるツールまとめ

screen_shot5



上の図のように重複したデータを削除して、重複がないデータを作成したいことがよくあります。
一番簡単な方法は、やはりエクセルです。

EXCELによる重複データの削除

EXCEL 2010以降から便利な重複データの削除機能が追加されています。

EXCELの場合は、以下の手順で操作します。

  1. データタブをクリック
  2. 重複データを削除したい列を選択
  3. 「重複の削除」ボタンをクリック

3以降の操作はEXCELのメッセージにしたがって操作するだけです。


screen_shot3


重複データの削除が完了すると、以下のように重複データが削除されたデータの完成です。
とても簡単ですね。

screen_shot4

EXCEL以外の方法

大抵の場合はEXCELでやるのが簡単で早いので、EXCELを利用するのがよいでしょう。
しかし、以下のような場合は他のツールを探す必要がでてきます。

  1. EXCELをもっていない
  2. 大きなデータを処理したい

1のEXCELをもっていない場合は、フリーで探すことになります。
若干スキルが要求されますが、ギリギリ非ITエンジニアでも使えるというところで、Pentaho Data Integrationでしょうか。

次に2の場合ですが、このような場合は、AccessやPentaho Data Integrationが候補になってくると思います。

Pentaho Data Integrationのインストール方法については以下の記事をご参考ください。

【参考記事】Pentaho Data Integrationのインストール方法

writer has written 22 articles