データの統合やクレンジングに無料で使える「talend」のオープンソース製品をご紹介します。4G程度のメモリがあるPCであれば、会社や自宅のデスクトップでデータ加工ができます。
製品名 | 分類 | 説明 |
---|---|---|
Talend Open Studio for Data Integration | データ統合 | テキストファイルやEXCEL、SQLServerなどのRDBから読み込んだデータを統合することができるツール。 |
Talend Open Studio for Big Data | ビックデータ統合 | Talend Open Studio for Data Integrationが従来型のデータ(テキスト、RDBなど)を対象としているのに対し、こちらは大量データを処理できるようにするために、Hadoopなどを対象としている。Hadoopとは、大量のデータを複数のマシンに分散して処理できる基盤技術です。本サイトはあくまで個人レベルで取り扱えるツールを対象としているので、こちらは対象外とします。 |
Talend Open Studio for Data Quality | データ品質 | データ品質のチェック、手修正するのに便利なツール。データ統合ツールでデータを作成した後にデータの内容を調べたり、修正したりするのに役に立つ。 |
Talend Open Studio for ESB | アプリケーションの統合 | 異なるアプリケーションを繋げて一連の処理をさせってしまいましょうという基盤ソフト。個人レベルでは必要ありません。 |
Talend Open Studio for MDM | マスターデータ管理 | マスタデータのプロファイリング、監査などを行ってくれるツールです。マスタデータの品質維持に役立ちます。これも個人レベルでは必要ないので本サイトでは対象外とします。 |
これらのオープンソース製品はtalendのサイトからダウンロードすることができます。