知っておきたいデータマイニングの標準プロセス
データマイニングとは、課題解決のためにデータから知識を抽出することです。 データマイニングの標準プロセスとして提案されているプロセスとしては次の2つが有名です。 CRISP-DM(Cross Industry Stand…
データマイニングとは、課題解決のためにデータから知識を抽出することです。 データマイニングの標準プロセスとして提案されているプロセスとしては次の2つが有名です。 CRISP-DM(Cross Industry Stand…
EXCELでデータを作成しているときに、ある列に同じ値をたくさんコピーしたい場合があります。 データが少ない場合は下の図のようにマウスでドラッグする方法が最も手軽な方法です。 しかし、行数が少ない場合は苦になりませんが、…
複数の異なるデータをマージすることは、想像以上に手間がかかる仕事です。特に100万行を超えるような大量データの場合は、EXCELでは処理することが難しくなります。そのような場合にぜひ活用したいのがデータ統合の専用ソフトで…
Talend Open Studio for Data Qualityは、データの品質検査(重複行のカウント、値のパターン確認など)や訂正作業のために非常に有効なツールです。 非常に強力で便利なツールですが、きちんと動か…
データの統合やクレンジングに無料で使える「talend」のオープンソース製品をご紹介します。4G程度のメモリがあるPCであれば、会社や自宅のデスクトップでデータ加工ができます。 製品名 分類 説明 Talend Open…