EXCELのセルの値をPythonの正規表現で置換する
EXCELのセルの値を正規表現で置換したい。できれば使いなれたPythonでやりたい。 そのような人も結構多いのではないでしょうか。 この記事では、OpenRefineを使用してPythonスクリプトでデータを変換する方…
EXCEL、CSV、XMLなど、さまざまなデータ形式のデータから効率的にデータを抽出・変換するテクニックを説明します
EXCELのセルの値を正規表現で置換したい。できれば使いなれたPythonでやりたい。 そのような人も結構多いのではないでしょうか。 この記事では、OpenRefineを使用してPythonスクリプトでデータを変換する方…
PDFのデータをテキスト形式など、他の形式で出力して文章を加工したいと思うときがあると思います。 Acrobat Reader DC(無料版)でも、以下の5種類のフォーマットに変換して保存することができます。 Micro…
上の図のように重複したデータを削除して、重複がないデータを作成したいことがよくあります。 一番簡単な方法は、やはりエクセルです。 EXCELによる重複データの削除 EXCEL 2010以降から便利な重複データの削除機能が…
Error:本記事は、Pentaho Data Integration(PDI)の解説記事です。Pentaho Data Integrationはあなたのパソコンで簡単に1000万件規模のビッグデータの加工ができる高性能…
Error:別途、Javaのインストールが必要です 概要 ETLツールとしてお勧めしたいのが、Pentahoの「Data Integration」です。 略して「PDI」とも呼ばれています。 Pentahoは、オープンソ…