UiPathでPDFデータを読み込もう!
※この記事で説明するアクティビティを利用する前にPDF用のパッケージをインストールしておく必要があります。
また、当然ながらAdobe社のAcrobat等がインストールされていないと利用できません。
UiPathではPDF用のアクティビティを使うことで、PDFのテキストファイルを取りこむことができます。
なお、PDFのテキストファイルは最初からファイルに埋め込まれているもの(範囲指定できるタイプのもの)となります。
一応OCRもできますが、こちらについては別途紹介します。
1.Read PDF textアクティビティを追加する
後は中央のボックスにPDFファイルの場所を指定するだけです。
なんとこれだけで、Outputに指定した変数へテキストデータが格納されます。
もしPDFからテキストをコピペしてEXCELに張り付けるような作業をしている方がいらっしゃるならぜひお試しください。
なお、デフォルトではInputプロパティが”All”になっていますので、全ページの情報を抜きだしてきます。
ページ指定等は印刷と同じようにInputプロパティで例えば3ページなら”3″、1~5ページなら”1-5″と指定することで、
そのページのテキストを抜きだしてきます。本来印刷で2と5ページなら”2,5″なのですが、これはエラーとなるようです。
(おまけ)もしファイルにパスワードがかかっている場合はプロパティのPasswordで指定することができます。