YAGF

提供: ArchWiki
移動先: 案内検索

YAGF は Linux プラットフォームで動作する OCR プログラムの cuneiformtesseract のグラフィカルインターフェイスです。YAGF を使うことで、XSane が画像をスキャンしてから、一つのコマンドで画像の前加工を行なって cuneiform や tesseract でテキストを認識させることができます。また、YAGF はスキャンや複数の画像の認識も簡単にします。

インストール

YAGF は Qt 4 と aspell スペルチェックパッケージを必要とします。スキャナから直接 YAGF に画像を取得したい場合、XSane ソフトウェアをインストールしてください。もちろん、文字認識のための cuneiform (または tesseract) も必要です。

公式リポジトリから yagfインストールしてください。

対応言語

次の言語の認識が行えます: チェコ語, デンマーク語, オランダ語, 英語, エストニア語, フランス語, ドイツ語, ハンガリー語, イタリア語, ラトビア語, リトアニア語, ポーランド語, ポルトガル語, ルーマニア語, ロシア語, スペイン語, スウェーデン語, ウクライナ語。

使用方法

YAGF による文章のデジタル化は複数の段階に分かれています: 画像の取得, 画像の前処理 (必要な場合), 認識, そして結果の保存。

画像の取得

ハードドライブに保存されている画像の文字を認識させることも、新しい画像をスキャンして直接 YAGF に手渡すこともできます。ハードドライブから画像をロードするときは File/Open Image... コマンドを使って下さい。YAGF は主要なラスタ画像フォーマットは全てサポートしています (JPEG, PNG, BMP, TIFF, GIF, PNM, PPM, PBM)。ロードしたファイルの名前が nameXXX.ext (XXX は数字) という形式ならば、ナビゲーションボタンで次/前のファイルに移動することができます。例えば、MyPage06.jpg という名前のファイルをロードしたら、"Move to next image" ボタンで MyPage07.jpg ファイルが開きます。開いた画像は全て画像バーに表示されます。

XSane を使うことでスキャナから直接画像を取得できます。YAGF で、File/Scan コマンドを選択してください。XSane プログラムが起動します。XSane でスキャンオプションを設定したら XSane の Scan ボタンを押して下さい。スキャンが完了したら、スキャンした画像が YAGF の画像表示ウィンドウで開かれます。複数のページをスキャンしたい場合、同じ操作を繰り返して下さい。画像をスキャンするたびに YAGF の画像表示ウィンドウに画像が表示されます。ナビゲーションボタンで前の画像に移動できます。YAGF での作業中 XSane ウィンドウは開いたままにしておけます。YAGF を終了すると XSane のウィンドウも自動的に閉じます。スキャンした画像を閲覧するには、先に述べたようにナビゲーションボタンを使って下さい。取得された画像は左側の画像バーにサムネイルとして表示されます。画像バーの Save ボタンを使うことで別のディレクトリに画像を保存することもできます。

画像の前処理

YAGF では複数の前処理が行えます。向きが正しくない場合はロードした画像を回転することができます。画像は(反)時計回りに90度回転したり180度回転させることができます。画像が表示されるウィンドウの上部に回転を実行するボタンが存在します。ページ全体ではなく一部分だけを認識して欲しい場合、長方形のブロックで認識する部分を選択することが可能です。ブロックは画像が表示されるウィンドウでマウスを使って選択します。ブロックの端をマウスポインタでドラッグすることでブロックのサイズは変えられます。スキャンしたページが画像表示ウィンドウに収まらないときは、画像を拡大したり縮小することで選択するのが楽になります。拡大や縮小を行うことで cuneiform で認識をするときの画像の解像度が変わることはありません。また、Ctrl++Ctrl+- キーを使って画像をスケールしたり、Ctrl キーを押しながらマウスホイールを回すことでも画像のサイズを変えられます。同じようにテキストエディタのフォントサイズも変えられます。

文字認識

テキストを認識させる前に、認識言語を選択する必要があります (文章が複数の言語で書かれている場合は言語のペアを選択)。

新しく認識された文字はテキストエディタウィンドウの末尾に追加されます。

デフォルトでは YAGF は libaspell を使って認識されたテキストのスペルをチェックします。基本的に aspell をインストールするときはシステムで使用している言語や英語の辞書も一緒にインストールします。他の言語のテキストのスペルチェックをしたい場合、aspell の辞書を追加でインストールしてください。選択した認識言語の辞書が存在しないと、YAGF から警告が表示されます。警告が表示されないようにしたいときはスペルチェックをオフにしてください。

Image バーで複数の画像を開いている場合、全ての画像から一度に文字を認識するバッチ認識が使えます。"Recognize All Pages" ボタンを押して下さい。進捗ダイアログが表示されて、次々に画像が自動的にロードされて認識されます。進捗ダイアログの Abort ボタンを押すことで認識を停止させることができます。

結果の保存

認識された文字は、UTF-8 エンコーディングのテキストまたは html ファイルでディスクに保存したり、クリップボードにコピーすることができます。"Copy to Clipboard" ボタンを押すと選択した部分がコピーされます。選択していない場合はテキスト全体がコピーされます。

参照