Home
Packages
Forums
Wiki
GitLab
Security
AUR
Download
コンテンツにスキップ
メインメニュー
メインメニュー
サイドバーに移動
非表示
案内
メインページ
目次
コミュニティに貢献
最近の出来事
おまかせ表示
特別ページ
交流
ヘルプ
貢献
最近の更新
最近の議論
新しいページ
統計
リクエスト
ArchWiki
検索
検索
表示
アカウント作成
ログイン
個人用ツール
アカウント作成
ログイン
YAGFのソースを表示
ページ
議論
日本語
閲覧
ソースを閲覧
履歴を表示
ツール
ツール
サイドバーに移動
非表示
操作
閲覧
ソースを閲覧
履歴を表示
全般
リンク元
関連ページの更新状況
ページ情報
表示
サイドバーに移動
非表示
←
YAGF
あなたには「このページの編集」を行う権限がありません。理由は以下の通りです:
この操作は、次のグループに属する利用者のみが実行できます:
登録利用者
。
このページのソースの閲覧やコピーができます。
[[Category:オフィス]] [[en:YAGF]] [[es:YAGF]] {{Related articles start}} {{Related|アプリケーション一覧/ドキュメント#OCR ソフトウェア}} {{Related articles end}} [https://sourceforge.net/projects/yagf-ocr/ YAGF] は Linux プラットフォームで動作する OCR プログラムの [[wikipedia:CuneiForm_(software)|cuneiform]] や [[wikipedia:Tesseract_(software)|tesseract]] のグラフィカルインターフェイスです。YAGF を使うことで、XSane が画像をスキャンしてから、一つのコマンドで画像の前加工を行なって cuneiform や tesseract でテキストを認識させることができます。また、YAGF はスキャンや複数の画像の認識も簡単にします。 == インストール == YAGF は Qt 4 と {{Pkg|aspell}} スペルチェックパッケージを必要とします。スキャナから直接 YAGF に画像を取得したい場合、[[SANE|XSane]] ソフトウェアをインストールしてください。もちろん、文字認識のための {{Pkg|cuneiform}} (または {{Pkg|tesseract}}) も必要です。 {{AUR|yagf}} パッケージを[[インストール]]してください。 == 対応言語 == 次の言語の認識が行えます: チェコ語, デンマーク語, オランダ語, 英語, エストニア語, フランス語, ドイツ語, ハンガリー語, イタリア語, ラトビア語, リトアニア語, ポーランド語, ポルトガル語, ルーマニア語, ロシア語, スペイン語, スウェーデン語, ウクライナ語。 == 使用方法 == YAGF による文章のデジタル化は複数の段階に分かれています: 画像の取得, 画像の前処理 (必要な場合), 認識, そして結果の保存。 === 画像の取得 === ハードドライブに保存されている画像の文字を認識させることも、新しい画像をスキャンして直接 YAGF に手渡すこともできます。ハードドライブから画像をロードするときは File/Open Image... コマンドを使って下さい。YAGF は主要なラスタ画像フォーマットは全てサポートしています (JPEG, PNG, BMP, TIFF, GIF, PNM, PPM, PBM)。ロードしたファイルの名前が ''nameXXX.ext'' (''XXX'' は数字) という形式ならば、ナビゲーションボタンで次/前のファイルに移動することができます。例えば、''MyPage06.jpg'' という名前のファイルをロードしたら、"Move to next image" ボタンで ''MyPage07.jpg'' ファイルが開きます。開いた画像は全て画像バーに表示されます。 XSane を使うことでスキャナから直接画像を取得できます。YAGF で、File/Scan コマンドを選択してください。XSane プログラムが起動します。XSane でスキャンオプションを設定したら XSane の ''Scan'' ボタンを押して下さい。スキャンが完了したら、スキャンした画像が YAGF の画像表示ウィンドウで開かれます。複数のページをスキャンしたい場合、同じ操作を繰り返して下さい。画像をスキャンするたびに YAGF の画像表示ウィンドウに画像が表示されます。ナビゲーションボタンで前の画像に移動できます。YAGF での作業中 XSane ウィンドウは開いたままにしておけます。YAGF を終了すると XSane のウィンドウも自動的に閉じます。スキャンした画像を閲覧するには、先に述べたようにナビゲーションボタンを使って下さい。取得された画像は左側の画像バーにサムネイルとして表示されます。画像バーの Save ボタンを使うことで別のディレクトリに画像を保存することもできます。 === 画像の前処理 === YAGF では複数の前処理が行えます。向きが正しくない場合はロードした画像を回転することができます。画像は(反)時計回りに90度回転したり180度回転させることができます。画像が表示されるウィンドウの上部に回転を実行するボタンが存在します。ページ全体ではなく一部分だけを認識して欲しい場合、長方形のブロックで認識する部分を選択することが可能です。ブロックは画像が表示されるウィンドウでマウスを使って選択します。ブロックの端をマウスポインタでドラッグすることでブロックのサイズは変えられます。スキャンしたページが画像表示ウィンドウに収まらないときは、画像を拡大したり縮小することで選択するのが楽になります。拡大や縮小を行うことで cuneiform で認識をするときの画像の解像度が変わることはありません。また、{{ic|Ctrl++}} や {{ic|Ctrl+-}} キーを使って画像をスケールしたり、{{ic|Ctrl}} キーを押しながらマウスホイールを回すことでも画像のサイズを変えられます。同じようにテキストエディタのフォントサイズも変えられます。 === 文字認識 === テキストを認識させる前に、認識言語を選択する必要があります (文章が複数の言語で書かれている場合は言語のペアを選択)。 新しく認識された文字はテキストエディタウィンドウの末尾に追加されます。 デフォルトでは YAGF は libaspell を使って認識されたテキストのスペルをチェックします。基本的に aspell をインストールするときはシステムで使用している言語や英語の辞書も一緒にインストールします。他の言語のテキストのスペルチェックをしたい場合、aspell の辞書を追加でインストールしてください。選択した認識言語の辞書が存在しないと、YAGF から警告が表示されます。警告が表示されないようにしたいときはスペルチェックをオフにしてください。 Image バーで複数の画像を開いている場合、全ての画像から一度に文字を認識するバッチ認識が使えます。"Recognize All Pages" ボタンを押して下さい。進捗ダイアログが表示されて、次々に画像が自動的にロードされて認識されます。進捗ダイアログの ''Abort'' ボタンを押すことで認識を停止させることができます。 === 結果の保存 === 認識された文字は、UTF-8 エンコーディングのテキストまたは html ファイルでディスクに保存したり、クリップボードにコピーすることができます。"Copy to Clipboard" ボタンを押すと選択した部分がコピーされます。選択していない場合はテキスト全体がコピーされます。 == 参照 == * https://launchpad.net/cuneiform-linux - Cuneiform の Linux 移植
このページで使用されているテンプレート:
テンプレート:AUR
(
ソースを閲覧
)
テンプレート:Ic
(
ソースを閲覧
)
テンプレート:META Related articles start
(
ソースを閲覧
)
テンプレート:Pkg
(
ソースを閲覧
)
テンプレート:Related
(
ソースを閲覧
)
テンプレート:Related articles end
(
ソースを閲覧
)
テンプレート:Related articles start
(
ソースを閲覧
)
YAGF
に戻る。
検索
検索
YAGFのソースを表示
話題を追加