よくある質問
OCRソフトウェアとは何ですか?
光学式文字認識(Optical Character Recognition)の略で、この種の技術を使用すると、スキャンやPDF画像から実際の人と同じようにテキストを読み取ることができます。この技術の最も一般的な用途は、PDFファイルを検索可能にしたり、WordにOCRを実行したりすることですが、パスポート、ID、手書きのメモをデジタル化したり、障害者のために本やその他の印刷物をアクセシブルにしたり、その他さまざまな用途に使用することができます。
OCRは無料で使えますか?
完璧な結果を提供すると謳う無料のOCRウェブ・ツールは数多くありますが、その謳い文句通りのものは多くありません。中にはデータを盗んで売ろうとするものさえあります!PDF Extraは有料製品ですが、オンラインでもオフラインでも、ほとんど誰でも24時間信頼できるOCRとPDF編集サービスの恩恵を受けることができるよう、価格は十分に手頃です。
どのようなファイル・タイプをサポートしていますか?
OCRは画像を検出できますか?
はい、OCRテクノロジーは画像テキストをスキャンして検索可能にすることができます。OCR画像からテキストへの抽出は、PDF ExtraのAndroid版とiOS版の両方で完全にサポートされています。
OCRで最も使いやすいフォントは何ですか?
OCRソフトウェアは長いフォントのリストを認識することができますが、ArialやTimes New Romanのような標準化されたフォントが最も安定した結果を提供することが示されています。
OCRの精度を上げるにはどうすればよいですか?
どんな技術も完璧ではありませんが、光学式テキスト認識ソフトウェアも同じです。検索可能なPDFを高い精度で作成したい場合に、覚えておくべき推奨事項をいくつかご紹介します:
- 可能な限り、変形、不鮮明、影のある画像ではなく、高品質の画像を使用する。
- 手書き風や草書体のような複雑なフォントから文書を取り除く。
- PDFのレイアウトを単純化し、複数カラムのテキスト、表、グラフなどを除外する。
OCRはファイルサイズを増加させますか?
はい、しかしその差はせいぜい無視できる程度です。検索可能なPDFフォーマットは、元のドキュメントのサイズに比べて約1~5%余分にかかりますが、カラースキャンをOCRした場合はさらに少なくなります。それでも空き容量が足りなくなるのではないかと心配な場合は、PDF Extraに内蔵されているPDF圧縮ツールを使用することで、品質を落とすことなくファイルを縮小することができます。
何ヶ国語をサポートしていますか?
PDF ExtraのテキストOCR機能は、英語、ドイツ語、フランス語、イタリア語、スペイン語、日本語、ヘブライ語のテキストを正確に認識することができます。