ホームFAQメイン| 4-1-1 画像ファイルの変換設定

2010年03月12日

拡張子 .jpe のJPEGファイル変換について

拡張子 .jpe のJPEGファイルは、Windowsに関連付けされて
いるアプリケーションの印刷機能利用して変換を行う必要が
御座います。
.jpeの拡張子を、印刷時に対話の操作が必要ない任意の
アプリケーションに関連付けし変換を行って下さい。

なお、関れ付けの方法は次のFAQを御参考下さい。

【MSオフィス文書以外のアプリを変換したい】
http://www.hypergear.com/mt/support/FAQ/psv5/archives/2008/07/post_56.html


投稿者 hypergear : 10:37

TIFFファイルだけ自動印刷ができない

Word/Excel/PowerPoint以外のファイルは、Windowsに関連付けされて
いるアプリケーションで印刷を行います。
拡張子に関連付けたアプリケーションを使用して、Windows標準の外部
からの印刷実行機能(エクスプローラでファイルを選択>右クリック>印刷
にて印刷する機能)を使用して印刷するため、ウィザード画面が出てしまう
ようなアプリケーションに関連付けされております場合には、応答できず
印刷エラーとなります。

TIFFファイルを、印刷時に対話の操作が必要ないアプリケーションに関連
付けしてください。

なお、関れ付けの方法は次のFAQを御参考下さい。

【MSオフィス文書以外のアプリを変換したい】
http://www.hypergear.com/mt/support/FAQ/psv5/archives/2008/07/post_56.html

投稿者 hypergear : 10:30

2008年07月30日

高圧縮PDFにならない

高圧縮の対象になるのは、カラーの画像データのみです。
モノクロ、アプリケーションデータは対象になりません。

投稿者 hypergear : 13:04

Windowsエクスプローラの検索にヒットしない

1. OCRの詳細設定画面で「Windowsエクスプローラ検索機能向けテキストを埋め込む」
  がチェックされていますか?
  変換対象設定>画像ファイルの変換設定>検索できるPDFの作成(OCR)の
  オプションにて設定して下さい。

2. セキュリティはかかっていませんか?
 セキュリティのかけられたPDFは文書が暗号化されるため、検索できません。

3. レジストリの更新スクリプトは実行されていますか?(WindowsXP, 2003, Vista)
 PscanServインストールフォルダにある、pdfsearch.regを検索を行う各クライアントで実行し、
 コンピュータを再起動してください。

投稿者 hypergear : 11:59

OCRエリア認識結果がCSVに出力されない

1. 「CSVファイル」にて「CSVファイルに出力する」にチェックが入っていますか?
  出力先設定>出力データ形式>CSVファイルにチェックをし、
  出力項目設定にて、OCRエリア認識結果を設定して下さい。

2.変換後のPDFで、指定したエリアにOCRがかかっていますか?
  変換後データを開き、文字選択ツールを選択し、エリア指定箇所をクリック
  してみて下さい。OCR文字が選択されなければ、正常にOCRがかかっていません。

投稿者 hypergear : 11:58 | コメント (13)

OCR認識による自動正立/傾き補正

OCR認識による自動正立/傾き補正機能は、OCRエンジン
を使用し、原稿の上下の情報を判定する機能でございます。

そのため、特に文字数の少ない原稿など、OCRエンジンが
上下の認識を誤った場合、正しく自動正立/傾き補正が
できない場合がございます。

漢数字の「一」や数字の「1」の様な縦横の判別が困難な文字を
除き、100文字程度の文字数が自動正立判定の目安となり、
取得した文字単位に方向の妥当性をチェックし、得られた文字
回転情報を基に原稿全体の回転角を確定する仕組みとなります。
判定対象の文字情報としては、次の条件を満たしている必要が
ございます。

1) 取得文字サイズの縦横比率が50%以上、200%未満のもの。
  ※上記の「一」や「1」はこの条件から外れます。
2) 文字サイズが20ピクセル以上であるもの。
  ※「・」や「,」など文字サイズとして小さい文字は
   この条件から外れる可能性が高くなります。

目安としては文字の占める割合が3割以上であるほうが、精度が
よくなります。
また、傾き補正機能は最大プラスマイナス5度以内の補正になります。

投稿者 hypergear : 11:56

OCRエリア設定のプレビュー画面に表示できない

プレビューができるのは、TIFF(G4), とJPEGのみになります。
その他のPDF等のファイル形式はプレビューできません。

投稿者 hypergear : 11:56

Windows検索用テキストがないPDFをWindowsで検索したい

Windows検索用テキストがないPDFでも、OCRテキスト付のPDFは、
Acrobatでの検索、Windowsのインデックスサービス、その他文書管理
ソフトなど、通常のテキスト付PDFファイルを検索できる方法であれば、
どのような方法でも全文検索することができます。

Windows検索用テキスト機能は、これらの検索に加え、PDFのようなバイナリデータを
検索できないエクスプローラでも検索できるようにするものです。

投稿者 hypergear : 11:54

Windows検索用テキスト付のPDFについて知りたい

Windowsエクスプローラの検索機能を使用して、検索できるPDFです。
通常Windowsのエクスプローラでは、PDFなどのオフィス文書以外の
バイナリデータを検索することはできませんが、Windows検索用テキスト付き
のPDFであればエクスプローラの検索でもヒットします。

※検索を行う各クライアントで、レジストリの更新が必要です。

投稿者 hypergear : 11:52

どのようなデータにOCRがかかるかを知りたい

画像データです。
TIFF, JPEG, およびスキャナから取り込んで作成されたPDF, XDWです。
アプリケーションファイルや、LZW, JBIG(※)など対応していない圧縮形式の画像にはかかりません。

※Acrobat6.0以上を使用して、スキャナから取り込んだ場合、
  設定によっては作成される場合があります。

その場合、次の点を設定します。
 Acrobat6.0:「コンテンツに合わせた圧縮」をオフにします。
 Acrobat7.0:モノクロ画像の圧縮形式をG4にします。

※PDFにはWORD等のアプリケーションファイルから作成されたものなど、多様な形式がありますが、
スキャニングによる画像のPDFであるかどうか確認することが難しい場合もあります。
OCR処理等の画像処理が目的の場合、TIFF等の画像でスキャンすることをご検討いただいた方が、
運用上の問題が軽減されるケースがございます。

投稿者 hypergear : 11:50

OCRの認識結果をテキストファイルに出力したい

認識結果をテキストファイル(.TXT)や、HTMLファイルに出力することができます。
テキストファイルには認識結果の文字列が、HTMLファイルには位置情報をもった
認識結果の文字列が出力されます。
このHTMLファイルを開きますと、変換対象の原稿とほぼ同じレイアウトで表示されます。

投稿者 hypergear : 11:49

OCRテキストを校正したい(Netscape7.0使用)

HTMLの編集のみ(Acrobat不要)な校正方法です。
1.PscanServでOCR結果をHTML形式に出力します。
2.HTMLをNetscape7.0以上で校正します。
3.PscanServで校正後のHTMLと変換元原稿を再合成します。
 ※【重要】 Netscapeの設定で、「元のHTMLソースをそのまま維持する」を選択します。
  「再フォーマットする」にすると、正しく合成できません。HTMLの定義は広汎にわたりますので
  PscanServの作成するHTML形式のみに対応しております。同じ理由で、ホームページ
  作成ソフト等でHTMLを校正することはできません。

投稿者 hypergear : 11:34

OCRテキストを校正したい(Acrobat6.0以上使用)

Acrobat6.0以上を使用すると、次のような方法で簡単にテキストを校正することができます。

1.下記を設定し、OCRをかけます。
 ・OCR処理
 ・レイヤーテキスト
 ・文字色:黒
 ・認識信頼度が低い文字:赤

2.Acrobat6.0以上でファイルを開きます。
 (Adobe Readerでは編集できません。また、可能であればAcrobat7.0以上をご選択ください。
 どちらでも同様の校正ができますが、7.0の方が、テキストを選択する場合の操作性が良いためです。)

3.ウィンドウの分割機能(ウィンドウメニュー>分割)機能を利用してウィンドウを2つに分割し、
 一方に文書のレイヤーを、もう一方にOCRテキストのレイヤーを表示させます。

4.3の画面で見比べながら、タッチアップテキストツールで誤認識部分を校正します。
 (誤認識である可能性が高い部分が赤文字で表示されますので、赤文字部分を中心にチェックします)

5.修正後のPDFがレイヤーなしである方が良い場合、下記を設定しPscanServで再変換します。
 ※この項目を実行しなくても検索には影響を与えません。
 ・OCR処理のチェックを外します。
 ・レイヤーの設定を解除します。
 ・埋め込まれたOCR認識文字の色をすべて透明にするを選択します

投稿者 hypergear : 11:33

2008年07月25日

どのような方法で検索できるかを知りたい

Acrobatを使用しての検索の他、Windowsのインデックスサービスや、その他文書管理ソフトなど、
通常のテキスト付PDFファイルを検索できる方法であればどのような方法でも、全文検索することができます。

投稿者 hypergear : 10:13

認識精度を上げたい

通常の綺麗な状態の原稿であれば、多くの場合高いOCR結果が得られますが、CR処理の性質上、
原稿によりましては認識精度が悪い場合も考えられます。そのような場合、次の項目などをご参考
いただき、設定を調整してください。

1.なるべく原稿にあった設定を行います。
 原稿方向・認識言語は、自動認識させることも可能ですが混在しない原稿が対象の場合、
 明示的に横書き/縦書きあるいは日本語/英語を選択します。

2.可能な限り綺麗な状態で画像を作成してください。
 高性能なOCRエンジンを使用しておりますので、およそ200DPIくらいの原稿でも、比較的高い
 認識を行うことができますが、解像度を上げるなど、可能な限り綺麗な状態で原稿を作成してしてください。
 FAX原稿のように、すでに文字がつぶれてしまっている場合などは、解像度を上げても効果が小さい
 可能性もあります。

3.「原稿方向」の設定を変えてみてください。
 「横書き」の設定よりも「横書き(一段組)」、「縦書き」の設定よりも「縦書き(一段組)」の設定で
 精度があがるかどうか、お試し下さい。

4.変換対象設定>画像ファイルの変換設定>検索できるPDFの作成(OCR)
  のオプション設定にて、認識精度を選択する事が出来ます。
  高精度での設定をお試し下さい。

投稿者 hypergear : 10:12

2008年07月24日

ゾーンOCR(エリアOCR)について知りたい

特定の領域だけOCRをかけて文字情報を抽出する技術です。
用途としては、伝票やFAX、アンケートなどのヘッダ部分や
特定の意味を持つ情報の領域をスキャンして、その文字列を
ファイル名にして以後の処理をおこなうなど、 文書処理の
自動化が図れます。

>>> [ゾーンOCR(エリアOCR)詳細]

投稿者 hypergear : 20:21

検索可能なPDF(サーチャブルPDF)について知りたい

通常、コピー機などでスキャンして作成したPDFは
画像情報ですので、文字による検索ができませんが、
OCR技術により画像より認識したテキストデータを
透明な色で元の原稿と同じ位置に 貼り付けることにより、
検索が可能になり、ヒットするとその位置に移動できるよう
になります。

>>> [サーチャブルPDF詳細]

投稿者 hypergear : 20:12

高圧縮カラーPDFについて知りたい

ハイパーギアがHC-PDF(ハイパーコンパクトPDF)として
2000年から開発している特許出願中の技術です。
JPEGなどにくらべて最大で1/10程度に高圧縮された
カラーPDFを作成でき、 容易にメールで送ったり、
Webで公開できるようになります。
最近は弊社以外でも、コピー機ベンダーなどで同様の技術を
開発しており、カラー文書の電子化の方法のひとつの標準に
なりつつあります。

>>> [高圧縮PDF詳細]

投稿者 hypergear : 20:07