2010年03月12日
拡張子 .jpe のJPEGファイル変換について
拡張子 .jpe のJPEGファイルは、Windowsに関連付けされて
いるアプリケーションの印刷機能利用して変換を行う必要が
御座います。
.jpeの拡張子を、印刷時に対話の操作が必要ない任意の
アプリケーションに関連付けし変換を行って下さい。
なお、関れ付けの方法は次のFAQを御参考下さい。
【MSオフィス文書以外のアプリを変換したい】
http://www.hypergear.com/mt/support/FAQ/psv5/archives/2008/07/post_56.html
投稿者 hypergear : 10:37
TIFFファイルだけ自動印刷ができない
Word/Excel/PowerPoint以外のファイルは、Windowsに関連付けされて
いるアプリケーションで印刷を行います。
拡張子に関連付けたアプリケーションを使用して、Windows標準の外部
からの印刷実行機能(エクスプローラでファイルを選択>右クリック>印刷
にて印刷する機能)を使用して印刷するため、ウィザード画面が出てしまう
ようなアプリケーションに関連付けされております場合には、応答できず
印刷エラーとなります。
TIFFファイルを、印刷時に対話の操作が必要ないアプリケーションに関連
付けしてください。
なお、関れ付けの方法は次のFAQを御参考下さい。
【MSオフィス文書以外のアプリを変換したい】
http://www.hypergear.com/mt/support/FAQ/psv5/archives/2008/07/post_56.html
投稿者 hypergear : 10:30
2008年07月30日
高圧縮PDFにならない
高圧縮の対象になるのは、カラーの画像データのみです。
モノクロ、アプリケーションデータは対象になりません。
投稿者 hypergear : 13:04
Windowsエクスプローラの検索にヒットしない
1. OCRの詳細設定画面で「Windowsエクスプローラ検索機能向けテキストを埋め込む」
がチェックされていますか?
変換対象設定>画像ファイルの変換設定>検索できるPDFの作成(OCR)の
オプションにて設定して下さい。
2. セキュリティはかかっていませんか?
セキュリティのかけられたPDFは文書が暗号化されるため、検索できません。
3. レジストリの更新スクリプトは実行されていますか?(WindowsXP, 2003, Vista)
PscanServインストールフォルダにある、pdfsearch.regを検索を行う各クライアントで実行し、
コンピュータを再起動してください。
投稿者 hypergear : 11:59
OCRエリア認識結果がCSVに出力されない
1. 「CSVファイル」にて「CSVファイルに出力する」にチェックが入っていますか?
出力先設定>出力データ形式>CSVファイルにチェックをし、
出力項目設定にて、OCRエリア認識結果を設定して下さい。
2.変換後のPDFで、指定したエリアにOCRがかかっていますか?
変換後データを開き、文字選択ツールを選択し、エリア指定箇所をクリック
してみて下さい。OCR文字が選択されなければ、正常にOCRがかかっていません。
投稿者 hypergear : 11:58 | コメント (13)
OCR認識による自動正立/傾き補正
OCR認識による自動正立/傾き補正機能は、OCRエンジン
を使用し、原稿の上下の情報を判定する機能でございます。
そのため、特に文字数の少ない原稿など、OCRエンジンが
上下の認識を誤った場合、正しく自動正立/傾き補正が
できない場合がございます。
漢数字の「一」や数字の「1」の様な縦横の判別が困難な文字を
除き、100文字程度の文字数が自動正立判定の目安となり、
取得した文字単位に方向の妥当性をチェックし、得られた文字
回転情報を基に原稿全体の回転角を確定する仕組みとなります。
判定対象の文字情報としては、次の条件を満たしている必要が
ございます。
1) 取得文字サイズの縦横比率が50%以上、200%未満のもの。
※上記の「一」や「1」はこの条件から外れます。
2) 文字サイズが20ピクセル以上であるもの。
※「・」や「,」など文字サイズとして小さい文字は
この条件から外れる可能性が高くなります。
目安としては文字の占める割合が3割以上であるほうが、精度が
よくなります。
また、傾き補正機能は最大プラスマイナス5度以内の補正になります。
投稿者 hypergear : 11:56
OCRエリア設定のプレビュー画面に表示できない
プレビューができるのは、TIFF(G4), とJPEGのみになります。
その他のPDF等のファイル形式はプレビューできません。
投稿者 hypergear : 11:56
Windows検索用テキストがないPDFをWindowsで検索したい
Windows検索用テキストがないPDFでも、OCRテキスト付のPDFは、
Acrobatでの検索、Windowsのインデックスサービス、その他文書管理
ソフトなど、通常のテキスト付PDFファイルを検索できる方法であれば、
どのような方法でも全文検索することができます。
Windows検索用テキスト機能は、これらの検索に加え、PDFのようなバイナリデータを
検索できないエクスプローラでも検索できるようにするものです。
投稿者 hypergear : 11:54
Windows検索用テキスト付のPDFについて知りたい
Windowsエクスプローラの検索機能を使用して、検索できるPDFです。
通常Windowsのエクスプローラでは、PDFなどのオフィス文書以外の
バイナリデータを検索することはできませんが、Windows検索用テキスト付き
のPDFであればエクスプローラの検索でもヒットします。
※検索を行う各クライアントで、レジストリの更新が必要です。
投稿者 hypergear : 11:52
どのようなデータにOCRがかかるかを知りたい
画像データです。
TIFF, JPEG, およびスキャナから取り込んで作成されたPDF, XDWです。
アプリケーションファイルや、LZW, JBIG(※)など対応していない圧縮形式の画像にはかかりません。
※Acrobat6.0以上を使用して、スキャナから取り込んだ場合、
設定によっては作成される場合があります。
その場合、次の点を設定します。
Acrobat6.0:「コンテンツに合わせた圧縮」をオフにします。
Acrobat7.0:モノクロ画像の圧縮形式をG4にします。
※PDFにはWORD等のアプリケーションファイルから作成されたものなど、多様な形式がありますが、
スキャニングによる画像のPDFであるかどうか確認することが難しい場合もあります。
OCR処理等の画像処理が目的の場合、TIFF等の画像でスキャンすることをご検討いただいた方が、
運用上の問題が軽減されるケースがございます。
投稿者 hypergear : 11:50
OCRの認識結果をテキストファイルに出力したい
認識結果をテキストファイル(.TXT)や、HTMLファイルに出力することができます。
テキストファイルには認識結果の文字列が、HTMLファイルには位置情報をもった
認識結果の文字列が出力されます。
このHTMLファイルを開きますと、変換対象の原稿とほぼ同じレイアウトで表示されます。
投稿者 hypergear : 11:49
OCRテキストを校正したい(Netscape7.0使用)
HTMLの編集のみ(Acrobat不要)な校正方法です。
1.PscanServでOCR結果をHTML形式に出力します。
2.HTMLをNetscape7.0以上で校正します。
3.PscanServで校正後のHTMLと変換元原稿を再合成します。
※【重要】 Netscapeの設定で、「元のHTMLソースをそのまま維持する」を選択します。
「再フォーマットする」にすると、正しく合成できません。HTMLの定義は広汎にわたりますので
PscanServの作成するHTML形式のみに対応しております。同じ理由で、ホームページ
作成ソフト等でHTMLを校正することはできません。
投稿者 hypergear : 11:34
OCRテキストを校正したい(Acrobat6.0以上使用)
Acrobat6.0以上を使用すると、次のような方法で簡単にテキストを校正することができます。
1.下記を設定し、OCRをかけます。
・OCR処理
・レイヤーテキスト
・文字色:黒
・認識信頼度が低い文字:赤
2.Acrobat6.0以上でファイルを開きます。
(Adobe Readerでは編集できません。また、可能であればAcrobat7.0以上をご選択ください。
どちらでも同様の校正ができますが、7.0の方が、テキストを選択する場合の操作性が良いためです。)
3.ウィンドウの分割機能(ウィンドウメニュー>分割)機能を利用してウィンドウを2つに分割し、
一方に文書のレイヤーを、もう一方にOCRテキストのレイヤーを表示させます。
4.3の画面で見比べながら、タッチアップテキストツールで誤認識部分を校正します。
(誤認識である可能性が高い部分が赤文字で表示されますので、赤文字部分を中心にチェックします)
5.修正後のPDFがレイヤーなしである方が良い場合、下記を設定しPscanServで再変換します。
※この項目を実行しなくても検索には影響を与えません。
・OCR処理のチェックを外します。
・レイヤーの設定を解除します。
・埋め込まれたOCR認識文字の色をすべて透明にするを選択します
投稿者 hypergear : 11:33
2008年07月25日
どのような方法で検索できるかを知りたい
Acrobatを使用しての検索の他、Windowsのインデックスサービスや、その他文書管理ソフトなど、
通常のテキスト付PDFファイルを検索できる方法であればどのような方法でも、全文検索することができます。
投稿者 hypergear : 10:13
認識精度を上げたい
通常の綺麗な状態の原稿であれば、多くの場合高いOCR結果が得られますが、CR処理の性質上、
原稿によりましては認識精度が悪い場合も考えられます。そのような場合、次の項目などをご参考
いただき、設定を調整してください。
1.なるべく原稿にあった設定を行います。
原稿方向・認識言語は、自動認識させることも可能ですが混在しない原稿が対象の場合、
明示的に横書き/縦書きあるいは日本語/英語を選択します。
2.可能な限り綺麗な状態で画像を作成してください。
高性能なOCRエンジンを使用しておりますので、およそ200DPIくらいの原稿でも、比較的高い
認識を行うことができますが、解像度を上げるなど、可能な限り綺麗な状態で原稿を作成してしてください。
FAX原稿のように、すでに文字がつぶれてしまっている場合などは、解像度を上げても効果が小さい
可能性もあります。
3.「原稿方向」の設定を変えてみてください。
「横書き」の設定よりも「横書き(一段組)」、「縦書き」の設定よりも「縦書き(一段組)」の設定で
精度があがるかどうか、お試し下さい。
4.変換対象設定>画像ファイルの変換設定>検索できるPDFの作成(OCR)
のオプション設定にて、認識精度を選択する事が出来ます。
高精度での設定をお試し下さい。
投稿者 hypergear : 10:12
2008年07月24日
ゾーンOCR(エリアOCR)について知りたい
特定の領域だけOCRをかけて文字情報を抽出する技術です。
用途としては、伝票やFAX、アンケートなどのヘッダ部分や
特定の意味を持つ情報の領域をスキャンして、その文字列を
ファイル名にして以後の処理をおこなうなど、 文書処理の
自動化が図れます。
投稿者 hypergear : 20:21
検索可能なPDF(サーチャブルPDF)について知りたい
通常、コピー機などでスキャンして作成したPDFは
画像情報ですので、文字による検索ができませんが、
OCR技術により画像より認識したテキストデータを
透明な色で元の原稿と同じ位置に 貼り付けることにより、
検索が可能になり、ヒットするとその位置に移動できるよう
になります。
投稿者 hypergear : 20:12
高圧縮カラーPDFについて知りたい
ハイパーギアがHC-PDF(ハイパーコンパクトPDF)として
2000年から開発している特許出願中の技術です。
JPEGなどにくらべて最大で1/10程度に高圧縮された
カラーPDFを作成でき、 容易にメールで送ったり、
Webで公開できるようになります。
最近は弊社以外でも、コピー機ベンダーなどで同様の技術を
開発しており、カラー文書の電子化の方法のひとつの標準に
なりつつあります。
投稿者 hypergear : 20:07