HG/PscanServ 2.7     製品カタログ  カタログPDF  新機能詳細  画面詳細  Q&A  お問い合わせ
新バージョン PscanServ2.7 機能詳細 
高機能OCR付きPDFイメージ変換サーバ ニュースリリース ジャストシステムConceptBaseとの連携
 読み取った紙文書や、各種画像データをテキスト付PDFに自動変換
 

  HG/PscanServ ver.2.7は、大量の各種モノクロ、カラーの画像ファイルから、検索可能なテキスト付PDFを自動生成する事が出来ます。また、PDF生成を行う「監視ディレクトリ」は、ネットワーク上のクライアントPCに無制限に設定する事ができ、サーバ的に運用する事が可能です。これにより1台のサーバーPCだけで、各クライアントPCに変換ソフトを導入する必要がなく効率的なシステム構築が出来ます。また、生成されたPDFファイルは、透明にして埋め込まれたテキストデータにより、各種の知識管理システム、文書管理システム等で全文検索、自然分検索等が可能になるほか、必要なテキストデータをマウス操作のみで取出して、再利用する事も可能です。

これにより、これまで活用が難しかった、企業資産である大量の紙文書を、検索可能な電子化文書として活用することが出来ます。
 


     
特長    


紙文書電子化の新しいコンセプト
 これまで、紙の文書を全文検索可能な電子ドキュメントにする場合には、日本語OCR等を使用してテキスト化する必要がありました。しかし
1) 日本語OCRソフトを使うと誤認識が 
  発生し、修正に時間と手間(コスト)がかかる。
2) ページレイアウトの情報が無くなる
  ので、原本の再現性に欠ける。
等といった不満がありました。

これに対し、HG/PscanServでは、OCRにより位置情報を持ったテキストデータを透明にして張りつけたPDFイメージを自動生成しますので、誤認識個所の校正や修正をすることなく、原本性を保持したイメージデータを簡単に取得することが出来ます。


 

 

主な新機能

テキスト修正機能
PDFに埋め込まれたテキストデータはXHTML(XML)ファイルとして位置情報を含め出力し、OCRの誤認識箇所を修正して再合成することができます。

バッチしおり設定抽出機能
あらかじめ作成したCSVデータからしおりを自動生成することができます。また、すでに設定されたしおり情報をCSVで抽出し、編集、再設定が可能です。

OCR自動しおり設定機能
PDF生成と同時にOCR処理により、タイトルを含めたしおりの自動設定が可能です。

出力先ディレクトリ自動作成機能
監視ディレクトリとして設定されたサブディレクトリと同一名称のディレクトリを自動作成して、変換後のPDFファイルを保存することができます。また出力先ディレクトリ名として、変換対象ファイル名の一部を使用することも可能です。これにより、ネットワーク環境でのデータ連携がさらに強化でき、スキャンからテキスト付きPDFへの変換、データベースへの登録など、一連の処理の自動化を図ることができま
す。

監視ディレクトリを機能強化
・ PDFを生成する「監視ディレクトリ」は、サブディレクトリを含めネットワーク上に無制限に設定できます。機能UP
・各々の監視ディレクトリのジョブ名を、自
 由に設定できますので作業内容の管理が容易になります。NEW
・ジョブ設定済の「監視ディレクトリ」の処
 理のON/OFFを、自由に設定できるので、効 率的な運用できます。機能UP

柔軟なフィル名自動設定機能
・生成されたファイル名の設定は「変換元
 ファイル名」の他、「自動連番」「変換日時」 等が選択できます。機能UP
 また、OCRにより取得したテキストデータ の指定行から、任意の文字をファイル名と する事も出来ます。NEW

 

  
イメージも検索可能に!
 

 

 
高機能OCRによるテキスト埋め込み機能

・OCRにて抽出したテキストを、元原稿と同じ文字位置に透明にPDFに貼り付けます。このテキストデータをもとに全文検索が可能になります。(*カラー、モノクロともA3まで対象)


・従来の「日本語」「英語」モードに加え、「自動認識モード」を 追加しました。同一ページ内で、日本語と英語の段組が混在 する原稿でOCR精度の向上が図れます。

・ページ内の2箇所にOCR処理を行う認識エリアを指定できま す。伝票番号や図面の図枠内のみ認識する等の設定が可能です。

・認識対象とする文字種の指定が可能です。これにより、例えば価格表やパーツリスト等で、英字、数字に限定する事で認識精度を向上させる事ができます。

・PDF生成時に、OCR処理を実行するページを任意に指定できます。これにより、ファイル中の全ページをOCR処理する必要 がなく、トータルの変換処理時間を大幅に削減できます。 機能UP

・OCR抽出されたテキストデータは、PDFに埋め込む他、テキストファイルとして出力することも可能です。

   
OCRテキストの修正、編集機能    

 
 



 

 

・PDFに埋め込まれたテキストデータは、XHTML(XML)ファイル での出力ができますので、Netscape Communicator(ver.4.7以降)で修正して、PDFに再合成する事ができます。NEW(図7)

*Netscape Communicator(ver.4.7以降)は無償で入手できます。

http://home.netscape.com/ja/download/index.html



     
高付加価値PDFを簡単に作れます!    



PDF変換時にOCRでしおりタイトル自動抽出

 

 

 
付加価値を高めるユーティリティオプション群
 
しおり自動設定、抽出機能を搭載

・しおりのページ番号、階層、タイトルをMS-Excelやエディタ 等で作成し、あらかじめCSV形式で保存しておくだけで、PDF 生成時にしおりが設定できます。NEW

・OCRにより抽出された文字列をしおりのタイトルとして自動挿入する事も可能です。NEW

・しおりのタイトルをテキストデータとして、PDFの対象ページ に埋め込むことができます。これにより、しおりタイトルを 全文検索対象とする事ができます。NEW

・PDFにあらかじめ設定されているしおりデータを、CSVファイルとして抽出し、MS-Excelやエディタ等で修正、編集してから、再合成することも出来ます。NEW

ページ表示設定機能
・ 紙文書や画像データ等、多様なデータソースから生成されたPDFの文書情報や、オープン表示設定等の統一を図るのは大変手間のかかる作業ですが、これらを自動的に設定する「ページ表示設定機能」を搭載しています。また、この他、電子文書として出版するのに有効なヘッタやフッタの設定、ノンブル(ページ番号)の自動設定、ウォータマーク等の設定も、PDF生成と同時に行う事ができます。NEW

有効期限設定機能
・PDFファイルに、自動的にJavaScriptプログラムを埋め込むことにより、PCの日付情報をチェックして、PDFファイルの開閉 情報を制限する「有効期限設定」を、PDF生成と同時に行うこ とが出来ます。NEW

・有効期限が設定されたPDFは、設定された期限後にオープンしようとすると警告ダイアログを表示したり、ページを非表示にしたりする事ができます。NEW

・また、日付による制限の他、「設定されているURLからのみ閲覧可能」とし、ユーザーがPCにダウンロードして閲覧することを制限する等の設定も可能です。NEW

     
多彩なファイル処理機能    
      

 

PDF変換機能を強化  
・同一監視ディレクトリに、複数のファイルタイプ(*.tif、*.jpg 等)を変換対象として設定できます。またそれらのファイルをPDF変換時にファイル結合することができます。機能UP
これにより、カラーページとモノクロページを含むドキュメントを1つのPDFに一括生成でき、しかも全てのページを対象に全 文検索を行う等の運用が可能になります。

・直ちに変換可能な「変換実行」ボタンを装備した事により、あらかじめ用意した大量の画像データを、必要な時にバッチ的に 処理してテキスト付PDFを生成することもできます。NEW

画像自動補正機能を強化  
・「画像自動正立機能」を新たに搭載し、縦方向、横方向の原稿が混在した原稿も、自動的に用紙方向を修正してテキスト付PDFを生成しますので、効率的な作業ができます。NEW

・「画像傾き補正機能」の搭載により、傾きのある画像データから も精度の高いテキストデータ付PDFの作成が可能です。NEW

・OCR処理後の画像データサイズを、元画像の25%,50%へ解像度を 間引きして保存することが出来ます、これにより400dpi等の高 解像度でスキャンしたカラーデータも、OCRの認識精度を低下さ せることなくコンパクトなファイルサイズで保存できます。

ファイル自動分割機能
・あらかじめセパレータ(仕切紙)を差込んでスキャンしたファイルを自動分割して複数のPDFを生成する事が出来ます。セパレータにキーとなる文字やバーコードを印字しておく事で、印 字した文字やバーコードを認識してファイル名や文書情報のタ イトルとして取込む事も可能です。機能UP

・白紙用紙を、セパレータとして利用する機能を追加。機能UP 

その他
・用紙サイズの混在に対応
・HG/PscanServ ver.2.7を、Windowsのスタートアップに登録しておく事により、PCの起動時の自動実行が可能。NEW

・処理中の実行ログや処理結果のログファイルを詳細に表示する 事が可能。機能UP

・PDFのほか、TIFFファイルの出力も可能。NEW

      
ソフトウエア仕様    
 

 

 

動作確認済ネットワークデジタル複合機(TlFF/JPEG出力)
・富士ゼロックスDocuCenter450CP/DC1250CPなど
・キヤノンMEDIO iR3250
・リコーimagioシリーズ (リモートスキャンLT使用)

動作確認済ネットワークスキャナ
エプソン ネットワークスキャニングボックスESNSB1
     サポートスキャナES8500/ES9000H/ES6000H/ES2200
リコー  IPSiO SCAN 3000DC

動作環境
・ハードウエア:IBMDOS/V互換機
・CPU:Pentium500MHz 以上推奨
・RAM:128MB以上推奨(カラーの場合 256MB以上)
・DISC:システムとして30MB、ワークエリアとして100MB以上推奨。
・O/S:Windows98/2000/NT4.0SP3.0以上
   (Windows95はサポートされていません)

ソフトウェア仕様
・対応用紙サイズ 2A0まで(カラーはA3まで)

変換元対象イメージフォーマット
・TIFF モノクロ:非圧縮、G4/G3圧縮(シングル/マルチページ)
カラー :非圧縮、PackBit圧縮(シングル/マルチページ)
グレースケール:非圧縮(シングル/マルチページ)
 注) LZW圧縮には対応しておりません
・JPEGベースライン(24ビットカラー、8ビットグレー)
・XDW、XBD(DocuWorksフォーマット)
 注) 別途 富士ゼロックス製ソフト「DocuWorks」が必要です
・エプソンサーバスキャンフォーマット
・PDF モノクロ   :G4圧縮
 注) カラーデータには対応しておりません

変換するPDFフォーマット
・PDF1.2/1.3(選択可能)  MMR(G4)/DCT(JPEG)
・OCR処理時はテキストレイヤーとして貼り付け(A3サイズまで)

OCRの設定
・日本語、英語モード、自動認識モード選択
・文字種指定機能(数字、英字、記号など)
・文字色指定機能(透明、青、赤など)
・認識エリア指定機能
・認識結果をテキストファイルとして出力が可能
<制限>
・カラーデータの場合文字色が、黒、青などの背景色より濃い色の
 文字に対してのみOCR処理が可能です。
・背景に対する白抜き文字は、OCR処理されません。
・A3/600dpiまでOCR処理が可能です。

その他、PDF変換時オプション
・画像回転(0,90,180,270度,画像自動成立)など

価格
HG/PscanServ (HG/PscanOCRを含む)  445,000円
* 上記価格は消費税は含まれておりません。
* 上記価格には初年度のサポート費用も含まれます。 

ご発注番号 HG450−WT Windows98/Me/2000/NT4.0用

(C)Copyright 2001  HyperGEAR Co., Ltd  All right reserved.