DocMstr 正規表現を利用した文書解析用言語 

 トランザクショナル モデリングを採用した、財務シミュレーション用言語です。発展型として、物流やその他資源の状況をストックとフローで表現するモデル体系を保有しています。会計や財務の範囲を超えた、汎用的なトランザクション記述用の言語となっています。

■文書類の統合解析のために
■システムドキュメンテーションの統合化のために
■ソフトウエア保守作業のベースラインとして
■規定、ルール等の相互関連の確認・維持のために


 利用することができます。

課題 

多様な文書類
 特定のシステム又はテーマに関する文書化の体系には、種々の文書類が含まれています。しかしながら、その体系に含まれる文書類の正確性や整合性については、
ばらつきが多く全体像を把握するのが困難になっている場合が多くあります。

不正確なドキュメント
 変更があった時の更新が的確に行われていなく、
記述内容と現状の乖離が見受けられます。

ドキュメント相互間の不整合
 各ドキュメントは、単独の記述様式を採用し、その記述作業も分業化されることが多く、
他の種類のドキュメントとの整合性を充分に保持しているものではありません。

システム全体の不明瞭化
 したがって、システムや文書体系の全体を表す設計書の内容の
正確性にはあいまいな点が多く、現状をどの程度反映したものとなっているかが、不明瞭になっています。

保守作業の困難性増大
 その中で、最も正確で、かつ現状をも正確に反映した文書として、ソフトウエア・プログラムのソースコードがあります。然し、内容は正確でも、少し大きなシステムになると、(完成直後の担当開発者は別にすれば、)
事後的に理解するのは困難になっています。これが、システムエラー発生時の対応遅れの大きな要因となっています。

ノウハウの陳腐化と死滅
 保守作業を外注化することによる、コスト削減は、一時的な(かつ表面上だけの)効果はあるものの、
システム全体の体系に関するノウハウの消滅につながることも多く、場合によってはシステムに組み込まれている競争上の優位を保つためのノウハウも維持されなくなっています。


アプローチ

 いくつかの既存の技術が、このような課題解決に対してのヒントを提供しています。

リバースエンジニアリング
 ソフトウエアのリバースエンジニアリング用ツールが、ソースコードから、より分かりやすい仕様情報を作成するために使用されています。ただし、その適用範囲は、特定のプログラミング言語を対象にしているので、全ての文書類に適応可能なものではありません。これを、
多様な文書類全体に適用できるように拡張すれば、文書解析の強力なツールとなると考えられます。

正規表現
 正規表現(Regular Expression)と言われる、文書内からの検索ルールがひろく認められ、使用されています。この表現法は、
多様な文書類からのWord検索に強力な道具となっているものの、少し複雑な条件を付けると、表現方法も複雑になり、試行や組み合わせ表現のためのツールが必要になってきます。

インタープリター
 プログラミング言語の中で、インタープリターと呼ばれるものは、ユーザが作成した命令を、解釈しながら、コンピュータ上での命令を実行するもので、通常は、汎用的なコンピュータ用言語として提供されています。汎用のものではなく、
文書解析のために利用されるインタープリターがあれば、多様な文書類に対する解析を容易にすることができると考えられます。

RDF
 RDF(Resource Description Framework)は、主として、Internet上に展開されている情報を、Webのページを基準に、それらの相互関係を記述し、その記述の下に、ネットワーク全体の相互関連を解析するために使用されています。この考え方は、 “特定情報 繋ぎ言葉 他の情報”という形式で、情報間の関係を設定するもので、このような関係情報の累積によって、システム全体の相互関連を解析しようとするものです。文書間や文書内の各Wordの関係をRDFのような考え方で、記述できれば、
文書間の相互関係が正確に記述できることになります。

エクセルの機能の活用
 報告書の作成機能として、また、必要なデータの保管手段として、さらに、保管後のデータ活用と、データ加工を容易にするという目的で、エクセルの使用は、ユーザ側に、理解と操作の容易性と言うメリットを与えます。特に、データの保管場所としての使用は、特定のDBMSに依存することが無くなるので、システム環境を単純なものとして、ソフトウエアの導入と維持を容易にします。



デザイン

処理のプロセス
 DocMstrの処理プロセスは、次の4つとなっています。

(1)正規表現による設計とテスト
 5種類(EA:除外領域、NT:Nest構造、ED:外部定義、CN:共通定義、WS:一般抽出)の試行と特定のファイルを取り上げての実験を行います。

(2)実行ルール作成
 (1)の結果をもとに実行ルールが自動作成されます。必要に応じて、ルールの加工が可能です。

(3)ルールの実行
  ファイル群全体に対しての、ルールを適応・実行します。結果は、エクセルファイルに保管されます。

(4)検索、トレース
  ルール番号が付されたエクセルファイルをデータとして読み込み、各種サーチや、抽出されたWordのトレースを実施します。必要に応じて、結果を印刷します。

処理対象の調整
 正規表現による一連の抽出結果を、特定の場合に変更・調整しなければならない事態を想定して、各種の調整方法が組み込まれています。その主な内容は下記の通りです。

・抽出領域の限定(ファイルのサフィックス、ファイル名、モジュール名、サブモジュール名による制限)
・抽出Wordのみなし変更
・抽出順序の変更
・カテゴリーの重要性変更や、トレース先の制限設定

処理結果
  処理結果は、ルール番号を付された、エクセルファイルに保存されます。各シートは、必要に応じて、ユーザが設計時に指示したカラー表示となっています。


操作画面
 処理の全体像が直観的に把握できるように、メニュー方式や、処理フロー表示方式を採用しています。




稼動条件

・Windows7以上のOS

Excelが導入済みであること。(報告書作成のために出力先として使用しています。)
・Single Userのみ(各PCへの個別導入)
・3.5GB以上のRAMが搭載されていること。(推奨)

 その他、諸条件をチェックするためにも、試供版の導入を行って機能と処理効率を確認してから、製品導入を行ってください。
試供版で作成されたデータ等は、そのまま利用することができます。




ダウンロード
二つの事前確認事項 導入前に次の二点を確認してください


(1)留意・確認事項





(2)初めての導入ではない場合
  既に、導入済みの場合で、Update又は再導入するを行う場合には、レジストリーから登録済みとなっているTramFを、事前に削除しなければなりません。
  レジストリーからの削除は、下記のように、コントロールパネル→プログラムと機能→DocMstrを選択して、アンインストール、削除を実行します。

 

 




ダウンロードの実施次に示す、試供版、通常版、Updateの指示に従ってください。

DocMstr 試供版のダウンロード
 現在β版の提供を行っています。メールアドレス発送先を下記メールアドレス先に送付していただくと、CD及び操作マニュアルを無料提供いたします。使用期限は、1年間となります。

 提供されたメールアドレス等の個人情報は、SCIとユーザの連絡の目的のみに使用し、他に使用・公開することはありません。

UserReq@system-control.net  試供品の提供を申し込みます。




DocMstr 通常版のダウンロード
 現在β版の提供を行っています。メールアドレス発送先を下記メールアドレス先に送付していただくと、CD及び操作マニュアルを無料提供いたします。使用期限は、1年間となります。

 製品版の年間使用料は、初年度が 100,000円 ($1,000)で、次年度以降は 20,000円($200)を予定しています。
 提供されたメールアドレス等の個人情報は、SCIとユーザの連絡の目的のみに使用し、他に使用・公開することはありません。

UserReq@system-control.net 製品の提供を申し込みます。



DocMstr のUpdate 既ユーザの、ソフトウエア更新は、これを使用してください。
 ユーザ側で稼動開始済みのTramFを最新版に変更します。今、稼動中である場合には、終了させてから、下記ボタンをクリックしてください。
 直ちに、更新作業が実施されます。この時に、使用中のデータが変わることはありません。

 二つの確認事項の(2)に従って、レジストリーからの削除を実施した後に[Update]をクリックしてください。

 途中、画面の下方に、次のようなメッセージが出ますので
[ファイルを開く]をクリックしてください。



[ファイルを開く]
をクリックしてください。



このような画面に変わりますから、[setup.exe]ダブルクリックしてください。実行が開始されます。場合によっては次のような画面が表示されます。



保護のために、確認メッセージが表示されます。
[はい]をクリックしてください。 インストールが始まります。



[OK]
をクリックします。



再度、確認メッセージが表示されます。
[実行]をクリックします。



[インストール]をクリックしてください。

更新版が導入されて、初期画面が表示されます。

下のロゴをクリックすると、更新プロセスが開始されます。

Update  左側の[DocMstr Update]をクリックすることにより、TramFソフトウエアの更新を行います。



研究者及び学生の方へ
 現在β版の提供を行っています。メールアドレスと発送先を下記メールアドレス先に送付していただくと、CD及び操作マニュアルを無料提供いたします。使用期限は、4年間となります。メールでの申し入れ時に、学生証コピーまたは、身分が分かる証明書コピーを添付してください。
 研究者とは、教育機関に在籍する方及び、非営利の研究機関に所属する方を言います。又、学生は、短大以上の大学院までの学生を言います。
 提供されたメールアドレス等の個人情報は、SCIとユーザの連絡の目的のみに使用し、他に使用・公開することはありません。

UserReq@system-control.net



SCIのサービス提供

システムコントロール イニシャティブ(株)は、DocMstr に関して、次のようなサービスを提供します。

■DocMstrの使用権の提供/保守(年間使用許諾契約を取り交わします。) (企業向け、個人向け、研究者/学生向け)

■DocMstrを使用した、特定文書類の解析ルール作成、援助

大規模な文書解析システムの構築、サポート

■コンサルティング ファームに対する、使用権許諾及び援助

ノウハウ提供

教育