第7章

特殊な検索を実行するためのDynamic Reasoning Engineの設定

この章では、exteNd Director DRE (Dynamic Reasoning Engine)を設定して、特殊な検索タスクを実行する方法について説明します。

この章では、次のトピックについて説明します。

 
Top of page

数値の検索

この節では、DRE環境設定ファイルを使用して数値検索を有効にする方法について説明します。

Procedure 数値検索を有効にする

  1. テキストエディタで、DRE環境設定ファイルDirectorDRE.cfgを開きます。このファイルは、exteNd Directorインストールディレクトリのautonomy\\engineにあります。

  2. パラメータINDEXNUMBERS=1を設定します。

    注記:   このパラメータがない場合は、ファイルに追加してください。

  3. パラメータDONTINDEXNUMBERS=1を削除します。

  4. 環境設定ファイルを保存して閉じます。

  5. DREのリセットで説明されているように、DREをリセットします。

  6. プログラムを使用した例で説明されているように、データのインデックスを再作成します。

 
Top of page

他の言語での検索

この節では、マルチバイト文字セット(MBCS)を使用する言語など、その他の言語のDREを設定する方法について説明します。デフォルトでは、DREは、英語データを処理するように設定されています。

Procedure 他の言語で検索する

  1. 次のMBCSおよびその他のバイナリ形式のインポートで説明されているように、検索環境を設定してマルチバイト文字セット(MBCS)およびその他のバイナリ形式をインポートします。

  2. 言語固有の設定パラメータの変更で説明されているように、言語固有設定パラメータを設定します。

  3. (オプション) センテンス分割ファイルの提供(オプション)で説明されているように、DREのあるディレクトリにセンテンス分割ファイルをコピーします。

  4. DREのリセットで説明されているように、DREをリセットします。

  5. インデックス作成の強制実行で説明されているように、データのインデックスを再作成します。

 
Top of section

MBCSおよびその他のバイナリ形式のインポート

この節では、検索環境を設定してマルチバイト文字セット(MBCS)およびその他のバイナリ形式をインポートする方法について説明します。

MBCSサポートを有効にするには、Autonomy Omnislaveを設定します。Autonomy Omnislaveは、DREでインデックス作成を実行できるようにバイナリファイル形式のデータを変換するプラグインモジュールです。

Omnislave環境設定ファイルはomnislave.cfgと呼ばれ、exteNd Directorインストールディレクトリのautonomy\\OmniSlavesにあります。omnislave.cfg fileファイルに含まれる2種類のセクションは、次のとおりです。

セクションタイプ

説明

[CONFIGURATION]

この下に表示されるすべての[<file_format>]セクションに適用される汎用設定を提供します。

[<file_format>]

OmniSlavesで抽出する特定のファイル形式の設定を定義します。

次の例では、形式はWord、RTF、およびMicrosoft PowerPointファイル用に定義されています。

  [Configuration]
  OmniConvertExtns0=*.doc
  OmniConvertLibraryCsvs0=wpconvdll.dll,wordconv.dll,rtfconv.dll
  OmniConvertConfigSectionCsvs0=WordPerfect,MSWord,Rtf
  OmniConvertExtns1=*.rtf
  OmniConvertLibraryCsvs1=rtfconv.dll
  OmniConvertConfigSectionCsvs1=Rtf
  OmniConvertExtns2=*.ppt
  OmniConvertLibraryCsvs2=pptconv.dll
  OmniConvertConfigSectionCsvs2=Ppt
  
  Logging=0
  LogAppend=TRUE
  LogMaxKBytes=500
  
  [MSWord]
  OutputCharSet=ASCII
  
  [Rtf]
  
  [Ppt]
  OutputCharSet=ASCII
  StopList=pptconv.dat

Procedure MBCSおよびその他のバイナリ形式サポートを有効にする

  1. 使い慣れたテキストエディタでomnislave.cfgを開きます。

  2. Omnislaveでインデックス作成のために変換する各ファイル形式に対して、[<file_format>]セクションを作成します。

  3. 各[<file_format>]セクションで、パラメータOutputCharSetを追加して、ファイル形式の変換後の文字セットに設定します。

    次のいずれかの文字セット定数を選択します。

    たとえば、繁体字中国語でWordドキュメントを検索する場合、次のコード行をOmnislave環境設定ファイルの該当する[CONFIGURATION]セクション下に追加します。

      [MSWord]
      OutputCharSet=CHINESETRADITIONAL
    

 
Top of section

言語固有の設定パラメータの変更

DRE環境設定ファイルDirectorDRE.cfgで言語固有の検索パラメータを変更します。このファイルは、exteNd Directorインストールディレクトリのautonomy\\engine\\にあります。

Procedure DREで言語固有パラメータを変更する

  1. 使い慣れたテキストエディタでDirectorDRE.cfgを開きます。

  2. CharConvをDREで使用する言語に設定します。

    言語

    ヨーロッパ言語

    0 (デフォルト)

    日本語

    1

    韓国語

    2

    中国語(簡体字)

    4

    中国語(繁体字)

    5

    中国語(簡体字)としてインデックスが作成された中国語(繁体字)

    6

    東ヨーロッパ言語

    7

    ロシア語WINANSI

    8

    ロシア語KO18

    9

    ヘブライ語

    10

    ギリシャ語

    11

    スウェーデン語

    12

  3. TermSizeパラメータを設定して、DREの任意の用語の最大文字数を指定します。

    言語

    英語およびヨーロッパ言語

    10 (デフォルト)

    ドイツ語

    30

    日本語

    30

    韓国語

    40

  4. (オプション) StripLanguageパラメータを設定して、単語をステムにストリップする(たとえば、runningをrunに)場合に使用する言語を選択します。

    オプション

    英語

    0

    イギリス英語からアメリカ英語への変換

    1

    ストリッピングなし

    2

    ドイツ語

    3

    イタリア語

    4

    ロシア語

    5

    高度な英語

    6

    スペイン語

    7

    オランダ語

    8

    高度なドイツ語

    9

    フランス語

    10

    ギリシャ語

    11

    スウェーデン語

    12

    デンマーク語

    13

    ポルトガル語

    14

    高度なスペイン語

    15

    ノルウェー語

    16

    注記:   可能な場合、英語(6)およびドイツ語(9)の詳細設定を使用します。例外:コンテンツのインデックスをDREに作成したときに、StripLanguageを0か1(英語)または3(ドイツ語)を設定した場合、クエリをDREに送信する場合にも同じ設定を使用する必要があります。

 
Top of section

センテンス分割ファイルの提供(オプション)

単語がスペースで分割されていない言語を使用する場合、適切な区切り記号を指定する必要があります。exteNd Directorは、製品CDに言語固有のセンテンス分割ファイルを提供しています。このファイルは、DREのあるディレクトリ(exteNd Directorインストールディレクトリのautonomy\\engine)にコピーする必要があります。次の節では、単語をスペースで区切らない言語に設定する必要があるセンテンス分割ファイルおよび関連DRE設定について説明します。

中国語(繁体字)

必要なセンテンス分割ファイルは、次のとおりです。

プラットフォーム

センテンス分割ファイル

CDのディレクトリ

NT

  • chinesebreaking.dll

  • big5togb.txt

  • wordlist.txt

  • chineseconvlist.txt

Autonomy\MBCS\chinese_nt_1_0_3.zip

UNIX

  • chinesebreaking.so

  • big5togb.txt

  • wordlist.txt

  • chineseconvlist.txt

Autonomy/MBCS/chinese_aix_1_0_2.tar.Z

Autonomy/MBCS/chinese_hpux11_1_0_3.tar.Z

Autonomy/MBCS/chinese_solaris_1_0_3.tar.Z

必要な言語固有設定は、次のとおりです。

DRE環境設定パラメータ

CharConv

5

TermSize

40

StripLanguage

2

中国語(簡体字)

必要なセンテンス分割ファイルは、次のとおりです。

プラットフォーム

センテンス分割ファイル

CDのディレクトリ

NT

  • chinesebreaking.dll

  • big5togb.txt

  • wordlist.txt

  • chineseconvlist.txt

Autonomy\MBCS\chinese_nt_1_0_3.zip

UNIX

  • chinesebreaking.so

  • big5togb.txt

  • wordlist.txt

  • chineseconvlist.txt

Autonomy/MBCS/chinese_aix_1_0_2.tar.Z

Autonomy/MBCS/chinese_hpux11_1_0_3.tar.Z

Autonomy/MBCS/chinese_solaris_1_0_3.tar.Z

必要な言語固有設定は、次のとおりです。

DRE環境設定パラメータ

CharConv

4

TermSize

40

StripLanguage

2

日本語

必要なセンテンス分割ファイルは、次のとおりです。

プラットフォーム

センテンス分割ファイル

CDのディレクトリ

NT

  • japanesebreaking.dll

  • \dic\tag.attr

  • \dic\tag.counter

  • \dic\tag.index

  • \dic\tag.mrph

  • \dic\tag.string

  • \dic\tag.table

  • jtag.dll

  • jtag.ini

  • jtag_at.dll

  • japaneseconvlist.txt

Autonomy\MBCS\japanese_nt_2_0_5.zip

UNIX

  • japanesebreaking.sl

  • /dic/system/jtag.attr

  • /dic/system/jtag.hash

  • /dic/system/jtag.id

  • /dic/system/jtag.mrph

  • /dic/system/jtag.offset

  • /dic/system/jtag.table

  • /dic/system/jtag.trie

  • jtag.ini

  • libcodeconv.sl

  • libjtag_at.sl

  • libjtag.sl

  • japaneseconvlist.txt

Autonomy/MBCS/japanese_aix_2_0_5.tar.Z

Autonomy/MBCS/japanese_hpux11_2_0_5.tar.Z

Autonomy/MBCS/japanese_solaris_2_0_5.tar.Z

必要な言語固有設定は、次のとおりです。

DRE環境設定パラメータ

CharConv

1

TermSize

30

StripLanguage

2

韓国語

必要なセンテンス分割ファイルは、次のとおりです。

プラットフォーム

センテンス分割ファイル

CDのディレクトリ

NT

  • koreanbreaking.dll

  • koreanconvlist.txt

  • Koma.dll

  • HanTag.dll

  • main.dat

  • prob.dat

  • main.fst

  • prob.fst

  • pos.nam

  • tag.nam

  • tagout.nam

  • connection.txt

  • stopposnam.txt

  • tagname.txt

Autonomy\MBCS\korean_nt_1_0_1.zip

UNIX

  • koreanbreaking.so

  • koreanconvlist.txt

  • main.dat

  • prob.dat

  • main.fst

  • prob.fst

  • pos.nam

  • tag.nam

  • tagout.nam

  • connection.txt

  • stopposnam.txt

  • tagname.txt

Autonomy/MBCS/korean_aix_1_0_1.tar.Z

Autonomy/MBCS/korean_hpux11_1_0_1.tar.Z

Autonomy/MBCS/korean_solaris_1_0_1.tar.Z

必要な言語固有設定は、次のとおりです。

DRE環境設定パラメータ

CharConv

2

TermSize

40

StripLanguage

2



Copyright © 2004 Novell, Inc. All rights reserved. Copyright © 1997, 1998, 1999, 2000, 2001, 2002, 2003 SilverStream Software, LLC. All rights reserved.  more ...