![]() ![]() ![]() ![]() ![]() ![]() | ![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
第7章
この章では、exteNd Director DRE (Dynamic Reasoning Engine)を設定して、特殊な検索タスクを実行する方法について説明します。
この章では、次のトピックについて説明します。
この節では、DRE環境設定ファイルを使用して数値検索を有効にする方法について説明します。
テキストエディタで、DRE環境設定ファイルDirectorDRE.cfgを開きます。このファイルは、exteNd Directorインストールディレクトリのautonomy\\engineにあります。
注記: このパラメータがない場合は、ファイルに追加してください。
DREのリセットで説明されているように、DREをリセットします。
プログラムを使用した例で説明されているように、データのインデックスを再作成します。
この節では、マルチバイト文字セット(MBCS)を使用する言語など、その他の言語のDREを設定する方法について説明します。デフォルトでは、DREは、英語データを処理するように設定されています。
次のMBCSおよびその他のバイナリ形式のインポートで説明されているように、検索環境を設定してマルチバイト文字セット(MBCS)およびその他のバイナリ形式をインポートします。
言語固有の設定パラメータの変更で説明されているように、言語固有設定パラメータを設定します。
(オプション) センテンス分割ファイルの提供(オプション)で説明されているように、DREのあるディレクトリにセンテンス分割ファイルをコピーします。
DREのリセットで説明されているように、DREをリセットします。
インデックス作成の強制実行で説明されているように、データのインデックスを再作成します。
この節では、検索環境を設定してマルチバイト文字セット(MBCS)およびその他のバイナリ形式をインポートする方法について説明します。
MBCSサポートを有効にするには、Autonomy Omnislaveを設定します。Autonomy Omnislaveは、DREでインデックス作成を実行できるようにバイナリファイル形式のデータを変換するプラグインモジュールです。
Omnislave環境設定ファイルはomnislave.cfgと呼ばれ、exteNd Directorインストールディレクトリのautonomy\\OmniSlavesにあります。omnislave.cfg fileファイルに含まれる2種類のセクションは、次のとおりです。
セクションタイプ |
説明 |
---|---|
[CONFIGURATION] |
この下に表示されるすべての[<file_format>]セクションに適用される汎用設定を提供します。 |
[<file_format>] |
OmniSlavesで抽出する特定のファイル形式の設定を定義します。 |
次の例では、形式はWord、RTF、およびMicrosoft PowerPointファイル用に定義されています。
[Configuration] OmniConvertExtns0=*.doc OmniConvertLibraryCsvs0=wpconvdll.dll,wordconv.dll,rtfconv.dll OmniConvertConfigSectionCsvs0=WordPerfect,MSWord,Rtf OmniConvertExtns1=*.rtf OmniConvertLibraryCsvs1=rtfconv.dll OmniConvertConfigSectionCsvs1=Rtf OmniConvertExtns2=*.ppt OmniConvertLibraryCsvs2=pptconv.dll OmniConvertConfigSectionCsvs2=Ppt Logging=0 LogAppend=TRUE LogMaxKBytes=500 [MSWord] OutputCharSet=ASCII [Rtf] [Ppt] OutputCharSet=ASCII StopList=pptconv.dat
Omnislaveでインデックス作成のために変換する各ファイル形式に対して、[<file_format>]セクションを作成します。
各[<file_format>]セクションで、パラメータOutputCharSetを追加して、ファイル形式の変換後の文字セットに設定します。
たとえば、繁体字中国語でWordドキュメントを検索する場合、次のコード行をOmnislave環境設定ファイルの該当する[CONFIGURATION]セクション下に追加します。
[MSWord] OutputCharSet=CHINESETRADITIONAL
DRE環境設定ファイルDirectorDRE.cfgで言語固有の検索パラメータを変更します。このファイルは、exteNd Directorインストールディレクトリのautonomy\\engine\\にあります。
言語 |
値 |
---|---|
ヨーロッパ言語 |
0 (デフォルト) |
日本語 |
1 |
韓国語 |
2 |
中国語(簡体字) |
4 |
中国語(繁体字) |
5 |
中国語(簡体字)としてインデックスが作成された中国語(繁体字) |
6 |
東ヨーロッパ言語 |
7 |
ロシア語WINANSI |
8 |
ロシア語KO18 |
9 |
ヘブライ語 |
10 |
ギリシャ語 |
11 |
スウェーデン語 |
12 |
TermSizeパラメータを設定して、DREの任意の用語の最大文字数を指定します。
言語 |
値 |
---|---|
英語およびヨーロッパ言語 |
10 (デフォルト) |
ドイツ語 |
30 |
日本語 |
30 |
韓国語 |
40 |
(オプション) StripLanguageパラメータを設定して、単語をステムにストリップする(たとえば、runningをrunに)場合に使用する言語を選択します。
オプション |
値 |
---|---|
英語 |
0 |
イギリス英語からアメリカ英語への変換 |
1 |
ストリッピングなし |
2 |
ドイツ語 |
3 |
イタリア語 |
4 |
ロシア語 |
5 |
高度な英語 |
6 |
スペイン語 |
7 |
オランダ語 |
8 |
高度なドイツ語 |
9 |
フランス語 |
10 |
ギリシャ語 |
11 |
スウェーデン語 |
12 |
デンマーク語 |
13 |
ポルトガル語 |
14 |
高度なスペイン語 |
15 |
ノルウェー語 |
16 |
注記: 可能な場合、英語(6)およびドイツ語(9)の詳細設定を使用します。例外:コンテンツのインデックスをDREに作成したときに、StripLanguageを0か1(英語)または3(ドイツ語)を設定した場合、クエリをDREに送信する場合にも同じ設定を使用する必要があります。
単語がスペースで分割されていない言語を使用する場合、適切な区切り記号を指定する必要があります。exteNd Directorは、製品CDに言語固有のセンテンス分割ファイルを提供しています。このファイルは、DREのあるディレクトリ(exteNd Directorインストールディレクトリのautonomy\\engine)にコピーする必要があります。次の節では、単語をスペースで区切らない言語に設定する必要があるセンテンス分割ファイルおよび関連DRE設定について説明します。
必要なセンテンス分割ファイルは、次のとおりです。
プラットフォーム |
センテンス分割ファイル |
CDのディレクトリ |
---|---|---|
NT |
Autonomy\MBCS\chinese_nt_1_0_3.zip |
|
UNIX |
Autonomy/MBCS/chinese_aix_1_0_2.tar.Z Autonomy/MBCS/chinese_hpux11_1_0_3.tar.Z Autonomy/MBCS/chinese_solaris_1_0_3.tar.Z |
必要な言語固有設定は、次のとおりです。
DRE環境設定パラメータ |
値 |
---|---|
CharConv |
5 |
TermSize |
40 |
StripLanguage |
2 |
必要なセンテンス分割ファイルは、次のとおりです。
プラットフォーム |
センテンス分割ファイル |
CDのディレクトリ |
---|---|---|
NT |
Autonomy\MBCS\chinese_nt_1_0_3.zip |
|
UNIX |
Autonomy/MBCS/chinese_aix_1_0_2.tar.Z Autonomy/MBCS/chinese_hpux11_1_0_3.tar.Z Autonomy/MBCS/chinese_solaris_1_0_3.tar.Z |
必要な言語固有設定は、次のとおりです。
DRE環境設定パラメータ |
値 |
---|---|
CharConv |
4 |
TermSize |
40 |
StripLanguage |
2 |
必要なセンテンス分割ファイルは、次のとおりです。
プラットフォーム |
センテンス分割ファイル |
CDのディレクトリ |
---|---|---|
NT |
Autonomy\MBCS\japanese_nt_2_0_5.zip |
|
UNIX |
Autonomy/MBCS/japanese_aix_2_0_5.tar.Z Autonomy/MBCS/japanese_hpux11_2_0_5.tar.Z Autonomy/MBCS/japanese_solaris_2_0_5.tar.Z |
必要な言語固有設定は、次のとおりです。
DRE環境設定パラメータ |
値 |
---|---|
CharConv |
1 |
TermSize |
30 |
StripLanguage |
2 |
必要なセンテンス分割ファイルは、次のとおりです。
プラットフォーム |
センテンス分割ファイル |
CDのディレクトリ |
---|---|---|
NT |
Autonomy\MBCS\korean_nt_1_0_1.zip |
|
UNIX |
Autonomy/MBCS/korean_aix_1_0_1.tar.Z Autonomy/MBCS/korean_hpux11_1_0_1.tar.Z Autonomy/MBCS/korean_solaris_1_0_1.tar.Z |
必要な言語固有設定は、次のとおりです。
DRE環境設定パラメータ |
値 |
---|---|
CharConv |
2 |
TermSize |
40 |
StripLanguage |
2 |
Copyright © 2004 Novell, Inc. All rights reserved. Copyright © 1997, 1998, 1999, 2000, 2001, 2002, 2003 SilverStream Software, LLC. All rights reserved. more ...