12.07.2015 Views

電子情報通信学会ワードテンプレート (タイトル) - 情報処理学会 ...

電子情報通信学会ワードテンプレート (タイトル) - 情報処理学会 ...

電子情報通信学会ワードテンプレート (タイトル) - 情報処理学会 ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

ス 集 合 をメンバに 持 ち、 集 合 演 算 のための 識 別 子 id を持 つ。Field クラスは、 名 前 とそれに 対 応 した 値 を 持 ち、検 索 対 象 データ 内 の 特 定 のフィールドに 対 応 する。Lucene の Field クラスは、 文 字 列 型 しか 扱 えないが、提 案 システムの Field クラスでは 任 意 の 型 のデータを扱 うことが 可 能 である。 例 えば、 名 前 "date" と、Date型 の 値 "2009-01-01" のペアで 構 成 される Field インスタンスと 名 前 "BBOX" と、Polygon 型 の 値"(0,0)(0,1)(1,1)(1,0)" で 構 成 される Field インスタンスを 一 つの Document インスタンス 内 に 格 納 することが 可 能 である。また Field クラスには、Analyzer クラスのインスタンスを 定 義 することで、ストップワードや 表 記 ゆれなどの 問 題 を 解 消 する。Index クラスは 抽 象 クラスで、これを 継 承 したサブクラスとして、 転 置 ファイルのためのクラスや、B 木索 引 のためのクラス、R 木 索 引 のためのクラスなど、任 意 の 索 引 アルゴリズムを 実 装 する。Index クラスのメンバである、fieldName はこの 索 引 が 扱 う Field の名 前 で、path は 実 際 に 索 引 データが 格 納 される 場 所 を示 し、ranking は 要 素 の 順 序 を 定 義 するクラスである。Ranking クラスも 同 様 に 抽 象 クラスで、サブクラスとして、 例 えば、 数 字 の 大 小 に 基 づいた 順 序 や、 要 素間 の 距 離 に 基 づいた 順 序 などを 定 義 したクラスを 実 装する。この Ranking クラスのサブクラスによる 順 序 定義 を 各 索 引 ごとに 直 接 関 連 づける。IndexDirectory クラスは、データの 格 納 、および 検索 のインターフェイスとなるクラスである。IndexDirectory クラスは、 複 数 の Index インスタンスをメンバとし、 例 えば、Date 型 データを 格 納 できる 名前 が "date" である B 木 索 引 や、Polygon 型 データを 格納 できる 名 前 が "bbox" である R 木 索 引 などをメンバとして 追 加 する。また、 文 字 列 型 やテキスト 型 データを 格 納 できる 匿 名 の 転 置 ファイル 索 引 は、デフォルトで 追 加 されることを 前 提 としている。IndexDirectoryクラスに Index を 追 加 した 後 にデータを 格 納 する。データの 格 納 は、 与 えられた 文 書 を 構 文 解 析 し、Field インスタンスの 集 合 から 構 成 される Document インスタンスを 生 成 し、それを IndexDirectory クラスに 追 加 する。この 際 、 追 加 される Document 内 のすべての Fieldの 名 前 に 対 応 して、 存 在 するように 索 引 を 事 前 に 定 義しておく 必 要 がある。 例 えば、Date 型 の B 木 索 引 "date"や、Polygon 型 の R 木 索 引 "BBOX" 、 文 字 列 型 の 転 置ファイル 索 引 が 定 義 されていた 場 合 、Date 型 で 名 前 が"date" である Field は 格 納 できるが、Date 型 で 名 前 が" 作 成 日 時 " であるような Field は 格 納 できない。IndexDirectory クラスに 対 して 検 索 を 行 なう 場 合 、Query クラスのインスタンスを 渡 すと、 解 としてDocument の 列 あるいは id の 列 が 返 される。Query クラスも Document クラスと 同 様 に、Field インスタンスの 集 合 をメンバに 持 ち、さらに 解 のサイズやオフセット、ソートのキーとなる Filed などを 持 つQueryConfig をメンバに 持 つ。後 述 のように 実 装 では、id に 基 づいた Field 間 のAND や OR 演 算 などを 支 援 するが、 簡 単 のため 割 愛する。この 段 階 でランキングの 集 約 を 行 うことがフレームワークとしては 可 能 であるが、これも 詳 細 は 今 後の 課 題 となっている。3. カタログサービスの 実 装 :3.1. 要 求 要 件次 に、 本 提 案 システムを 用 いた 地 球 観 測 情 報 資 源 のレジストリの 実 装 について 述 べる。まず、OGC(OpenGeospatial Consortium) の 規 定 する、CSW(CatalogService Web)という、メタデータの 検 索 ・ 登 録 のための規 格 [8]をサポートする 必 要 があり、これには 以 下 のような 機 能 要 件 がある。1. HTTP GET/POST に 基 づき、 資 源 に 対 するフォーム検 索 をサポートすること。2. 日 付 型 、 雲 量 などの 数 値 型 ,BBOX(Bounding BOX)のような 空 間 型 、および 全 文 検 索 の 検 索 をサポートすること。3. Transaction/Harvest といったメタデータ 収 集 ・ 登 録の 仕 組 みを 有 すること。GEO Grid における 要 件 : さらに、 以 下 のようなGEO Grid 固 有 の 要 求 が 考 えられる。A) 異 種 ・ 多 様 なプロファイル(スキーマ)をサポートすること。 衛 星 画 像 だけでなく、さまざまな 地物 のレジストリや、その 上 でのサービスのレジストリとしての 機 能 が 要 求 され、 異 種 のメタデータスキーマの 支 援 と、それに 対 する 統 合 的 な 検 索 が必 要 である。スキーマの 変 更 や 追 加 や 要 素 の 拡 張などにも 柔 軟 に 対 応 する 必 要 がある。B) 大 量 データに 対 する 検 索 を 効 果 的 にサポートすること。 提 案 システムでは 数 百 万 というオブジェクトを 扱 うが、 既 に 述 べたようにある 緯 度 経 度 で 検索 をした 場 合 、 答 えの 個 数 が 数 万 個 になったり、あるいは 逆 に 一 つもないような 場 合 がある。このような 場 合 に 対 しても、 十 分 な 応 答 性 能 と 必 要 な結 果 を 効 果 的 に 検 索 ・ 表 示 できること。C) オントロジに 基 づく 検 索 をサポートすること。 地物 に 対 する 検 索 要 求 はたとえば 検 索 用 語 間 に 階 層関 係 や 包 含 関 係 があるので、 単 にキーワード 検 索だけでは 不 十 分 である。

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!