位置や時刻を表す語句の時空間関連に基づくテキスト検索システムの開発
Project/Area Number |
14780331
|
Research Category |
Grant-in-Aid for Young Scientists (B)
|
Allocation Type | Single-year Grants |
Research Field |
情報システム学(含情報図書館学)
|
Research Institution | Hiroshima City University |
Principal Investigator |
黒木 進 広島市立大学, 情報科学部, 助教授 (20225288)
|
Project Period (FY) |
2002 – 2004
|
Project Status |
Completed (Fiscal Year 2004)
|
Budget Amount *help |
¥3,100,000 (Direct Cost: ¥3,100,000)
Fiscal Year 2004: ¥500,000 (Direct Cost: ¥500,000)
Fiscal Year 2003: ¥2,200,000 (Direct Cost: ¥2,200,000)
Fiscal Year 2002: ¥400,000 (Direct Cost: ¥400,000)
|
Keywords | 位置情報 / 時刻情報 / 文書検索 / あいまい検索 / 時空間検索 / 地名辞書 / 時刻辞書 |
Research Abstract |
本年度は、以下の項目について研究を行った。 (1)プロトタイプシステムの構築と評価 前年度までに行ってきたプロトタイプシステムの構築を引き続き行った。本年度は特に、多次元インデックスの構築と改良を中心に行った。本研究においては、位置や時刻は数値化された座標として表現されている。よって、データベースに蓄積されたテキストは、それぞれが含む位置や時刻を表す語句を数値化して表現された多次元空間の座標値によって参照される。そのため、テキスト集合に対して時間的、あるいは位置的な検索を行う際には、数値化された多次元空間の座標値に関する多次元インデックスの効率化が重要である。このような観点から、多次元インデックスの構築法について研究を行った。ツリー型のインデックスを想定して、ツリーのノードの持つデータの種類と個数に関して検討を行い、1ノードあたりのデータ量を圧縮することによって、検索に要するデータアクセスの回数と時間に関する効率化を図ることができた。また、この考えをさらに発展させて、より次元の高い多次元インデックスを用いる画像の検索にも応用を試みた。 (2)位置や時刻に関する知識の発見 テキストに含まれる位置や時刻を数値化するためには、これらの情報を数値に変換するための規則が必要である。しかし、初見の位置や時刻については、そのような規則による変換を行うことができない。そのため、文脈情報を利用してそのような規則を推定しなくてはならない。そこで、テキスト中に出現する初見の位置や時刻とその他の位置や時刻の共起関係を基にして初見の位置や時刻を推定する方法について検討を試みた。しかし、これについてはあまりよい結果が得られなかったので、今後引き続き検討を行いたいと考えている。
|
Report
(3 results)
Research Products
(6 results)