Project/Area Number |
18049036
|
Research Category |
Grant-in-Aid for Scientific Research on Priority Areas
|
Allocation Type | Single-year Grants |
Review Section |
Science and Engineering
|
Research Institution | Kyoto University |
Principal Investigator |
吉川 正俊 京都大学, 情報学研究科, 教授 (30182736)
|
Co-Investigator(Kenkyū-buntansha) |
外山 勝彦 名古屋大学, 情報科学研究科, 助教授 (70217561)
小川 泰弘 名古屋大学, 情報科学研究科, 助手 (70332707)
|
Project Period (FY) |
2006
|
Project Status |
Completed (Fiscal Year 2006)
|
Budget Amount *help |
¥7,200,000 (Direct Cost: ¥7,200,000)
Fiscal Year 2006: ¥7,200,000 (Direct Cost: ¥7,200,000)
|
Keywords | XML / データベース |
Research Abstract |
XML情報検索の研究として,本年度は高精度化,高速化の課題に取り組み,利用者にとって有用な出力インタフェースにおいて適合性が高くかつ実用的な速度で結果を返すシステムKikori-KSを開発した.XMLデータを,広く普及している関係データベースに細分化して格納することにより,他の一般データとも共存が可能で汎用性が高いXML情報検索システムを開発した.一般利用者が簡単に利用できるようにキーワード集合を入力とし検索を行う.開発したXML情報検索システムは,任意の構造のXMLデータを格納できる.検索システム内部での単語の重み付けや格納する関係表の設計を工夫することにより精度と速度の向上を計る.出力インタフェースは,論文など文書を中心とするXMLデータを対象とし,検索結果を,問合せとの関連度が高い(1)部分文書順,(2)文書順かつ同一文書内では関連度に基づく部分文書順,(3)文書順かつ同一文書内では部分文書の出現順,に出力する3通りの方法を用意している.(3)では,部分文書の問合せとの関連度を明確化するためにフォントの大きさを変化させ視認性を向上させている.XML情報検索の性能を評価するためのテストコレクションを用いて評価を行ったところ,有用性の高い(3)の出力インタフェースを生成する場合に特に適合性が高いことが確認できた.また,関連する語彙知識獲得の研究として,潜在意味モデルを用いた類義語獲得および有効な文脈情報の比較検討の課題に取り組み,類義語獲得においてPLSIが有効であること,および,類義語獲得において用いる文脈情報として,近接関係および修飾関係が有効であることを明らかにした.
|
Report
(1 results)
Research Products
(3 results)