2006 Fiscal Year Annual Research Report
Project/Area Number |
16092220
|
Research Institution | Tohoku University |
Principal Investigator |
篠原 歩 東北大学, 大学院情報科学研究科, 教授 (00226151)
|
Co-Investigator(Kenkyū-buntansha) |
竹田 正幸 九州大学, 大学院システム情報科学研究院, 教授 (50216909)
下薗 真一 九州工業大学, 情報工学部, 助教授 (70243988)
坂本 比呂志 九州工業大学, 情報工学部, 助教授 (50315123)
石野 明 東北大学, 大学院情報科学研究科, 助手 (10315129)
|
Keywords | 文字列照合 / XML / アルゴリズム / 索引構造 / 文字列処理 / データ圧縮 / 非明示的表現 |
Research Abstract |
本研究は,非明示的に表現されたオブジェクトに対するアルゴリズムの開発とその計算量の解析を行うことを目的し,また同時に,効率のよいアルゴリズムの開発に適した非明示的な表現法を文字列やグラフなどの離散構造を対象として研究を展開している. 本年度は,まず,XMLテキストの高速処理に関する技法に関する技法についての研究を行った.XMLは,あらゆるデータをタグ付きのテキスト文字列として行うことによって可搬性と機械可読性を備えた汎用フォーマットとして広範囲に活用されている.本研究では,与えられたXMLテキストを,パストライとバイナリXMLデータの対に変換することによって,領域効率と実行速度を向上させることに成功した.また,圧縮されデータを陽に展開することなく,そのままパターン照合を行う,圧縮文字列照合の研究に関して,形式文法に基づく圧縮法に対する効率のよいアルゴリズムを与えた.さらに,文字列中に共通に現れる共通部分文字列を新たな記号に置き換える作業を繰り返す事による圧縮法に関して,線形時間の圧縮アルゴリズムを与えた.一方,文字列に対する索引構造に関して,単語単位の接尾辞木(suffix tree)や有向文字列グラフ(DAWG),圧縮有向文字列グラフ(CDAWG)をそれぞれ線形時間で構築する,簡潔なアルゴリズムを開発した.また,種々の文字列処理アルゴリズムに対して,最悪実行時間の解析に活用されることの多いフィボナッチ文字列とその一般化について,文字列中に繰り返し現れる部分文字列の構造に関する組み合わせ的性質を解析した.我々は,隣接2項の漸化式で定義されるフィボナッチ文字列を隣接n項の漸化式で表される文字列へ一般化し,その部分文字列の繰り返しの長さと特性方程式の解との関係を明らかにした.
|
Research Products
(6 results)