2012 Fiscal Year Annual Research Report
Project/Area Number |
23650002
|
Research Institution | Tohoku University |
Principal Investigator |
篠原 歩 東北大学, 情報科学研究科, 教授 (00226151)
|
Keywords | アルゴリズム / 情報基礎 / 離散構造 / 文字列学 / データ構造 |
Research Abstract |
文字列の持つ離散構造や組み合わせ的性質の解明とその活用を効果的に行うための研究支援システムの開発を目指して研究を展開した.昨年度の検討に基づいて,今年度は実際にサーバを構築して,主に次の3種類のコンテンツを掲載したオンラインシステムのプロトタイプを作成した.1.フィボナッチ文字列など,文字列学の対象となる種々の文字列についての定義や興味深い性質の説明.2.パターン照合や周期の計算など,文字列処理の基本アルゴリズムの解説.3.接尾辞木や接尾辞配列など,文字列処理に有用な索引構造の説明. このシステムは,Javascriptを用いてユーザの入力に応じて動的に即座に表示を切り替える仕組みを持っており,上記それぞれの項目でこの機能を活用することができる.例えば,パターン照合について,テキストとパターンを変えたときのアルゴリズムの挙動を対話的に確認することができる.また,接尾辞木の性質や挙動を把握するためには,ある程度長い文字列に対して木を構築して観察する必要があるが,このシステムを用いることでその手間が大幅に低減できるようになり,文字列学の研究のツールとしての利便性が実感できた.今後,本格稼働を行うためには,さらなるコンテンツの充実が必要であるが,複数の作業者で共同しながらシステムを維持・更新できるように設計しており,また電子書籍のフォーマットへ変換することも容易である. また,申請書に明記していた通り,数列の事典とは異なって,このシステムには文字列の置換を許した検索が必須であるが,そのために有用な索引構造として,パラメータ化文字列に対応できるポジションヒープの定義とその構築アルゴリズムを開発した. さらに,文字列の基本的な繰り返し構造である「連」を最も多く含む文字列を効率よく探索するアルゴリズムを実装した.ここで得るコンテンツも併せて,今後もシステムを随時,更新していく予定である.
|
Research Products
(6 results)