• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2001 年度 実績報告書

ハイパーテキストによる文法記述の研究

研究課題

研究課題/領域番号 11410112
研究機関青山学院大学

研究代表者

近藤 泰弘  青山学院大学, 文学部, 教授 (20126064)

キーワードハイパーテキスト / KWIC / 日本語 / 文法 / UNIX / テキストデータベース / Linux
研究概要

本年度は昨年度に引き続き文脈情報を付した用例データベースリ作成および、ハイパーテキスト化のための基礎研究を行った。また、そのための基礎作業として、Limuxシステムの評価も行った。またデータベースを検索するために、高速文字列検索の技法があるが、そのシステム的評価も合わせて行った。文字列検索のためには、従来知ら,れているgrepのような逐次サーチの方法ではなく、データベース的アプローチを採用する。特にその中でもインデクスファイルとして単語を切り出すのではなく、文字列を切り出す方法を採用する。サフィックスアレイと呼ばれるライブラリにより、単語を切り出すことなく、きわめて高速に文字列を検索可能となるのである。
またデータベースと実際のテキストとの対比作業のため、N-gramによる文字列総合比較という方洗も考案している。これは、文字列レベルでテキスト内のすべての文字列の組み合わせを網羅し、それによって他のテキストや辞書との対比を網羅的に行う方法である。これにより、試行的に古典語テキストや現代語テキストの対比を行い、きわめて革新的な成果をあげられることを実証しつつある。その成果の一部は、論文として発表している。
さらにXMLにより構造的なテキストとして文法を記述する方法についても、さらに詳しく調査しているところである。このためのテストプログラムやデータも完成しつつある。
以上、文法現象を観察するための高速テキストサーチ、データベースの比較のためのN-gramシステム、文法記述のためのXMLシステムという道具立てについては相当に完成を見ている。次年度はその具体化をつめてゆきたい。

  • 研究成果

    (2件)

すべて その他

すべて 文献書誌 (2件)

  • [文献書誌] 近藤 泰弘: "名詞節と項構造"日本語文法. 1-11. 41-52 (2001)

  • [文献書誌] 近藤 泰弘: "Linuxによる言語処理-高速文字列検索を例として-"日本語学. 20-13. 92-99 (2001)

URL: 

公開日: 2003-04-03   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi