2004 Fiscal Year Annual Research Report
Project/Area Number |
15300046
|
Research Institution | Nara Institute of Science and Technology |
Principal Investigator |
松本 裕治 奈良先端科学技術大学院大学, 情報科学研究科, 教授 (10211575)
|
Co-Investigator(Kenkyū-buntansha) |
浅原 正幸 奈良先端科学技術大学院大学, 情報科学研究科, 助手 (80379528)
橋本 喜代太 大阪女子大学, 人文社会学部, 助教授 (50278818)
投野 由紀夫 明海大学, 外国語学部, 助教授 (10211393)
大谷 朗 大阪学院大学, 情報学部, 講師 (50283817)
|
Keywords | 言語コーパス / 言語処理 / 品詞タグ付け / 係り受け解析 / データベース / 単語検索 / KWIC |
Research Abstract |
日本語および英語の品詞タグ付けや係り受け解析を行う言語処理ツールを開発するとともに,それの解析結果と辞書を連携して格納し,管理と検索を行うためのシステムの実装を行った.本年はダグ付きコーパスと辞書の連携管理を行う機能の設計と実装,および係り受け解析結果の検索機能の実装を重点的に行った.具体的に作成した機能は次の通りである. 1.品詞タグ付けコーパスと辞書を関係データベースに格納し,品詞タグ付けコーパスを辞書項目へのポインタ列として実装する機能. 2.単語列検索機能:格納されたテキストを任意の単語列を,単語がもつ任意の属性(出現形,読み,発音,階層構造付きの品詞,活用型,活用形)を部分的に指定して検索する機能.前年度に実装したこの検索機能を新しいデータベースに対応するように修正した. 3.単語検索結果の前後の文脈中に現れる他単語との統計的共起尺度を計算する機能. 4.係り受け解析されたコーパスを関係データベースに格納する機能. 5.任意の係り受け構造を指定して,それにマッチする部分構造を持つ文を網羅的に検索する機能. これらの機能の洗い出しやデータベースの設計,検索手法や統計的共起情報の計算法を議論するため,年度内に奈良,東京,大阪で合計8回の全体会合をもった.また,記述的な問題については,奈良先端大のメンバーで週に1回の内部会合を開いて,詳細を議論した. 上記機能を実装したシステムを第2版として年度明けに公開する予定である.
|
Research Products
(6 results)