研究課題/領域番号 |
06401011
|
研究種目 |
一般研究(A)
|
研究機関 | 国立国語研究所 |
研究代表者 |
中野 洋 国立国語研究所, 言語体系研究部, 部長 (40000426)
|
研究分担者 |
加藤 安彦 国立国語研究所, 国語辞典編集室, 研究員 (90233824)
大島 資生 国立国語研究所, 言語体系研究部・第2研究室, 研究員 (30213705)
鈴木 美都代 国立国語研究所, 言語体系研究部・第1研究室, 研究員
山崎 誠 国立国語研究所, 言語体系研究部・第1研究室, 室長 (30182489)
|
キーワード | 言語データベース / 機械辞書 / 日本語処理プログラム |
研究概要 |
平成6年度は、以下のことをおこなった。研究計画の予定どおりの進捗状況で、研究のための準備的な段階をほぼ終えた。 1.言語調査データおよびテキストデータのデータベース化 (1)国語研究所がおこなった語彙調査のテキスト、および、科研費でおこなわれた話しことばのKWICについてデータベース化のための情報をつけた。 (2)『日本語文法・連語論』『現代語の助詞助動詞』をコンピュータに入力、用例文をデータベース化するための準備をとして、付加情報をつけはじめた。 2.機械辞書の作成 大野晋・浜西正人『類語国語辞典』(角川書店)をもとにして、約6万語について位相情報・語種情報・意味分類情報などの一次入力を終了した。 3.ワークステーションを使用した言語処理 京都大学で開発された日本語処理プログラムを移植し、おもに科学技術文献を対象としていたそのシステムを明治期の小説などの、文体的に異なった種類のテキストへ応用することを試みた。また、パソコン上で動いている各種言語処理プログラムをワークステーション上に移植した。 4.アンケートの実施 日本語情報処理にかかわる研究者には、大きくわけて国語学の研究者と工学系の研究者がいるが、両者の間の研究目的・方法論などの違いについて研究者自身を対象にアンケートを行った。結果はとりまとめ中であるが、データに対する考え方の違いが、使いやすいデータベースの作成や言語処理ツールの効果的活用をさぐるための参考になるのではないかと思われる。 5.研究会の開催 平成7年1月19日に下記のテーマで研究会を行った。 ・テキストデータベースの構築について ・日本語情報処理に対する異なったアプローチの仕方(国語学と工学)について 6.電磁媒体による日本語テキストデータの収集 CD-ROMや電子ブックなど機械で読む日本語テキストが次第に出版点数をましてきている。これを調査し、一部収集を始めた。
|