2006 Fiscal Year Annual Research Report
Project Area | Compilation of a balanced corpus of written Japanese: Infrastructure for the coming Japanese linguistics |
Project/Area Number |
18061006
|
Research Institution | Nihon University |
Principal Investigator |
荻野 綱男 日本大学, 文理学部, 教授 (00111443)
|
Co-Investigator(Kenkyū-buntansha) |
近藤 泰弘 青山学院大学, 文学部, 教授 (20126064)
矢沢 真人 筑波大学, 人文社会科学研究科, 助教授 (30182314)
丸山 直子 東京女子大学, 文理学部, 教授 (00199936)
|
Keywords | コーパス / コロケーション / 国語辞典 / 辞書記述 |
Research Abstract |
4グループのそれぞれで研究を進め、班会議の場で成果を報告しあった。 (1)WWWをコーパスとして利用して、コロケーション情報を人手で抽出し、一部の整理を試みた。また、主として国語年鑑から1960-2006年の日本語学分野の研究文献を調査し、コロケーションや共起関係、結合価などをあつかった文献を抜き出し、どんな研究が行われてきたかを概観した。自然言語処理分野でも文献調査を行い、機械翻訳や仮名漢字変換などの応用技術との関連でコロケーションがどう研究されてきたのかを把握することができた。 (2)本年度は、文法的情報を持った辞書の作成という目標のうち、特に複合辞について集中的に研究を行った。そして、複合辞をコーパスから自動的に抽出するための技法として、コロケーションの強さを計測するための統計的指標として用いられているMIスコアやtスコアといったものを複合辞の複合辞らしさを計測するために用いられないかについて実験を行いかなりの成果を得ることができた。 (3)国語辞書のブランチの立て方を調べ、国語辞典を利用する際に障碍となる点について,一つ一つ検討を加え,求めるのがどのブランチの意味であるかを選択する「ブランチ選択の障碍」が電子型国語辞典の最大の障碍になることを示し,それを解消させるためにブランチの立項を工夫するとともに,コロケーション情報を利用した連語引きや,素性分析をふまえたブランチ立てが有効であることを論じた。 (4)辞書に必要な情報の調査として辞書編纂者への聞き取りを行い、報告書『辞書編纂談義-水谷静夫先生が語る-』にまとめた。また、"ト格要素をとる体言の用例収集と分析"、"役割を表すニ格についての一般辞書及び専門書における記述の調査"を通じて、コーパスからの情報収集法と辞書における格情報の記述法を検討した。
|
Research Products
(7 results)