2011 Fiscal Year Annual Research Report
Project/Area Number |
21520492
|
Research Institution | 大学共同利用機関法人人間文化研究機構国立国語研究所 |
Principal Investigator |
小木曽 智信 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語資源研究系, 准教授 (20337489)
|
Co-Investigator(Kenkyū-buntansha) |
田中 牧郎 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語資源研究系, 准教授 (90217076)
小椋 秀樹 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語資源研究系, 准教授 (00321547)
須永 哲矢 大学共同利用機関法人人間文化研究機構国立国語研究所, コーパス開発センター, プロジェクト奨励研究員 (10589584)
|
Keywords | 日本語史 / 形態素解析 / コーパス / 中古和文 |
Research Abstract |
平安時代の仮名文学作品を主たる対象とする和文系資料を対象とした形態素解析辞書「中古和文UniDic」を一般公開した。この辞書により、校訂済みの仮名文学作品本文を約97%の精度で解析し研究に利用することが可能になった。 本研究課題に関する研究発表等(計13件)は『「和文系資料を対象とした形態素解析辞書の開発」研究成果報告書』にまとめ、PDFファイルによる一般公開を行っている。また「中古和文UniDic」が付与する形態論情報の詳細は、小椋秀樹・須永哲矢(2012)『中古和文UniDic短単位規程集』にまとめ同様に公開している。 「中古和文UniDic」は、すでに日本語史の研究に用いられはじめているほか、国立国語研究所で構築準備が行われている通時コーパスの形態論情報付与に活用される予定である。さらに、iPhone・iPadアプリ『旺文社 全訳古語辞典(第三版)』(物書堂)の開発に用いられるなど一般社会での活用も行われている。 なお、本研究課題による下記の研究により、情報処理学会平成22年度「山下記念研究賞」を受賞した。 小木曽智信・小椋秀樹・田中牧郎・近藤明日子・伝康晴(2010)「中古和文を対象とした形態素解析辞書の開発」『人文科学とコンピュータ』(情報処理学会研究報告)Vo1.2010/CH-85:1-8. 本研究課題によって開発された形態素解析辞書「中古和文UniDic」と研究成果報告書は、次のURLで公開を行っている。http://www2.ninjal.ac.jp/lrc/index.php?UniDic
|
Research Products
(7 results)