2010 Fiscal Year Annual Research Report
代表性を有する大規模日本語書き言葉コーパスの構築:21世紀の日本語研究の基盤整備
Project Area | Compilation of a balanced corpus of written Japanese: Infrastructure for the coming Japanese linguistics |
Project/Area Number |
18061009
|
Research Institution | 大学共同利用機関法人人間文化研究機構国立国語研究所 |
Principal Investigator |
前川 喜久雄 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語資源研究系, 教授 (20173693)
|
Co-Investigator(Kenkyū-buntansha) |
山崎 誠 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語資源研究系, 准教授 (30182489)
松本 裕治 奈良先端科学技術大学院大学, 報科学研究科, 教授 (10211575)
傅 康晴 千葉大学, 文学部, 教授 (70291458)
田野村 忠温 大阪大学, 大学院・文学研究科, 教授 (40207204)
砂川 有里子 筑波大学, 人文社会科学研究科, 教授 (40179289)
|
Keywords | 均衡コーパス / 日本語 / 書き言葉 / 代表性 |
Research Abstract |
特定領域研究「代表性を有する大規模日本語書き言葉コーパスの構築:21世紀の日本語研究の基盤整備」の総括班として必要な業務を実施した。 1.総括班会議を6月,8月,12月の3回開催した(すべて東京)。 2.平成22年度全体会議(2010年8月30,31日於国立国語研究所,発表件数40件)を開催し、40件の研究発表を実施した。 3.領域ホームページの維持管理を行った。 4.著作権処理作業を継続した(交渉が滞っていたJASRACとの交渉を再開するなどして、最終的に公開可能なサンプルの確定作業を進めた)。 5.各研究班の研究成果を格納したDVD-ROM(解説書86頁付)を作成し、関係者に配布した。 6.平成22年度公開ワークショップ(公開研究成果報告会)予稿集(発表件数79件,552頁)を作成した。 ※当初2011年3月14-16日に開催予定であったが、東日本大震災のため中止せざるをえなかったので、事前申込者約300名には後日予稿集を配布した。 7.2011年8月1,2日に『現代日本語書き言葉均衡コーパス完成記念講演会』を東京で開催した。発表件数は37件(予稿集226頁)であり、プロジェクト外からの参加者多数を含めて280名の参加者があった。 8.『現代日本語書き言葉均衡コーパス』(1億500万語)をオンライン公開した。2011年3月に文字列検索専用インターフェース『少納言』を公開し、同年8月には形態素解析済データ検索用インターフェース『中納言』を公開した。 9.『現代日本語書き言葉均衡コーパス』DVD版利用者マニュアルを整備してDVD版の公開に備えた(DVD版は国立国語研究所の費用で2011年末に一般公開した)。
|
Research Products
(10 results)