2009 Fiscal Year Annual Research Report
代表性を有する大規模日本語書き言葉コーパスの構築:21世紀の日本語研究の基盤整備
Project Area | Compilation of a balanced corpus of written Japanese: Infrastructure for the coming Japanese linguistics |
Project/Area Number |
18061009
|
Research Institution | 大学共同利用機関法人人間文化研究機構国立国語研究所 |
Principal Investigator |
前川 喜久雄 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語資源研究系, 教授 (20173693)
|
Co-Investigator(Kenkyū-buntansha) |
山崎 誠 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語資源研究系, 准教授 (30182489)
松本 裕治 奈良先端科学技術大学院大学, 情報科学研究科, 教授 (10211575)
傅 康晴 千葉大学, 文学部, 教授 (70291458)
田野村 忠温 大阪大学, 大学院・文学研究科, 教授 (40207204)
砂川 有里子 筑波大学, 大学院・人文社会科学研究科, 教授 (40179289)
|
Keywords | 均衡コーパス / 日本語 / 書き言葉 / 代表性 |
Research Abstract |
特定領域研究「代表性を有する大規模日本語書き言葉コーパスの構築:21世紀の日本語研究の基盤整備」の総括班として必要な業務を実施した。 1. 総括班会議の開催(7月,9月,12月,3月の4回於東京)。 2. 外部評価委員会の開催(下記公開ワークショップにあわせて2010年3月16日に開催)。 3. 平成21年度全体会議の開催(2009年9月5,6日於東京)。 ・ 研究進捗状況報告(計画班・公募班各班長)、・口頭研究発表:10件、・ポスター発表及びデモンストレーション:13件 4. 平成21年度公開ワークショップ(研究成果報告会)の開催(2010年3月14日~16日於東京)。 3月14日:サテライトセッション(「日本語コーパス」公開データを使用した外部の研究者の発表) ・ 口頭研究発表:4件、・招待発表:1件、・ポスター発表:10件 3月15日~16日:研究成果報告・口頭研究発表:13件、・ポスター発表及びデモンストレーション:27件 5. 本領域の広報用ホームページの運用(備考(1)) 6. 本領域関係者専用ホームページの運用 7. 『現代日本語書き言葉均衡コーパス』検索デモサイトの運営(備考(2)) 8. コーパスの著作権処理のための新聞社、出版社等との交渉 9. 平成21年度より第2期公募班が4班(日本語機能表現班、作文支援システム班、意見情報班、日本語フレームネット班)加わった。なお、第1期(平成19年度~平成20年度)公募班のうち、クラスタリング班は計画班の言語処理班に加わり活動中。 上記7では今年度600万語分の新規データを追加し、現在は合計で4600万語分の著作権処理済データがデモ用に検索できる。アクセス数は累積で約9万件である。
|
Research Products
(13 results)