2010 Fiscal Year Final Research Report
Compilation of a Balanced Corpus of Written Japanese : Infrastructure for the Coming Japanese Linguistics
Project Area | Compilation of a balanced corpus of written Japanese: Infrastructure for the coming Japanese linguistics |
Project/Area Number |
18061009
|
Research Category |
Grant-in-Aid for Scientific Research on Priority Areas
|
Allocation Type | Single-year Grants |
Review Section |
Humanities and Social Sciences
|
Research Institution | 大学共同利用機関法人人間文化研究機構国立国語研究所 (2009-2010) The National Institute for Japanese Language (2006-2008) |
Principal Investigator |
MAEKAWA Kikuo 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語資源研究系, 教授 (20173693)
|
Co-Investigator(Kenkyū-buntansha) |
YAMAZAKI Makoto 国立国語研究所, 言語資源研究系, 准教授 (30182489)
MATSUMOTO Yuji 奈良先端科学技術大学院大学, 情報科学研究科, 教授 (10211575)
DEN Yasuharu 千葉大学, 文学部, 教授 (70291458)
TANOMURA Tadaharu 大阪大学, 大学院・文学研究科, 教授 (40207204)
SUNAKAWA Yuriko 筑波大学, 人文社会科学研究科, 教授 (40179289)
TANAKA Makiro 国立国語研究所, 言語資源研究系, 准教授 (90217076)
OGINO Tsunao 日本大学, 文理学部, 教授 (00111443)
OKUMURA Manabu 東京工業大学, 精密工学研究所, 教授 (60214079)
SAITO Hiroaki 慶應義塾大学, 理工学部, 准教授 (30235064)
SHIBASAKI Hideko 長岡技術科学大学, 工学部, 教授 (00376815)
SHINNO Hiroyuki 茨城大学, 工学部, 准教授 (10250987)
NISHINA Kikuko 東京工業大学, 留学生センター, 教授 (40198479)
UTSURO Takehito 筑波大学, システム情報工学研究科, 准教授 (90263433)
SEKI Yohei 筑波大学, 大学院・図書館情報メディア研究科, 助教 (00348468)
OHARA Kyoko 慶應義塾大学, 理工学部, 准教授 (00286650)
|
Co-Investigator(Renkei-kenkyūsha) |
KIDO Fuyuko 東京大学, 大学院・情報理工学系研究科, 特任助教 (60527828)
|
Project Period (FY) |
2006 – 2010
|
Keywords | 均衡コーパス / 日本語 / 書き言葉 / 代表性 |
Research Abstract |
Compilation of the 50-million-word balanced corpus of contemporary Japanese books was successfully achieved according to the initial plan. The corpus was publicly available since 2011. Various studies using the corpus under compilation have been conducted to achieve the goal of establishing the basis of corpus Japanese linguistics. Research workshops consisting of more than 200 researchers have been held regularly even after the end of the current project.
|
Research Products
(40 results)
-
-
[Journal Article] Design, compilation, and preliminary analyses of balanced corpus of contemporary written Japanese2010
Author(s)
Kikuo Maekawa. Yamazaki. M., Maruyama, T., Yamaguchi, M., Ogura, H., Kashino, W., Ogiso, T., Koiso, H., & Den. Y.
-
Journal Title
Proc. 7th International Conference on Language Resources and Evaluation (LREC2010)
Pages: 1483-1486
Peer Reviewed
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-