2019 Fiscal Year Research-status Report
マルチコーパスシステムCo-Chuの開発と運用実験
Project/Area Number |
18K00723
|
Research Institution | Aichi Shukutoku University |
Principal Investigator |
山本 裕子 愛知淑徳大学, 交流文化学部, 教授 (20410657)
|
Co-Investigator(Kenkyū-buntansha) |
川村 よし子 東京国際大学, 言語コミュニケーション学部, 教授 (40214704)
小森 早江子 中部大学, 人文学部, 教授 (60221248)
|
Project Period (FY) |
2018-04-01 – 2021-03-31
|
Keywords | マルチコーパスシステム / オリジナルデータ / ウェブアプリケーション / タグ検索機能 / メタ情報検索機能 / 操作性 / 分析の多様性 |
Outline of Annual Research Achievements |
2019年度は、昨年度に引き続きデータ収集、整備、システム開発と運用実験を行った。データについては、昨年度収集した日本語学習者、母語話者の作文データ、日本語学習者と日本語母語話者の会話データ、アニメデータ等をシステムに取り込めるよう形式を整え、順次システムに取り込み分析を開始した。成果の一部については、山本(2019)、山本他(2019b)で発表した。また、作文データ、アニメ・ドラマデータの収集を継続し、データの拡充をはかった。 昨年度、話し言葉や誤用を形態素解析する際に生じる誤解析を防ぐために、タグ付けする仕組みを構築したが、今年度はさらにそのタグを検索できるようにシステムの改良を行った。これについては山本他(2019a)で発表した。さらに、運用実験を進め、タグは誤解析を防ぐためだけでなく、研究の目的に応じてメタデータとして付すことも可能であることを確認した。これは応用の可能性が広く期待できる成果である。例えば、会話データではなく、作文データの分析においては、タグに加えて文レベルのメタ情報を付すことが有効である。そこで、文レベルのメタ情報をデータに付し、それを検索できる仕組みの開発を行った。このようにジャンルの特徴に応じた検索が可能になるように、検索システムの拡充を行った。作文データを用いた実験結果は本間他(2019)で発表し、山本他(2019c)にまとめた。 これらの成果を踏まえ、公開するシステムの仕様の基本方針がまとまったため、現在は2020年度中のシステム公開に向けて、準備作業を進めているところである。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
2019年度は、研究の遂行に必要なデータの収集を進め、様々な運用実験を行った。 形態素解析を適切に行えるようにデータにタグを付し、そのタグを検索できるようシステムの改良を進めた。また、形態素レベルだけではなく、文レベルのメタ情報を付し、それを検索できるようにシステムの改良を行うとともに、運用実験を行った。このように、データの整備、システム開発、運用実験のペースとしては概ね順調に進んでいる。また学会発表4件、論文2本と研究発表においても成果を挙げることができた。
|
Strategy for Future Research Activity |
公開するシステムの仕様が決定できたので、システム開発、マニュアル作成等、公開に向けての準備を行う。 データの特徴に応じたタグ付けの方法、分析方法をさらに検討し、システム公開時に提示できるように整理を進める。 また、システムを用いた研究の成果発表も同時に進める予定である。
|
Causes of Carryover |
コーパス関連シンポジウム参加、及び研究打ち合わせのための費用を予定していたが、COVID-19の影響により開催中止となったため、使用しなかった。来年度に持ち越しし、システム公開のための準備に使用する予定である。システム公開は学会発表を通して行う予定であったが、現時点で既に学会も中止の動きが出ているため、オンライン上で行うなど、別の方策を検討している。そのためにこの金額を使用したいと考えている。
|
Research Products
(6 results)