自然言語処理CUIアプリケーションの汎用GUIコーパスツールへの組み込み
Project/Area Number |
20K00742
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 02100:Foreign language education-related
|
Research Institution | Osaka University |
Principal Investigator |
今尾 康裕 大阪大学, 大学院人文学研究科(言語文化学専攻), 准教授 (50609378)
|
Project Period (FY) |
2020-04-01 – 2024-03-31
|
Project Status |
Granted (Fiscal Year 2022)
|
Budget Amount *help |
¥3,900,000 (Direct Cost: ¥3,000,000、Indirect Cost: ¥900,000)
Fiscal Year 2023: ¥650,000 (Direct Cost: ¥500,000、Indirect Cost: ¥150,000)
Fiscal Year 2022: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2021: ¥520,000 (Direct Cost: ¥400,000、Indirect Cost: ¥120,000)
Fiscal Year 2020: ¥1,950,000 (Direct Cost: ¥1,500,000、Indirect Cost: ¥450,000)
|
Keywords | トピックモデル / アプリケーション開発 / コーパスツール / テキスト処理 |
Outline of Research at the Start |
本研究は、近年自然言語処理の分野で開発され公開されているコマンドベース (CUI) の アプリケーションを申請者が開発している Mac 用 GUI コーパス分析ツール (コンコーダンサー) である CasualConc に組み込み、言語教育にも活用で一部機能を iPad でも利用できるように新たなアプリケーションの開発を行うことで、最新の研究成果を手軽に言語研究・教育へ応用する橋渡しをすることを目的とする。
|
Outline of Annual Research Achievements |
今年度前半は、前年度終わりに公開した、Stanford CoreNLP でタグ付けしたコーパスからデータベースを作成して文法検索を行う機能を追加した、新しいバージョンの CasualConc のバグ修正及び関連する機能追加を中心に行った。 これと並行して、次に機能として追加する予定のトピックモデルを扱う機能と単語埋め込みを扱う機能で連携する Mallet と word2vec の機能及び連携可能性の評価を行なった。その結果、この 2 つの内、連携が比較的容易であった Mallet との連携機能を次に組み込むことに決定した。また、word2vec は試した連携の方法に問題があり、別の連携方法を探るとともに、同様の機能を持つ GloVe を利用する可能性を探っている。 今年度後半は、Mallet との連携及びどのような形で CasualConc に組み込むかをテストするために、Mallet での処理と出力の表示を GUI で行い、CasualConc のグラフ作成機能と連携を試すための単機能のアプリケーションである、CasualMallet を開発し限定公開した。公開後、トピックモデルを利用した言語分析の研究をしている研究者数名に仕様をお願いし、フィードバックを得ながら開発・修正を行なった。年度末には、いくつかの要望を除いて機能追加・修正を行なったバージョンを公開した。 これと並行して、年度後半には、まず、英語コーパス学会で、文法検索機能を中心とした CasualConc の新機能を紹介する発表を行った。また、英語コーパス学会の ESP 研究会と英語教育語彙研究フォーラムに招かれて、新機能を中心とした CasualConc のワークショップを行った。
|
Current Status of Research Progress |
Current Status of Research Progress
4: Progress in research has been delayed.
Reason
今年度は、前年度までの遅れを取り戻すまでには至らず、引き続き追加した文法検索機能の修正や機能追加などを行うとともに、追加予定であったトピックモデルの機能の評価やテストのためのアプリケーション開発に予定よりも時間がかかり、CasualConc に組み込む段階にまで至っていない。これらの開発の遅れに伴って、CasualConc の基本的な機能を iPad などで使えるように iOS 版の開発を始める予定であったが、手がつけられていない。 応用的な研究も、分析をしながら問題を見つけて修正するなど、アプリケーション開発に注力したため、十分に進められていない。 また、ワークショップを行うことはできたが、新しく追加修正した機能などにも軽微な問題が残っており、その修正も行っていたため、ビデオチュートリアルやチュートリアルサイトの作成にまで至っていない。
|
Strategy for Future Research Activity |
応用研究を行いつつ、用例検索としての機能が中心である文法検索機能に、語法・文法研究で使えるような機能を追加していく。また、トピックモデルのテストアプリで実現させた機能を CasualConc で扱えるように開発を進める。 iOS バージョンの CasualConc の開発は、完成させることは難しいのが現状ではあるが、GUI の検証などを含めたプロトタイプの開発は開始して、簡単なデモができるようなところにまで持っていきたい。 ワークショップに関しては、依頼されたものだけでなく、ビデオ会議システムなどを使ってオンラインで行うことを考えている。また、チュートリアルサイトやビデオの作成は、少なくとも日本語のものは基本的な機能を抑えたものを作成する。 成果の公表は、海外での学会での発表は時期的にも難しいかもしれないが、新機能についての国内での学会発表や、学会の研究会などでアプリケーションでの分析方法などを含めた応用的な研究として発表などを行いたい。
|
Report
(3 results)
Research Products
(4 results)