2023 Fiscal Year Annual Research Report
自然言語処理CUIアプリケーションの汎用GUIコーパスツールへの組み込み
Project/Area Number |
20K00742
|
Research Institution | Osaka University |
Principal Investigator |
今尾 康裕 大阪大学, 大学院人文学研究科(言語文化学専攻), 准教授 (50609378)
|
Project Period (FY) |
2020-04-01 – 2024-03-31
|
Keywords | コーパス分析ツール / 自然言語処理 |
Outline of Annual Research Achievements |
本研究は、Mac用コーパス分析ツールであるCasualConcにCUIアプリケーションである Unix用の自然言語処理アプリケーションとの連携機能を追加し、GUIでこれらのアプリケーションの操作を可能とするとともに、その利用の普及を目指しチュートリアルなどを作成することを目的とした。 初年度には、外国語教育メディア学会関西支部のワークショップ講師を担当することになり、コロナ禍でのオンライン開催ということもあり、その時点のバージョンのウェブチュートリアルを作成し公開した。 2年目には、Stanford CoreNLPとの連携で依存文法タグづけをし、文法検索が可能なバージョンをリリースした。タグづけ処理したテキストは、SQLite データベースに保存して利用する形式にし、データベースファイルを作成に特化した関連アプリを開発し、CasualConcとともに配布する形式にした。 3年目は、学会などで新バージョンに関する発表を行うとともに、新機能の説明を含めたワークショップを行った。また、トピックモデルが利用できる Mallet との連携機能を探るため、CasualConcの一部機能を備えた Mallet を GUI で利用するアプリケーショ CasualMalletを開発し公開した。Mallet では、テキストファイルを処理する前のテキスト整形などが必要なため、その機能も組み込んだ。 最終年度は、CasualMalletの機能をCasualConcに取り込みつつ、CasualConcの既存機能との連携を図り、機能強化に取り組んだ。テキストの前処理の機能は、CasualConc内では独立したツールとして用意し、汎用的に利用できるようにした。この新バージョンの公開はマニュアルの改訂が間に合わなかったため期間内に行えなかったが、近日中に行う予定である。
|