研究課題/領域番号 |
20K00742
|
研究機関 | 大阪大学 |
研究代表者 |
今尾 康裕 大阪大学, 人文学研究科(言語文化学専攻), 准教授 (50609378)
|
研究期間 (年度) |
2020-04-01 – 2024-03-31
|
キーワード | コーパスツール / テキスト処理 |
研究実績の概要 |
研究2年目である2021年度は、昨年度行ったStanford CoreNLPによって付与した依存文法タグを使った検索機能の大幅な修正に伴う細かな調整及び問題修正を行うとともに、データベース自体の軽量化や検索速度向上のためのインデックスのテストも行った。また、昨年度開始したmacOSのバージョンアップに伴うユーザーインターフェイスの調整も引き続き行った。加えて、文法検索機能の追加に伴って作成したデータベースファイルを文法検索ツール以外のツールでも利用するためのアプリケーションの修正も行い、その他のツールでの基本的な検索機能などを追加した。 これとは別に、CoreNLPが対応している英語以外の言語への対応を可能性を探るため、フランス語母語話者の協力を得て、文法検索機能に組み込みが可能かどうかのテストを開始した。 文法検索以外の外部アプリケーションとの連携に関しては、CasualConc本体への組み込みを前提とした単機能のアプリケーションを作成して、単語ベクトルを利用したアプリケーション (Word2Vec) の組み込みテストを開始した。 マニュアルの整備に関しては、新規文法検索機能及びそれに伴うアプリケーション内のツールへの対応に加えて、OSレベルのユーザーインターフェイスの変更への対応もあり、予定を大幅に超過したが、英語版マニュアルの基本的な改訂を終えた。追記分は100ページほどで、370ページ程度になった。年度途中での公開予定よりは遅れたが、2021年度年度末に、アップデートしたアプリケーションと改訂したマニュアルを公開した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
年度前半にはマニュアルの改訂作業及びアプリケーションのおおよその修正を終えて公開する予定であったが、アプリケーションの修正が予定よりも多くなったこと、OSレベルのユーザーインターフェイスの変更に伴ってマニュアルの改訂が必要な箇所が増えたことによって、公開が年度末までずれ込んだ。 また、それに伴って、他の外部アプリケーションは、組み込み可能かどうかの検証及び、当該アプリケーションに組み込む機能の選別などを開始して、テストアプリケーションなどで作成し始めた段階であり、実際にアプリケーションの追加機能として開発を行うのは、予定より遅れている。 また、アプリケーションの開発、マニュアルの改訂がずれ込んだため、学会での新規機能の発表やワークショップの開催、チュートリアルの作成なども開始できなかったため、来年度以降にずれ込むことになった。
|
今後の研究の推進方策 |
昨年度末にアプリケーション及びマニュアルが公開できたので、問題点や機能改善のフィードバックに基づいて、アプリケーション・マニュアルの修正・改訂を引き続き行っていく。 文法検索以外の外部アプリケーションとの連携については、検証を開始した単語ベクトルのアプリケーションについて引き続き進めるとともに、トピックモデリングの処理ができる外部アプリケーションの検証を開始する。現在候補が2つほどあるが、実際に当該アプリケーションに組み込めるかどうかをテストアプリケーションを開発しながら進めたい。 アプリケーション操作に関するチュートリアルに関しては、新規機能を中心に基本的な操作に関するものから作成を開始し、応用的な利用に関するものも、フィードバックを集めて需要の高いものから作成していく予定である。 当該アプリケーションのiPadへの対応は、外部アプリケーションがiPadで利用できないため、基本機能の移植のみとなるが、現行のmacOS版のアプリケーションの機能追加を優先させるため、今年度後半から来年度にずれ込む可能性がある。
|