研究課題/領域番号 |
23K00746
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分02100:外国語教育関連
|
研究機関 | 広島大学 |
研究代表者 |
河本 健 広島大学, 図書館, 特任教授 (50224861)
|
研究分担者 |
竹内 浩昭 静岡大学, 理学部, 教授 (90216854)
石井 達也 神戸市立工業高等専門学校, その他部局等, 准教授 (90845603)
|
研究期間 (年度) |
2023-04-01 – 2026-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
4,810千円 (直接経費: 3,700千円、間接経費: 1,110千円)
2025年度: 520千円 (直接経費: 400千円、間接経費: 120千円)
2024年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2023年度: 2,730千円 (直接経費: 2,100千円、間接経費: 630千円)
|
キーワード | 英語論文 / コーパス分析 / 論文執筆支援 / 科学論文 / n-gram / webプラットフォーム / 論文執筆 / 生命科学 / コーパス / 支援システム |
研究開始時の研究の概要 |
論文でよく使われる英語表現を、論文の流れに沿って明らかにすることで、研究者の論文執筆に必要な情報を提供する。具体的には、300編の生命科学英語論文(総語数150万語)を対象として、それぞれを12の要素(Move)に分割した12個のコーパスの解析を行う。このようにして、生命科学英語論文における論理展開に特異的なフレーズを抽出し、ライフサイエンス辞書と連携した論文作成支援システム(webプラットフォーム)を開発する。得られた2語から5語の有意な語連鎖は、英語化が喫緊の課題である学術界に有益な情報となる。
|
研究実績の概要 |
本研究では、生命科学分野のトップジャーナル30誌に掲載された300編の英語論文のテキスト(約150万語)を集めて分析を行い、論文執筆を支援するためのプラットフォームの制作を目指す。生命科学論文は、通常、Introduction、Materials & Methods、Results、Discussionの4つのセクションで構成されている。論文の流れをより明確に分析するために、この4つのセクションのそれぞれを、その内容によって3つに分割し、合計、12個のMoveに分割したコーパスを作成して、CasualConcを用いて分析を行った。それぞれのMoveにおいて、全体コーパスと比べて統計学的に有意に高頻度で使われる語(keyword)および2から6語からなる語連鎖(n-gram)を抽出した。抽出したn-gramから、論文執筆において有益である特徴的なフレーズを集めて、意味や用途によって分類した。分類にあたっては、Moveの下位構造として、Stepを設けた。Stepには、必要に応じてsub-stepも設定した。 集めたフレーズ(約1500フレーズ)を活用するための論文執筆プラットフォーム:(webサイトhttps://home.hiroshima-u.ac.jp/tkawamo/ExperimentalCorpusTop.html)を作成して、現在、テスト運用中である。各フレーズをクリックすると、ライフサイエンス辞書コーパスでの検索を自動的に行うことができる。これは、ライフサイエンス辞書に実装されている機能を活用するものである。これによって、各フレーズの実際の使用例を確認することができる。また、ライフサイエンス辞書の英和にもリンクがはってあるので、そちらで意味や用法を確認することもできる。今後、ライフサイエンス辞書プロジェクトと連携を図りつつ、利便性を高めていきたい。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
コーパスのCasualConcによる分析は、ぼぼ完了した。さらに、webプラットフォームのパイロット版も作成し、テスト運用を開始したため。
|
今後の研究の推進方策 |
テスト運用中のパイロット版のwebプラットフォームを実際に使ってみて、バグを見つけて修正する。また、CasualConcによる文政を再検討し、webプラットフォームに収録するフレーズの再検討を行う。必要があれば追加し、収録フレーズのさらなる充実を図る。また、webプラットフォームに論文執筆の流れなどを解説したページを追加して、有用なコンテンツになるよう工夫する。成果を論文にまとめる準備を行う。
|