研究課題/領域番号 |
15K02720
|
研究機関 | 九州大学 |
研究代表者 |
徳見 道夫 九州大学, 言語文化研究院, 名誉教授 (90099755)
|
研究分担者 |
田中 省作 立命館大学, 文学部, 教授 (00325549)
宮崎 佳典 静岡大学, 情報学部, 准教授 (00308701)
|
研究期間 (年度) |
2015-04-01 – 2018-03-31
|
キーワード | 英語科学論文 / 分野共通性 / コーパス / 特徴語 |
研究実績の概要 |
平成28年度は,研究実施計画に従い,次のような検討を行い,成果をあげた.
1.分野に特徴的な語彙の同定法:次項で活用するため,分野ごとの論文集に含まれる語彙のうち,各分野に特徴的なものを同定する方法を検討した.このような語彙の同定は長年,統計量を用いた方法など,数多く研究されていたが,どのように閾値を設定すべきなのか,といった点で議論の余地があった.本研究では,適当な分類モデルの下で「分野の類似関係が崩れるか否か」といった観点で閾値を設定する.また,内容を担う名詞をまずは候補とし,特徴語と認定された名詞に共起する語を,特徴語の候補に加える漸増的な方法を策定した. 2.論文断片に対する学術分野の共通性(分野共通性)を計量する技術の開発:平成27年度の同項目の成果を継続し,推進した.分野情報が付された文に対して,前項で提案した方法で同定した各分野の特徴的な語彙をマスクし,文中の語や定型表現などの出現情報に基づき,文の分野を推定するモデルを与えた.前項の分野間の類似性を考慮し,分野構成を多少アレンジした推定分野のエントロピーを分野共通性の一尺度とした. 3.小さな論文断片に対する分野共通性の付与:アブストラクト等の小さな論文断片に対して,修訂情報を試行的に付与し,その修訂情報を付すべきデータを蓄積した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
分野共通性を計量するにあたって,特徴語同定の重要性の再認識と開発に時間を要した.これは本来,研究実績2に資する副次的な事柄で,関係分野ではすでに研究し尽くされたように考えられていたが,実際に従来研究の知見を活用しようとすると問題点が数多く明らかとなり,良い意味で予想外の遅滞と考えている.また,成果発表や修訂情報の付与に関する遅れを勘案し,上記のように判断した.
|
今後の研究の推進方策 |
実施計画通りに進めて行くことを予定している.成果の公開が進んでいないため,修訂情報の付与に加え,成果発表・論文投稿等を重点化する.
|
次年度使用額が生じた理由 |
研究代表者の徳見道夫と研究分担者の宮崎佳典は、今年度予算を使い切ったが、研究分担者の田中省作は、今年度、実験やデータ作成に時間が取られ、予算が使い切れなかった。
|
次年度使用額の使用計画 |
田中省作は、次年度には、研究発表を大幅に増加して、作成した英文データを校正会社に委託して修訂情報を付してもらう予定である。その金額はおよそ90万円強である。
|