研究課題/領域番号 |
25730129
|
研究種目 |
若手研究(B)
|
配分区分 | 基金 |
研究分野 |
知能情報学
|
研究機関 | 豊田工業大学 (2014-2015) 東京大学 (2013) |
研究代表者 |
三輪 誠 豊田工業大学, 工学(系)研究科(研究院), 准教授 (00529646)
|
研究期間 (年度) |
2013-04-01 – 2016-03-31
|
研究課題ステータス |
完了 (2015年度)
|
配分額 *注記 |
3,640千円 (直接経費: 2,800千円、間接経費: 840千円)
2015年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2014年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2013年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
|
キーワード | 事象抽出 / 複数コーパス / 半教師あり学習 / 教師なし学習 / 生命医学文献 / 高被覆 |
研究成果の概要 |
生命医学文献からの事象抽出には一つの注釈付けされたデータ(コーパス)を利用する教師あり学習を用いたシステムが主流である.しかし,このようなシステムはコーパスに書かれた限定的な事象しか抽出できず,また,多くの事象を被覆するように注釈付けをすることも莫大なコストがかかる.これらの問題に対処するために,複数の注釈付けされたデータから一つのモデルを学習することで高被覆なモデルを作成する手法,また,注釈付けされていないテキストから注釈付けする候補を見つける手法について提案・評価を行い,複数コーパスからの学習による精度向上,注釈付けされていないテキストの利用可能性を明らかにした.
|