生命医学文献からの事象抽出には一つの注釈付けされたデータ(コーパス)を利用する教師あり学習を用いたシステムが主流である.しかし,このようなシステムはコーパスに書かれた限定的な事象しか抽出できず,また,多くの事象を被覆するように注釈付けをすることも莫大なコストがかかる.これらの問題に対処するために,複数の注釈付けされたデータから一つのモデルを学習することで高被覆なモデルを作成する手法,また,注釈付けされていないテキストから注釈付けする候補を見つける手法について提案・評価を行い,複数コーパスからの学習による精度向上,注釈付けされていないテキストの利用可能性を明らかにした.
|