Approach to inverse sequence alignment with conditional random fields and its application to information extraction
Project/Area Number |
18700148
|
Research Category |
Grant-in-Aid for Young Scientists (B)
|
Allocation Type | Single-year Grants |
Research Field |
Intelligent informatics
|
Research Institution | Nara Institute of Science and Technology |
Principal Investigator |
SHIMBO Masashi Nara Institute of Science and Technology, 情報科学研究科, 助教授 (90311589)
|
Project Period (FY) |
2006 – 2008
|
Project Status |
Completed (Fiscal Year 2008)
|
Budget Amount *help |
¥3,800,000 (Direct Cost: ¥3,500,000、Indirect Cost: ¥300,000)
Fiscal Year 2008: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
Fiscal Year 2007: ¥1,200,000 (Direct Cost: ¥1,200,000)
Fiscal Year 2006: ¥1,300,000 (Direct Cost: ¥1,300,000)
|
Keywords | テキストマイニング / 情報抽出 / 並列句解析 / 系列アラインメント / 自然言語処理 / アラインメント / 構文解析 / 医学文献 / 並列句 |
Research Abstract |
条件付き確率場の近似法である平均化パーセプトロン学習を用いて逆系列アラインメント(inverse parametric sequence alignment)問題を解くための手法を提案した.逆系列アラインメントとはすなわち,与えられた訓練データから編集コストモデルを学習する問題である.応用として生物学文書(英語)および日本語(百科辞典および新聞記事)からの並列句検出および範囲同定に適用し,既存法に比べて高い精度を得た.タグ付け(教師データ)が不十分な場合でも対処するために2種類のヒューリスティックを提案し,その有効性を実証した.
|
Report
(4 results)
Research Products
(28 results)