2012 年度実施状況報告書

グラフ理論に基づく自然言語解析の定式化

研究課題

研究課題/領域番号	23500177
研究機関	京都大学
研究代表者	森信介京都大学, 学術情報メディアセンター, 准教授 (90456773)
キーワード	言語処理
研究概要	国立国語研究所の『現代日本語書き言葉均衡コーパス』のコアデータの1/10に対して単語係り受け情報を付与し、前年度の成果である最大全域木に基づく係り受け解析器の様々な分野に対する解析精度向上を実現した。また、研究・開発を通して係り受け解析器を特許文書、レシピ、ブログ等に分野適応し、それぞれの分野と全体での精度向上を確認した。述語項構造解析や固有表現抽出を実装し、レシピを題材として、テキストを１つのフローグラフにする手法を確立した。本研究の成果である係り受け解析器とそのモデルを以下のサイトで公開し始めた。係り受け解析器 EDA： http://www.ar.media.kyoto-u.ac.jp/members/flannery/eda/
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由最大全域木に基づく係り受け解析器を様々な分野に適応し、解析精度の向上を確認した。また、本研究で提案するテキスト処理を評価するためのタグ付きデータをレシピテキストの分野において作成した。これにより、グラフ理論に基づく全体最適化としてのテキスト処理を実装・実験する準備が整いつつあるといえる。
今後の研究の推進方策	まず、今年度に作成したタグ付きデータの基準に沿って、単語分割から述語項構造解析までの様々な言語処理の段階の部分的アノテーションコーパスを作成し、対象とする分野における言語処理の精度を十分に高める。これらの組み合わせをベースラインとし、本研究計画で提案するグラフ理論に基づく全体最適化としてのテキスト処理の結果を評価する。この際、すでに一部準備したフローグラフ化したレシピテキストを用いる。
次年度の研究費の使用計画	主に、以下の目的に研究費を使用する。 1) 言語処理の各段階の部分的アノテーションコーパスの作成 2) 評価用のレシピテキストとそのフローグラフの作成 3) 全体最適化等の実装を含めた実験補助者の雇用 4) 研究発表のための出張や論文の別刷り代

研究成果
(8件)

すべて 2013 2012 その他

すべて雑誌論文 (2件) (うち査読あり 2件) 学会発表 (5件) 備考 (1件)

[雑誌論文] 自然言語処理における分野適応2012
- 著者名/発表者名
  森信介
- 雑誌名
  
  人工知能学会誌
  
  巻: Vol.27,No.4 ページ: 365-372
- URL
  http://plata.ar.media.kyoto-u.ac.jp/mori/research/public/
- 査読あり
[雑誌論文] A Pointwise Approach to Training Dependency Parsers from Partially Annotated Corpora2012
- 著者名/発表者名
  Daniel Flannery, Yusuke Miyao, Graham Neubig, Shinsuke Mori
- 雑誌名
  
  Natural Language Processing
  
  巻: 19(3) ページ: 167-191
- DOI
  NAID:40019452670
- 査読あり
[学会発表] Combining Active Learning and Partial Annotation for Japanese Dependency Parsing2013
- 著者名/発表者名
  Daniel Flannery, Yusuke Miyao, Shinsuke Mori, Tatsuya Kawahara
- 学会等名
  言語処理学会第19回年次大会
- 発表場所
  名古屋, 名古屋大学
- 年月日
  20130313-20130315
[学会発表] 『現代日本語書き言葉均衡コーパス』に対する係り受け付与2013
- 著者名/発表者名
  森信介, 小椋秀樹
- 学会等名
  言語処理学会第19回年次大会
- 発表場所
  名古屋, 名古屋大学
- 年月日
  20130313-20130315
[学会発表] レシピテキストと調理映像からの実世界理解に向けて2012
- 著者名/発表者名
  森信介, 舩冨卓哉
- 学会等名
  テキストアノテーションワークショップ・コンテスト
- 発表場所
  東京, 国立情報学研究所
- 年月日
  20120806-20120807
[学会発表] 素性頻度ファイルと部分的アノテーションコーパスからの単語分割器の学習2012
- 著者名/発表者名
  笹田鉄郎, 森信介, Graham NEUBIG, 河原達也
- 学会等名
  情報処理学会研究報告, NL207
- 発表場所
  札幌, 北海道大学
- 年月日
  20120726-20120727
[学会発表] A Machine Learning Approach to Recipe Text Processing2012
- 著者名/発表者名
  Shinsuke Mori, Tetsuro Sasada, Yoko Yamakata, Koichiro Yoshino
- 学会等名
  Cooking with Computers Workshop
- URL
  http://plata.ar.media.kyoto-u.ac.jp/mori/research/public/
- 年月日
  20120000
[備考] EDA Dependency Parser
- URL
  http://plata.ar.media.kyoto-u.ac.jp/tool/EDA/home_en.html

2012 年度 実施状況報告書

グラフ理論に基づく自然言語解析の定式化

研究代表者

森 信介 京都大学, 学術情報メディアセンター, 准教授 (90456773)

現在までの達成度 (区分)

理由

研究成果

[雑誌論文] 自然言語処理における分野適応2012

著者名/発表者名

雑誌名

URL

[雑誌論文] A Pointwise Approach to Training Dependency Parsers from Partially Annotated Corpora2012

著者名/発表者名

雑誌名

DOI

[学会発表] Combining Active Learning and Partial Annotation for Japanese Dependency Parsing2013

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 『現代日本語書き言葉均衡コーパス』に対する係り受け付与2013

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] レシピテキストと調理映像からの実世界理解に向けて2012

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 素性頻度ファイルと部分的アノテーションコーパスからの単語分割器の学習2012

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] A Machine Learning Approach to Recipe Text Processing2012

著者名/発表者名

学会等名

URL

年月日

[備考] EDA Dependency Parser

URL

2012 年度実施状況報告書

森信介京都大学, 学術情報メディアセンター, 准教授 (90456773)