• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2015 年度 実績報告書

分散表現と構成的意味計算に基づくテキストと知識ベースの頑健なグランディング

研究課題

研究課題/領域番号 15H05318
研究機関東北大学

研究代表者

岡崎 直観  東北大学, 情報科学研究科, 准教授 (50601118)

研究期間 (年度) 2015-04-01 – 2018-03-31
キーワード自然言語処理 / 言語資源 / 知識ベース
研究実績の概要

コンピュータが自然言語を理解・推論するには,与えられたテキストを計算機が蓄積している知識にグラウンディング(対応付ける)仕組みが不可欠である.今年度は,実体・概念や関係をグランディングするためのコーパスを構築し(研究項目③),そのコーパスを使った予備実験を行った(研究項目②).
実体・概念を知識ベースにグランディングするコーパスとして,BCCWJの新聞記事コーパスに含まれる固有表現をWikipedia記事に対応付けた正解データを構築した.このコーパスでは,340件の新聞記事に出現する約26,000件の実体・概念への言及の中で,対応するWikipedia記事が存在する約22,000件に対し,そのWikipedia記事IDを付与した.このコーパスを使った予備実験として,Wikipedia内リンク確率を用いた曖昧性解消器を開発したところ,約8割の正解率でグラウンディングできることを確認した.英語では同様のコーパスがすでに存在するが,日本語に対するコーパスを構築したのは本研究が初めてである.本コーパスが日本語の実体・概念の曖昧性解消器の開発に役立つのは勿論であるが,本タスクにおける言語や文化による差異の検証が深まると期待される.
関係を知識ベースにグランディングするためのコーパスとして,「increase the risk of」―「cause」など,関係パタンのペアの類似度に関するデータを作成した.このコーパスでは,5,555ペアの関係パタンに対して,人間が7段階の類似性スコアを付与した.なお,このコーパスの構築にはクラウドソーシングを活用し,比較的安価に質の高いデータを構築した.このコーパスに含まれる関係パタンは,関係パタンの意味を語の意味の合成として計算できる可能性が高いため,深層ニューラルネットワークによる意味合成モデルのベンチマークデータとしても有用である.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

交付申請書では,本年度の研究実施計画として,③グランディングのためのコーパス構築,②関係パタンの曖昧性解消を挙げていた.研究項目③では,実体・概念と関係の両方に対してコーパスを構築して,予備実験を進めることができた.研究成果は言語処理分野で国内最大の言語処理学会で発表し,国際会議への投稿に向けて準備を進めている.研究項目③では,先ほど述べた言語処理学会に加えて,国際会議での発表や,国際ジャーナルの採択決定などの成果を生み出している.また,研究に関連して,3件の招待講演,3件の解説記事,4件の受賞があった.

今後の研究の推進方策

昨年度に作成したコーパスを活用し,グラウンディングのための計算モデルの研究を加速させる.体外発表を活発的に行うとともに,作成したコーパスや解析器の改良を続けながら,これらの成果をウェブサイト上で公開し,研究者や社会に還元する.

  • 研究成果

    (17件)

すべて 2016 2015

すべて 雑誌論文 (4件) (うち査読あり 1件、 オープンアクセス 1件、 謝辞記載あり 1件) 学会発表 (13件) (うち国際学会 2件、 招待講演 2件)

  • [雑誌論文] Modeling semantic compositionality of relational patterns2016

    • 著者名/発表者名
      Sho Takase, Naoaki Okazaki, Kentaro Inui
    • 雑誌名

      Engineering Applications of Artificial Intelligence

      巻: 50 ページ: 256-264

    • DOI

      10.1016/j.engappai.2016.01.027

    • 査読あり / オープンアクセス / 謝辞記載あり
  • [雑誌論文] 言語処理における分散表現学習のフロンティア2016

    • 著者名/発表者名
      岡崎 直観
    • 雑誌名

      人工知能

      巻: 31(2) ページ: 189-201

  • [雑誌論文] 単語の意味をコンピュータに教える2016

    • 著者名/発表者名
      岡崎 直観
    • 雑誌名

      岩波データサイエンス

      巻: 2 ページ: 47-61

  • [雑誌論文] Web応用タスクにおけるエラー分析 -Twitterを用いた疾患サーベイランスを題材に-2016

    • 著者名/発表者名
      荒牧 英治, 岡崎 直観
    • 雑誌名

      情報処理

      巻: 57(1) ページ: 32-33

  • [学会発表] 利用物に関する知識のコーパスアノテーション2016

    • 著者名/発表者名
      上村 明衣, 折田 奈甫, 岡崎 直観, 乾 健太郎
    • 学会等名
      言語処理学会第22回年次大会
    • 発表場所
      仙台市
    • 年月日
      2016-03-07 – 2016-03-11
  • [学会発表] 画像説明文生成に向けた物体間の関係の認識2016

    • 著者名/発表者名
      村岡 雅康, Sumit Maharjan, 齋藤 真樹, 山口 光太, 岡崎 直観, 岡谷 貴之, 乾 健太郎
    • 学会等名
      言語処理学会第22回年次大会
    • 発表場所
      仙台市
    • 年月日
      2016-03-07 – 2016-03-11
  • [学会発表] 日本語Wikificationコーパスの構築に向けて2016

    • 著者名/発表者名
      Davaajav Jargalsaikhan, 岡崎 直観, 松田 耕史, 乾 健太郎
    • 学会等名
      言語処理学会第22回年次大会
    • 発表場所
      仙台市
    • 年月日
      2016-03-07 – 2016-03-11
  • [学会発表] Wikipedia記事に対する拡張固有表現ラベルの多重付与2016

    • 著者名/発表者名
      鈴木 正敏, 松田 耕史, 関根 聡, 岡崎 直観, 乾 健太郎
    • 学会等名
      言語処理学会第22回年次大会
    • 発表場所
      仙台市
    • 年月日
      2016-03-07 – 2016-03-11
  • [学会発表] 分散表現による文脈情報を用いた選択選好モデル2016

    • 著者名/発表者名
      大野 雅之, 井之上 直也, 松林 優一郎, 岡崎 直観, 乾 健太郎
    • 学会等名
      言語処理学会第22回年次大会
    • 発表場所
      仙台市
    • 年月日
      2016-03-07 – 2016-03-11
  • [学会発表] 感情状態に基づく因果関係推論の一般化2016

    • 著者名/発表者名
      井之上 直也, 岡崎 直観, 乾 健太郎
    • 学会等名
      言語処理学会第22回年次大会
    • 発表場所
      仙台市
    • 年月日
      2016-03-07 – 2016-03-11
  • [学会発表] 談話内における局所文脈の動的分散表現2016

    • 著者名/発表者名
      小林 颯介, 田 然, 岡崎 直観, 乾 健太郎
    • 学会等名
      言語処理学会第22回年次大会
    • 発表場所
      仙台市
    • 年月日
      2016-03-07 – 2016-03-11
  • [学会発表] 研究室における研究・実装ノウハウの共有2016

    • 著者名/発表者名
      岡崎 直観
    • 学会等名
      言語処理学会第22回年次大会ワークショップ「論文に書かない(書けない)自然言語処理」
    • 発表場所
      仙台市
    • 年月日
      2016-03-07 – 2016-03-11
  • [学会発表] 分散表現に基づく選択選好モデルの文脈化2016

    • 著者名/発表者名
      大野 雅之, 井之上 直也, 松林 優一郎, 岡崎 直観, 乾 健太郎
    • 学会等名
      情報処理学会研究報告 自然言語処理(NL)
    • 発表場所
      株式会社ミクシィ
    • 年月日
      2016-01-22
  • [学会発表] 単語・句の分散表現の学習2015

    • 著者名/発表者名
      岡崎 直観
    • 学会等名
      WebDB Forum 2015 特別セッション3: Deep Learningと自然言語処理
    • 発表場所
      芝浦工業大学
    • 年月日
      2015-11-24 – 2015-11-25
    • 招待講演
  • [学会発表] Reducing Lexical Features in Parsing by Word Embeddings2015

    • 著者名/発表者名
      Hiroya Komatsu, Ran Tian, Naoaki Okazaki, Kentaro Inui
    • 学会等名
      Proceedings of the 29th Pacific Asia Conference on Language, Information and Computation (PACLIC 29)
    • 発表場所
      Shanghai, China
    • 年月日
      2015-10-28 – 2015-10-30
    • 国際学会
  • [学会発表] Fast and Large-scale Unsupervised Relation Extraction2015

    • 著者名/発表者名
      Sho Takase, Naoaki Okazaki, Kentaro Inui
    • 学会等名
      Proceedings of the 29th Pacific Asia Conference on Language, Information and Computation (PACLIC 29)
    • 発表場所
      Shanghai, China
    • 年月日
      2015-10-28 – 2015-10-30
    • 国際学会
  • [学会発表] 単語の分散表現と構成性の計算モデルの発展2015

    • 著者名/発表者名
      岡崎 直観
    • 学会等名
      2015年度人工知能学会全国大会(第29回), OS-1 意味と理解のコンピューティング (2)
    • 発表場所
      はこだて未来大学
    • 年月日
      2015-05-30 – 2015-06-02
    • 招待講演

URL: 

公開日: 2017-01-06  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi