経験マイニング技術の高度化と実用化
Publicly Offered Research
Project Area | Cyber Infrastructure for the Information-explosion Era |
Project/Area Number |
21013036
|
Research Category |
Grant-in-Aid for Scientific Research on Priority Areas
|
Allocation Type | Single-year Grants |
Review Section |
Science and Engineering
|
Research Institution | Tohoku University (2010) Nara Institute of Science and Technology (2009) |
Principal Investigator |
乾 健太郎 東北大学, 大学院・情報科学研究科, 教授 (60272689)
|
Co-Investigator(Kenkyū-buntansha) |
渡邉 陽太郎 東北大学, 大学院・情報科学研究科, 助教 (70583326)
阿部 修也 奈良先端科学技術大学院大学, 情報科学研究科, 研究員 (70511179)
|
Project Period (FY) |
2009 – 2010
|
Project Status |
Completed (Fiscal Year 2010)
|
Budget Amount *help |
¥4,900,000 (Direct Cost: ¥4,900,000)
Fiscal Year 2010: ¥2,400,000 (Direct Cost: ¥2,400,000)
Fiscal Year 2009: ¥2,500,000 (Direct Cost: ¥2,500,000)
|
Keywords | テキストマイニング / ブログ / 経験 / 自然言語処理 / 意味解析 / 情報抽出 / 事実性解析 / 評価極性 |
Research Abstract |
ウェブには、社会的な大事件から個人の小さな経験まで、あるいは専門家の評論から一般ユーザの意見まで、さまざまな事実や意見の膨大な情報が日々刻々蓄積されている。こうした情報の山は、使い方によっては人類共通の「知の宝庫」となる可能性を秘めている。本研究では、ウェブ文書中に言葉で書かれた事実情報や意見情報をその意味内容に基づいて整理する言語情報編集技術の開発に取り組んだ。事実や意見の情報を整理する方法には、個々の情報をさまざまな観点から分類し、大きな表のような構造をつくる方法と、個々の情報の間の関係をとらえ、ネットワーク型の構造をつくる方法が考えられる。 分類によって整理する方法については、ウェブ文書に書かれた個人の経験情報を<トピック,経験主,事態タイプ,事実性>という一般性の高い4種類の意味的な軸で分類し、巨大な経験データベースを自動生成する経験マイニング技術を世界で初めて開発した。「視力が戻る(=ポジティブな出来事)」のような幅広い事態表現を分類し、さらに事態の成立、不成立、願望などの事実性を区別して経験情報を収集する。これにより、たとえば「あるサービスの利用に伴うトラブル」や「ある商品に関心を持ちながらまだ買っていない人」など、複雑な検索も可能になる。 一方、関係によって整理する方法については、別々の文書に書かれた情報の間の隠れた根拠関係を自動的に検出する技術を開発した。前述の経験マイニング技術を発展させるとともに、情報検索基盤「TSUBAKI」や大規模知識ベース「鳥式」など、本特定領域の成果を融合することで実現した。「ブルーベリーは視力回復に効果がある?」のような質問に対し、それを支持する根拠と否定する根拠をそれぞれウェブから探し出して提示する。
|
Report
(2 results)
Research Products
(26 results)
-
-
[Journal Article] Recognizing Confinement in Web Texts2011
Author(s)
Megumi Ohki, Eric Nichols, Suguru Matsuyoshi, Koji Murakami, Junta Mizuno, Shouko Masuda, Kentaro Inui, Yuji Matsumoto
-
Journal Title
Proceedings of the 9th International Conference on Computational Semantics (IWCS 2011)
Pages: 215-224
Related Report
Peer Reviewed
-
-
-
-
-
-
-
-
-
[Journal Article] Statement Map : Reducing Web Information Credibility Noise through Opinion Classification2010
Author(s)
Koji Murakami, Eric Nichols, Junta Mizuno, Yotaro Watanabe, Shouko Masuda, Hayato Goto, Megumi Ohki, Chitose Sao, Suguru Matsuyoshi, Kentaro Inui, Yuji Matsumoto
-
Journal Title
Proceedings of the Fourth Workshop on Analytics for Noisy Unstructured Text Data (AND 2010)
Pages: 59-66
Related Report
Peer Reviewed
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-