2017 Fiscal Year Research-status Report
オンラインを介して 「前読書家」の読書を触発する方式・環境の開発
Project/Area Number |
16K12542
|
Research Institution | The University of Tokyo |
Principal Investigator |
影浦 峡 東京大学, 大学院情報学環, 教授 (00211152)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | Twitter / 感情要因 / 談話分析 / 態度分析 / 文書分類 / 図書に言及するツイート |
Outline of Annual Research Achievements |
申請時の計画における第一年度の(B)「図書に言及する触発的なツイートの処理機構の開発」で扱うTMB(図書に言及するツイート; Tweets that Mention Books)識別器とiTMB (inspiring TMB)スコアリングエンジンのうち、昨年度完成させた前者の成果に詳細な分析を加えた研究を国際論文誌記事として投稿し(成果[3])、後者のための基礎技術確立に従事した。TMB識別器については、エラーおよび性能の分析の結果から、データセットの増補および単語の意味を考慮したモデル化がさらなる性能向上をもたらす見込みがあるとわかった。iTMBスコアリングエンジンは、TMB識別器で得られるTMBに対して近接性・日常性・非強迫性・誘引性(総称して「触発性」と呼ぶ)に基づいたスコアを与え、ランク付けするための機構である。ただし日常性は(3)のインタフェースで扱う計画である。残る3つの触発性のうち、誘引性(ツイートの投稿者が、言及した本を肯定的に評価している様子がユーザに伝わる度合い)の定式化に関する2つの試みを国際会議で発表した。 誘引性はテキストの感情分析や評判分析の技術と関連が強いが、一般にはネガティブ感情と捉えられることの多い語彙が本に対する評価としてはポジティブに働きうること(例:泣く)から、直接的な適用が難しいことがわかった。そこでまず、感情が生起した原因(感情要因)に着目することでこの問題に対する知見が得られると考え、大規模テキストからの感情要因抽出技術をブートストラップ法に応用して開発した(成果[1])。さらに、短文であるツイートからより多くの情報を集めるため、本に関する言及が複数のツイートに亘る事例に着目し、テキストの談話的まとまりを情報理論的に定量化する手法を応用した(成果[2]) いずれの成果も誘引性の定式化に寄与できる見込みである。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
申請時点の計画で第一年度に実施する予定だった(B)「図書に言及する触発的なツイートの処理機構の開発」を第二年度も継続した。TMB識別器に関連する技術として深層学習が進展しており、雑誌論文執筆にそれを考慮したこと(投稿中)、および触発性の判定を定式化するiTMBスコアリングエンジンを構成する問題が、当初の想定より挑戦的な課題であったことに起因する。 iTMBスコアリングエンジンの中でも、今年度の主な研究実績で扱った誘引性が、先進的な課題である「態度分析」と関連することが明らかになった。一般の感情分析技術ではネガティブ感情と判定されるような語彙が、図書に対する評価としてはポジティブに使われうる(例:泣く)ためである。Twitterにおける態度分析は、2016年に国際ワークショップSemEvalの共通課題の一つとして提案されるなどここ数年注目を集めている。そこで、同課題に取り組むオーストラリア連邦科学産業研究機構(CSIRO)の言語処理研究グループと本年度3月より共同研究を始めることとした。 その他の触発性要素についても分野横断的に文献調査を進めた。ツイートの投稿者とその閲覧者との間の近しさとして定義した近接性については、Twitterのフォロー・フォロワー関係ネットワークから指標化できるか関連研究を調査し、一部の推薦システム研究で適用される信頼ネットワーク理論の応用を考慮している。本への言及が押し付けがましくないことを評価する非強迫性に関しては、関連の強い説得心理学の諸理論(心理リアクタンス理論など)からの定式化を試みている。 いずれの技術要素も、申請時点での理解・想定よりも高度な知見にたどり着いており、精度の高い結果が得られる見込みである。 カバーしたタスクと精度の関係も考慮すると、現在の進捗は妥当であると評価できる。
|
Strategy for Future Research Activity |
開発中のiTMBスコアリングエンジンについては、対応する触発性の要素ごとに次のように進める。 誘引性判定は、態度分析に関するCSIROとの共同研究を第三年度5月まで進め、その成果を本研究課題に応用する形で実装する。近接性判定は、信頼ネットワーク理論などで提案されるTwitter間のユーザ関係指標を統合して7月までに定式化する。非強迫性判定も同様のスケジュールで進める。予備的な調査では強迫的なTMBは相対的に少ないため、機械学習の適用よりもルールベース手法の方が適するものと現時点では想定している。説得心理学の関連研究から強迫的な言語表現を収集し、強迫的な表現を検出するルールの策定を目指す。 以上の要素からなるiTMBスコアリングエンジンの性能評価と成果発表を8月中に実施する。 申請時は第二年度に従事する予定だった通知インタフェース開発は本年度の半ばに実施する。 通知インタフェースは計画通り、通知の経路・表示する情報量・タイミングの3観点をユーザの情報環境のハード面とソフト面それぞれを考慮して通知の戦略を策定し、実装する。このモジュールは比較的仕様が定まっているため、作業期間の短縮が可能である。少数の協力者を募って行う通知インタフェースの予備的な試験運用と並行して、図書に言及する触発的なツイートの処理機構と通知インタフェースを統合したWebアプリケーションの開発を12月までに完了させる。 12月から1月にかけて第三年度に予定していたβテストを追跡可能な実験協力者を中心に実施する。円滑な実験のため実験協力者の募集は第三年度半ばから順次始めておくものとし、関連する学内の倫理審査も第三年度の早期に実施する予定である。第三年度末は実験結果の分析とその結果の発表に充てる。
|
Causes of Carryover |
触発的なツイートの処理機構の開発を第2年度にも継続したこと、関連するテーマについて研究を強化するために豪CSIRO研究所・米Colvin Collegeと国際共同研究を開始したことから、評価のために見込んでいた人件費の一部を第3年度に繰越すことになった。また関連して当初予定していた国際会議発表が第3年度に入ることになった。 関連技術環境の変化により当初予定よりも高度な技術的な展開を進めたことに伴い時間を要したが、その点を除けば研究計画自体の大枠に変更は必要ない。今年度までの成果の発表を第3年度に行うとともに第3年度にもともと予定されていた評価の一部をモジュール化しまた評価を集中的に行うことで研究に適切な予算の執行を行うことが可能である。
|
Research Products
(6 results)