2016 Fiscal Year Research-status Report
クラウドソーシングと集合知を活用した文献探索手法の研究開発
Project/Area Number |
16K00445
|
Research Institution | Nihon University |
Principal Investigator |
韓 東力 日本大学, 文理学部, 教授 (10365033)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | 機械学習 / クラウドソーシング / アノテーション |
Outline of Annual Research Achievements |
本研究では、論文間参照ネットワークを利用した文献探索に焦点を当て、論文間参照理由を参照ネットワークに付与することにより、起点論文の関連文献を効率よく探索する手法を開発し、その効果を実験により検証することを目的としている。今年度は、まず従来型の機械学習による論文間参照理由自動付与のプロセスを見直した。訓練データに混ざった人為的ミスを取り除いたり、機械学習の素性を繰り返して調整してみたが、著しい精度向上が見られなかった。その後、クラウドソーシングによる論文間参照理由のアノテーションを実施した。クラウドソーシング用のアノテーションシステムの中核部はすでに構築済であるが、アノテーションの精度を高めるために、ヒューマンコンピューテーションの考え方に基づき、さまざまな改善を加えながらシステムの仕様を大きく変更した。自由応募で集まった作業者を対象に、約1ヶ月の間にアノテーション作業を数回に分けて実施した結果、専門家に比較しても遜色しないアノテーション精度が得られていることがわかった。さらに、アノテーション作業者に対して行われたアンケートでは、「作業負担が少ない」や「作業のモチベーション維持が簡単」など、システムのユーザービリティに対しても肯定的な意見を多くいただいた。今年度は、上記の各要素技術の改善を目指し、国内外の研究機関や学会にて研究情報を収集しながら、多方面の研究者とさまざまな有益な議論を行った。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
28年度の研究目標である機械学習による論文間参照理由自動付与プロセスの見直しとクラウドソーシングによる論文間参照理由のアノテーションは概ね当初の計画とおり実施できた。前者については著しい改善がみられなかったが、後者のアノテーションの作業結果を評価した結果、専門家に比較しても遜色しないアノテーション精度が得られていることがわかった。
|
Strategy for Future Research Activity |
28年度に従来型の機械学習の素性を繰り返して調整してみたが、著しい精度向上が見られなかったため、29年度は深層学習の利用を模索してみる。また、29年度は論文間参照ネットワークの構築と文献探索者の探索目的を参照理由に置き換える仕組みの開発を行う予定である。前者については、グラフデータベースを用い、ネットワークのノードに論文を、エッジに論文間の参照関係を当てる。後者については、アノテーションシステムで採用されている階層型の参照理由群より探索目的を選択してもらうようにする。29年度は必要に応じ国内外の研究機関や学会にて研究情報収集を行いながら、上記の各要素技術の有機的融合方法を改善していく。
|
Causes of Carryover |
クラウドソーシングによるアノテーション作業者を募集したところ、集まった作業者が想定より少なかったため、当初計画にある人件費・謝金が余った。また、計画では初年度にコンピュータの購入を予定していたが、機種選定に時間がかかってしまったため、購入を次年度以降に遅らせた。
|
Expenditure Plan for Carryover Budget |
次年度では、論文間参照ネットワークの構築手法と文献探索者の探索目的を参照理由に置き換える仕組みを開発する予定である。システムの全体設計や諸機能の実装は研究代表者が行うので費用を計上しない。ただし、オンラインテストなどの作業は研究代表者の研究室に所属する学生によるアルバイトとして実施するため謝金を計上する。さらに、時間的な余裕があるなら、より作業者を集める方法を考案し、クラウドソーシングによるアノテーション作業を再度実施したいと考えている。また、28年度は機種選定に時間がかかってしまい主に研究室にあるPCを利用していたが、次年度は機械や各種消耗品の新規購入を予定している。次年度は研究手法の改善を目指し、国内外の研究機関で情報収集をしながら、それまでの研究成果を各種学会や国際会議にて積極的に公表する予定である。
|