2010 Fiscal Year Annual Research Report
オンライン学習コミュニティログからのソーシャル・アティテュードの抽出と分析
Project/Area Number |
21800087
|
Research Institution | Toyo University |
Principal Investigator |
鈴木 崇史 東洋大学, 社会学部, 講師 (70507037)
|
Keywords | 計算文体論 / 計量情報学 / 語彙指標 / 情報図書館学 / テキスト分析 |
Research Abstract |
本年度は、昨年度に引き続き、オンライン学習コミュニティログデータならびYahoo!知恵袋データの整備、分析を行うとともに、これらの分析に有効な分析手法の検討を広く他のデータセットをも利用して行った。 Yahoo!知恵袋データについては、PCや恋愛相談等、質問のカテゴリー、あるいは、優れた回答(Best answers)と通常の回答(Normal answers)、これらの文体的特徴量の差異を検討し、それぞれの特徴を明らかにした。 また、分析手法の検討に関しては、広く多種のテキストを対象とし、特定の品詞の分布特徴量、共起にもとづく諸指標、質的なカテゴリー作成にもとづく諸指標等の、テキスト解釈への有効性を検討した。同時に、この主のタスクへのランダムフォレスト機械学習法の有効性を確認した。 本研究全体を通じて、ソーシャル・アティテュード抽出、分析という当初の研究目的のうち、基礎的な特徴量の計量や諸指標の有効性の検討、これらの部分については、有力な成果を得た。今後さらに、一部のデータについては、整備、分析の結果を発表する予定である。さらに、本研究で得られた成果をもとに、ソーシャル・アティテュードを任意のテキストから自動的に抽出、分析するシステムの構築を目指したい。
|
Research Products
(5 results)
-
-
-
[Presentation] Co-occurrence-based indicators for investigating authors' styles2010
Author(s)
SUZUKI Takafumi, KAWAMURA Shuntaro, YOSHIKANE Fuyuki, KAGEURA Kyo, AIZAWA Akiko
Organizer
Bolasco, S., Chiari, I.and Giuliano, L.(ed.) Statistical Analysis of Textual Data, Proceedings of 10th International Conference Journees d'Analyse statistique des Donnees Textuelles 9-11 June 2010-Sapienza University of Rome, Edizioni Universitarie di Lettere Economia Diritto, Milano, 363-373
Place of Presentation
Sapienza University of Roma, Roma
Year and Date
2010-06-10
-
[Presentation] Exploratory analysis of stylistic characteristics in Japanese Q&A communities2010
Author(s)
SUZUKI Takafumi, KAWAMURA Shuntaro, AIZAWA Akiko
Organizer
Bolasco, S., Chiari, I.and Giuliano, L.(ed.) Statistical Analysis of Textual Data, Proceedings of 10th International Conference Journees d'Analyse statistique des Donnees Textuelles 9-11 June 2010-Sapienza University of Rome, Edizioni Universitarie di Lettere Economia Diritto, Milano, 355-362
Place of Presentation
Sapienza University of Roma, Roma
Year and Date
2010-06-09
-