研究課題/領域番号 |
15K00856
|
研究機関 | 名古屋女子大学 |
研究代表者 |
今枝 奈保美 名古屋女子大学, 家政学部, 准教授 (80387662)
|
研究分担者 |
野崎 浩成 愛知教育大学, 教育学部, 教授 (80275148)
中村 美詠子 浜松医科大学, 医学部, 准教授 (30236012)
中畑 典子 島根大学, 医学部, 助教 (40299889)
|
研究期間 (年度) |
2015-10-21 – 2018-03-31
|
キーワード | コーパス研究 / 料理データベース / 食事調査法 |
研究実績の概要 |
初年度は,過去の食事調査で収集した料理名を対象に,食事記録コーパスの実用に向けた理論設計および構造化を検討した.対象は,愛知県内の地域高齢者食事調査,愛知県栄養士会会員食事調査,日本他施設共同大規模コーホート食事調査で得られた料理名で,これらの料理名は,音声入力を想定しているので,ひらがなで表わされたデータである. 結果,ひらがな表記の料理名は,既存の自然言語処理ソフトを用いた形態素解析が不可能であったことが判り,食品・料理に特化した漢字変換ツールの開発に着手した.このツールを開発する過程で,一般住民が申告する料理名に頻発する表記揺れ(例「すぱげってぃー」,「すぱげてぃー」,「すぱげてぃ」など)をリストアップし,文字列を正規化した.加えて,料理名を処理するときのストップワードは「と」「の」,「もの」であること,漢字変換の手順は文字数の多い単語を優先すべきである等のルールを見いだした.具体的には「どん:2文字」を「丼」に変換する場合は「うどん:3文字」を優先して変換する.さらに「ぎゅうどん:5文字」は「牛丼」に変換したいので,「うどん:3文字」よりも先に変換するルールが必要であった.現状では,食事調査の出現料理80,362件のうち65%に当たる高頻出料理52,228件を適切に変換できるツールを作成した. 汎用の形態素解析器は,最近2-3年で大きく進歩し,Wikipediaなどから大量な語彙を自動的に獲得して,辞書を整備している.自動獲得が可能になったのは,開発当初に人手で整理した基本語彙があったからである.本研究が取り組んでいる食事調査専用のかな漢字変換ツールは,初歩的で人手を駆使した状況であるが,音声で記録された食事内容を,栄養士がいない場面でも機械的に認識できれば栄養価計算の省力化につながる.今後,疾病予防の概念も付与したデータベース設計に発展させたいと考えている.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
20-39歳代の若い人の食事記録が不足しているので,写真画像を伴う料理名を申告させる食事調査を実施できるように,連携研究者と計画を進めたい。
|
今後の研究の推進方策 |
ひらがなで表記された料理を,漢字交じりの料理名に集約できつつあるので,今後、集約された料理を、栄養成分表に当てはめることにより、栄養量を自動的に推定する研究に発展させる。そのためには,1)特定料理とその食材をデータベース化する,2)料理ごとに,食品のポーションサイズに関する情報を蓄積し,3)食物シソーラスを作成する.この作業は,既存研究で得られたデータを用いてシミュレーション解析を進める.食物シソーラスの作成過程を文章化したり,食物の共起状況を単語解析ソフトと用いて図示して,生活習慣病予防の栄養教育で役立つ解説資料を作成する。
|
次年度使用額が生じた理由 |
この研究は,申請当時は3年計画であったが,申請が受理されたのが年度途中の11月だったので,研究スタートが遅れてしまった.
|
次年度使用額の使用計画 |
初年度において,料理名のかな漢字変換ツールが完成したので,主要な料理・食品の出現頻度や1食分の食事で同時に出現する料理の組み合わせを示すを共起確率行列として,解析できる体制が整った.食事記録コーパスから,食品名、調理法の認識や食材の概念を階層化して、特定料理とその食材をデータベース化する作業は,疫学分野,情報処理分野の意見を集約することが肝要なので,計画的に意見交換会議を設けたい.
|