研究課題/領域番号 |
19K11957
|
研究機関 | 筑波技術大学 |
研究代表者 |
岡本 健 筑波技術大学, 保健科学部, 教授 (00349797)
|
研究期間 (年度) |
2019-04-01 – 2024-03-31
|
キーワード | CAPTCHA / バリアフリー型 / 認証技術 / 情報アクセシビリティ |
研究実績の概要 |
本研究では、人間の知覚に依存しないCAPTCHAの構築に取り組んだ。従来の研究では人間とコンピュータの識別のため、主に視覚や聴覚といった人間の知覚を利用し、「歪んだ文字を解読する能力」や「雑音を含む音声から会話内容を把握する能力」などを評価するアプローチが一般的であった。これに対し、我々の研究では、例えばマルコフ連鎖により生成されたワードサラダに対する子音の交替を評価対象とし、文章の文脈を解釈する能力に着目することで識別を試みた。このアプローチは、高齢者や身体障害者に対してアクセス可能なバリアフリーな認証手段を提供するという点で従来あったCAPTCHA研究の主流とは異なる。 マルコフ連鎖の既存研究では、合成文の不自然さ(ワードサラダ)を利用した問題生成が行われていたが、自然言語の収集困難性や検索エンジンを利用した攻撃への脆弱性が課題とされていた。提案手法では、異なる階数のマルコフモデルから生成された二種類のワードサラダ間の「文の自然さ」の違いをCAPTCHAとして使用し、新たな問題作成を試みた。このワードサラダの利用により、従来の自然文に起因する脆弱性を解消した。さらに、二種類のワードサラダの比較結果を解答する方式により、人間による正答率の低下を抑制した。 提案手法については、実証実験を行い、階数Nの文章合成によるワードサラダの多様性と人間の認証能力の関係性について考察した。前者については、マルコフ連鎖モデルから階数ごとに一定数のワードサラダを生成し、結果として得られた文章の多様性を確認した。後者については、人間が文の自然さをどの程度認識する能力を有しているかを定量的に評価した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
バリアフリー型のCAPTCHAを構築するために、本研究では新たな言語型 CAPTCHA を提案した。最初に既存のクイズ型CAPTCHAの安全性について検討し、潜在的な問題点を明らかにした。次に、自然言語を模倣する文をマルコフ連鎖に基づいて生成することで、従来方式のもつ脆弱性を解決した。提案方式ではワードサラダのみ用いることで、自然文に起因する種々の問題点の解決を試みた。さらに、複数のワードサラダを比較することで答えを導くという手法を採用し、人間による回答の正確さの低下を抑制した。これらの試みを通じて、開発した作問プログラムが、クイズ型CAPTCHAに対して高い正答率で運用できることを確認した。 言語型CAPTCHAは、人間が作成した自然言語のテキストを公開情報から大量に抽出し、問題作成することが可能な点が利点である。一方で、攻撃者もまた公開情報を調査し、問題の手掛かりを得る可能性があるという欠点がある。これらの課題に対応するため、本研究では、問題の認識が特定の知覚に依存しない新たな言語型CAPTCHAの開発を提案した。提案手法では、方言に見られる特定の子音変化を問題文に適用し、人間は理解可能だがロボットには検索を難しくするような改変を施した。また、人間による回答の正確さとロボットに対する子音変化への攻撃の成功率を定量的に評価した。
|
今後の研究の推進方策 |
人工知能の領域では、文字や音声の機械認識能力が進歩しており、特に音声型CAPTCHAでは、人間とコンピュータの差異が確認できな場合も多くある。この状況は、特に視覚障害者にとって問題であり、Webアクセシビリティ環境の未整備という状況も加わり、著しい利便性の低下につながる。このため、我々は今後の研究において、自然な文章を利用せず、不自然な機械生成文の相対的な比較問題を活用して、システムの脆弱性を修正する新たな方式を検討する。人間が記述した自然な文と機械生成文との間に存在する人間の直感的な不自然さを定量的に評価することで、問題点を改善できる可能性があると考えている。 さらに、マルコフ連鎖に基づくアルゴリズムを効果的に導入し、現存の主要なアルゴリズムと比較することにより、認識率および利便性の向上を目指す。本研究ではマルコフ連鎖型のアルゴリズムをCAPTCHAの主要部分に組み込むことで、その効果を評価する。これまでの取り組みにより、利用端末に対し通信回数、帯域、メモリの大幅な削減が可能であることが示唆されている。具体的な利点については、定量的な評価を通じて明らかにする。電子決済サービス等の実用化に向けたアルゴリズムの適応性や、既存の認証手段に対する高機能な改善も視野に入れる。 ワードサラダ識別型CAPTCHAについては、応答時間の長さが既存の方式と比較して顕著であることが認識されている。一部の研究機関によると、商用CAPTCHAの平均応答時間は、画像型で11秒、音声型で43秒と推定されている。しかしながら、現行の方式ではこれを大幅に超える時間が必要であるため、この点の改善が求められる。
|
次年度使用額が生じた理由 |
当該年度は昨年度に続きコロナ渦であった。感染症を予防するため当初予定をしていた出張を取り止め、代わりにオンライン発表等、ネットワークを用いた手段で対応したため、次年度使用額が若干生じた。この金額については、文具品などの消耗品に充当する予定である。
|