文教速報デジタル版

BUNKYO DIGITAL

文教速報デジタル版

BUNKYO DIGITAL
英文読解中の眼球運動を記録した大規模データセットを公開 注視時間や読み飛ばしなど9項目 筑波大

筑波大学の名畑⽬真吾助教は、日本語を母語とする英語学習者が英文を読解した際の眼球運動データを集めて、約41万語以上の眼球運動データセット「TECO」を公開した。自然言語処理やAI研究を含めた幅広い活用に貢献できるとしている。

読解中の眼球運動データは、⼈間が書き⾔葉を理解する過程を明らかにするために有⽤であることが知られている。だが、アジア圏の英語学習者の文章読解を対象にしたデータは不足しており、名畑⽬助教は読解中の眼球運動データを収集して、視線計測コーパスとして公開している。

研究では日本語を使う英語を学ぶ大学生・大学院生41人が参加し、300~400字程度の英文30セット、計1万語の読解を行った。各単語を注視する合計回数や継続時間、読み飛ばしの有無など9つの指標を算出している。

単語の注視時間に影響を与えるとされる単語の⻑さと頻度の影響を検討した。すると、⻑い文字や頻度が低い語ほど注視時間が⻑くなった。これは、研究で収集した眼球運動データの妥当性が⽀持される結果だという。

研究チームは「このデータセットは、今後データ収集に⽤いた⽂章や単語に関する統計情報を付与することで拡充を図る予定だ」としている。