文化庁・言語資源小委員会
文化庁は11日、言語資源小委員会の第一回会合を開いた。今後、大規模言語モデルとの言語の関係性などについて検討していく見込み。インターネットやAIによる日本語の変化が指摘されており、変化前野日本語を大規模データベースで保存する仕組みが検討されている。
同庁は今後の検討の観点として、言語資源の保存のあり方や大規模言語モデルと言葉の関係、言語の役割を踏まえたコーパス(言語を集めたデータベース)のあり方を示した。
会合では国立国語研究所の前川喜久雄名誉教授がプレゼン。現状の問題点として、小規模なコーパスが多いことや継続的開発が行われていない、足りないレジスターが多いなどをあげた。今後の日本語の変化要因として、インターネットやAIの影響、社会の多言語化が掲げられている。
委員らは「定期的に将来に渡って言語データを取り続けていく必要がある」と主張していた。