ITエンジニアに必要な今を知れる情報メディア
センター試験の英語本試験でAIが185点を獲得--“東大に入れるかプロジェクト”
news

センター試験の英語本試験でAIが185点を獲得--“東大に入れるかプロジェクト”

NTTは11月18日、国立情報学研究所(以下NII)と共同で研究開発したAIが、2019年の大学入試センター試験の英語筆記本試験で200点中185点(偏差値64.1)の成績を達成したと発表しました。

この取り組みは、NTTグループのAI関連技術corevoの研究開発と、NIIの人工知能プロジェクト「ロボットは東大に入れるか」(以下東ロボ)の一環として行われました。今回、NTTが取り組んできたセンター試験の英語科目の自動解答技術や、深層学習を用いた自然言語処理に関する知見を適用することで、最新の深層学習による文書読解技術「XLNet」を単純に適用した場合の成績に対し、30点以上(偏差値約7相当)も点数がアップしました。

XLNetは、大規模テキストによる事前学習を行ったベースモデルに、問題の性質に合わせた転移学習を施すことで、異なる種類の問題を比較的少量のデータから効率的に解くことができます。しかし、学習に利用できるデータが大きく不足している問題や、解答に辞書的な情報が不可欠な問題では、十分な精度で解答することが困難でした。

今回、英語問題のうち、XLNetでは解答が難しかった「不要文除去」「段落タイトル付与」「発音問題」について、NTTコミュニケーション科学基礎研究所を中心とした東ロボ英語チームの独自技術を適用。その結果、2019年本試験では適用前の154点から185点に上昇し、受験者中の偏差値は64.1(適用前57.0)を達成しました。また過去3年間の本試験と追試験でも、偏差値60以上を安定して上回りました。



(センター英語本試験の成績変化)

不要文除去問題では、不要文を含まない通常の文章を基に、文の順序を組み換えて不自然な流れの文章を作成することで、大量の不要文除去問題を自動作成する手法を考案。この問題を機械学習に利用することで、全15問正解できました。



(不要文除去問題の例(センター2019本試験 3A))

段落タイトル付与問題では、各段落と選択肢の類似度を計算し、最適な段落・選択肢の組み合わせを導く手法を考案。その結果、本試験・追試験の5問すべてに正答できました。

アクセント・発問問題では、深層学習ではなく、あえて発音辞書を地道に調べる方法を適用。表記ゆれを抑える工夫や問題解析器の精度を高め、ほぼ満点の成績を収めました。



(アクセント・発音問題の解答手法(アクセント箇所や単語内の指定箇所の発音を調べる手法))

今後は、グラフや表、会話の流れなど言語以外の情報や常識的知識が必要な問題に対応するため、関連する基礎研究の推進と統合を進めていく予定です。

【出典】2019年大学入試センター試験英語筆記科目においてAIが185点を獲得!

この記事はどうでしたか?

おすすめの記事

エンジニア向け求人特集

BACK TO TOP ∧

FOLLOW