技術が進めば、何でも自動化は進むものですが。いよいよこのレベルまで実用化されてきたようです:
■ 'Robot' computer to mark English essays (Guardian)
英国の話なので、当然ながら英語の小論文ということになるのですが。テストとして出題される小論文を、AIによって採点しようという試みが行われているそうです。実際に来月から開始される"Pearson Test of English Academic"というテストで導入される予定なのだとか。
The Times Educational Supplement (TES) reports today that the Pearson Test of English Academic, an English- language exam, will launch on 26 October. It includes essay questions and will be used in 20 countries, including the UK, to rate applicants' English skills before they are admitted to university.
Computers have been programmed to scan the papers, recognise the possible right responses and tot up the marks. Pearson claims this will be more accurate than human marking.
Times Educational Supplement 紙が今日報じているところによると、英語の試験である"Pearson Test of English Academic"が10月26日より開始される。この試験は小論文のテストであり、英国を含めた20カ国で実施され、大学入学を希望する応募者の英語力を測ることが目的である。
特別なプログラムが解答用紙をスキャンし、正答を判別して点数をつける。ピアソン社は、人間が点数を付けるよりも正確だと主張している。
とのこと。まぁ、英語の場合は文章解析の技術がかなり進んでいること、ウェブサービスを使っていても実感するところではありますが。ただし文章を解析できるかどうかという点と、その文章が良いか悪いかを判別できるかどうかという点の間には、かなり大きな溝があるように思うのですが、そこまで技術が進歩したということなのでしょうか。
実際、こんな反応も出ているようです:
John Bangs, head of education at the National Union of Teachers, said that computers could be useful in many areas of assessment but cautioned against their use in English exams: "I'm very concerned that it would constrain the nature of the questions being asked. You won't pick up nuances by machine and it will trigger a trend to answering narrower questions. It could be a disaster waiting to happen."
National Union of Teachers (NUT、英国の教師団体)の代表である John Bangs は、コンピュータは採点の分野で有効活用できる可能性があるが、英語の試験の場合には注意が必要だと主張する。「それによって、課せられる質問の性質に制限が加えられてしまうのではないかと心配している。機械によって、微妙なニュアンスを判別することはできない。従ってより狭い質問に答えさせるという流れが生まれてしまうだろう。最悪の事態が待ち受けているのではないか。」
ということで、AIが答えやすいように質問の方が変わってしまうのではないかという可能性を指摘しています。確かに、「採点しやすいから」という理由でマーク式の問題が普及すれば、デジタルに割り切れる答えが導ける問題しか出題されないわけで。一見、マーク式によって少なくなった小論文形式の問題の復権と思いきや、新たな制約を生み出すことは避けられないのかもしれません。
とはいえ、ピアソン側も「機械による採点なら、主観性や疲れといった問題を避けられる」と主張し、人間による採点にも短所があることを指摘しています。個人的には、このAIがどれほどの能力を持っているのか見てみたいところ。それこそウェブサービスとして公開してしまって、どれだけ「正確な」採点ができるのか、人々に実感してもらえばいいのに……と感じてしまった次第です。
コメント