日比嘉高研究室

近況、研究の紹介、考えたこと

センター試験後継の新テストに「国語」の記述式問題を導入したときに起こる惨状

※ 最初に大事なお断りです。下記の記述は、現在公開されている情報と、中高・予備校・大学短大の試験現場についての知見を総合して、日比が予測的に書いたものです。個人の予測ですから、当然外れたり勘違いがありえます。また採点現場の事情について触れたところがありますが、いかなる大学の個別的事情も公開しているものではありません。あくまで「国語の採点」の最大公約数的実態と日比が考えるところを述べたものです。誤解なきよう、お願いいたします。

以下長文です。目次を示しておきます。結論だけ知りたい方は、Ⅲに飛んで下さい。私が本当に言いたいことは、実はⅢだけです。

Ⅰ 最初の確認

確認A 同じ「国語」でもセンターとは出題の形式が大きく違う可能性

文科省の資料を読んでいる中で、新テスト(センター試験に代わるものとして検討されている共通テストのこと)の「国語」についての「記述式問題イメージ例」を見つけました。高大接続システム改革会議「最終報告」(平成28年3月31日)の参考資料として付されていたものです。全体像はリンク先pdfの66枚目から読むことができますが、部分のみ画像で下に示します。

f:id:hibi2007:20160905000421j:plain
f:id:hibi2007:20160905000441j:plain

現在の一般的な記述式の「国語」の出題とは、かなり違っていることがわかると思います。多くの大学入試の「国語」の問題が、長文の評論などを読解した上で、その内容の正確な把握にもとづいた要約的な解答の提出を求めているのに対し、これは複数の文章や図表、グラフを読解し、それらを総合的に突き合わせ、異なった角度から見解を示すことを求めています。

これは、「国語」という教科で養成しようとしている力が、変化している(変化させようとしている)ことに由来します。上記の「たたき台」を出したのが、「高大接続システム改革会議」であることからわかるように、高校の指導内容と、大学入試の形式と、大学の入試選抜・教育・学位授与ポリシーとを、文科省は一体的に変化させようとしているのです。

確認B 国語の採点には「ゆれ」がつきもの

国語の記述式の採点は、難しいです。難しい最大の理由は、長文の解答文を評価しなければならないことに由来します。一般的な採点の方法は、おそらく次のようにされています。

  (a) 部分点の積算 + (b) ミスの減点

50文字なら50文字の解答文のなかに、答えるべき要素(出題文から読み取る)が2つとか3つとかあります。まずそれが確実に含まれているかどうかが、(a)。ただし、この「含まれ方」にグラデーションが存在しえます。含んで欲しい情報量を完全に網羅している解答から、部分的に欠落している解答、まったく不足している解答まであります。

そして解答文は、ミスを含みます。テンパった受験生が時間に間に合わせようと必死で書く解答です。誤字脱字。テニヲハの間違い。文章のよじれ。文字数不足。などなどなど、出てしまって当然でしょう。これを加味するのが、(b)

要するに、国語の記述式の採点は、文字数が多くなればなるほど、判断するチェックポイントがどんどん増えていきます。そしてチェックポイントのそれぞれに判断の「幅」が存在しえます。その「幅」の判断が人によって分かれ、その判断の異なりが積み上がると、最終的な得点に差が出てきます。

実際の採点現場では、この「ゆれ」や「幅」をできるだけなくす工夫をしているはずです。詳細な採点基準を設けたり、採点者ごとの採点範囲を工夫したり、などです。各校の中で出題・採点をするので、それができます。

後述しますが、センター後継の新テストでは、共通の問題に対し、それぞれの大学が個別に採点を行う可能性が出て来ました。さて、何が起こるか。


確認C 入試日程の大枠は現在と大きく変わらない

国立大学協会が、入試日程について検討をしています。「大学入学希望者学力評価テストの実施時期等に関する論点整理~とくに国語系記述式試験の取扱いについて~」(平成28年8月19日)という文書です。

これによれば、現在の1月中旬のセンター試験日程より前倒しする案は、高校現場の日程から難しい。後ろ倒しは検討していませんが、つまりそれはありえないので検討もしていないということでしょう。そうすると時期はおそらく現行通りです。

下図は、野田塾が作成した「平成28年度 国公立・私立・短期大学入試日程」です。

f:id:hibi2007:20160905000734j:plain

国大協の日程検討は、当たり前ですが国立大の都合しか考えていません。私立大学・短期大学の入試日程は、現在上図のとおり。センターの追試験直後から、入試が始まっていることがわかります。採点、いったいどうなってしまうのでしょう。

Ⅱ 「記述式」導入でどうなる?

1)大学の採点担当者は寝られるのか

一番にこれを持ってきておきます(笑) 入試日程を上で確認しましたが、もっとも厳しいのは、新テストを利用する、入試日程が早く(二月上旬など)、規模も大きい私立大学です。一月下旬には大学に解答用紙が届けられるでしょうが、いったいいつ採点しろというのでしょう。

一月末~二月第一週は、多くの大学で試験期間や補講期間です。それが終わるとすぐ、私立大は入試です。平行して卒業論文修士論文の審査も行われます。

国公立大学も少し時期はズレますが、おおむね同じです。私立大学は入試日程を勘案して後期の授業終了日を早めに設定しているところが多いと思いますが、国公立はその分二月に授業や試験期間が食い込むことも多いです。大学院の入試も、二月の中旬にあるところが多いようです。

何度でも書きますが、いったい、いつ、誰が、新テストの採点をするというのでしょうか。


2)一人の解答を、複数の大学が採点する愚

国大協が出した文書では、各大学が出願後に採点するという案も出ています。(念のため言っておきますが、国大協の文書はまだ「論点整理」の段階であって、走る方向を定めた文書ではありません朝日新聞記述式、大学が採点へ センター後継新テスト 国語で検討:朝日新聞デジタル)や、読売新聞(大学入試改革 受験生のためになる1月実施 : 社説 : 読売新聞(YOMIURI ONLINE))の報道は、その点で先走りすぎています。)

大学入試は併願できますから、一人の受験生の新テストの解答用紙が、コピーされて複数の大学に行く可能性があります。

一人の受験生の同一の解答を、複数の大学が採点する──なんという労力の無駄でしょう。しかも、確認Bで述べたように、複数の採点担当者が連絡を取らないまま採点すれば、必ず「ゆれ」「幅」が生まれます。一人の受験生の「国語」の点数が、複数生まれる可能性があります。

大学は必ず、「採点の根拠の説明」を求められるでしょう。もしかしたら、採点方針の公開を求められるかもしれません。問題作成者は、大学入試センター(の後継組織)です。大学側は受動的にその問題を解くことになります。もしも各大学が採点基準を公開した場合、断言してもいいですが、絶対に各大学間でブレます。

大学入試センターもそれは見越しているでしょう。で、どうなるでしょうか。「ゆれ」を出さないための、ものすごく分厚い採点マニュアルが届き、採点者たちを押しつぶす、という未来が見える気がします。


3)受験生の力は結局うまく測れない

私は「たたき台」を見てその方向性にびっくりしましたが、ざっと読んで実は少し安心しました。あまり難しくない、と私は思いました。これなら、そんなに解答もぶれないかもしれない、と。

その次に疑問が頭をもたげました。これで本当に受験生の力が測れるのだろうか、と。

ねらいはわかります。複数の情報源を突き合わせ、多様な見方の可能性を吟味し、自から主体的に答えを出す力を測る。すばらしい。それは本当に必要な能力です。

しかし、この程度の難易度(文字数、穴埋め形式)だと、実はあまり主体的な思考力は必要とされない。たぶん、すぐにテクニカルな=受験対応的な答えの導き方が受験現場に行き渡ります。上記の「たたき台」の例でいうなら、Aさん、Bさん、Cさん、Dさんの立場をすべて自分で書け、ぐらいじゃないと本当のその人の力は見えてこないように思います。「Aさん、Bさん、Cさん・・・・Xさんの存在を発見する」という能力こそが、真に重要な力だからです。

では、そうした骨のある問題が出せるでしょうか。おそらく難しいでしょう。新テストは、センター試験と同様に、幅広い学力の受験生が受験します。

採点側の問題もあります。がっつり文字数を取って主体的な答案を書かせた場合、採点にも膨大な時間がかかります。しかも、主体的な答案は、それが主体的であるほど、独自な見解・独自な形態を含むでしょう。一人の採点者が、その採点する答案群の内部において、採点のランク付けを行うことは可能です。しかし、それを採点者間で基準の統一を図るのは、困難です。主体的な答案には、採点者も主体的に向き合うしかないからです。

とすると自然、設問は穏当で「ぬるい」ものになる。共通テストの限界です。狙った学力は、本当に測れるのか。

なお、国大協は「設問の中に構造化された能力評価の観点を踏まえつつ、各大学(学部)はアドミッション・ポリシーに基づき独自の 採点基準を採用することができ、各大学(学部)の主体性が発揮できる」と述べていますが、寝言です

たとえば、東京大学の現在のアドミッション・ポリシーはこちら。
東京大学アドミッション・ポリシー | 東京大学


抽象的です。当たり前です。具体的にしたら、受験生をそれだけあらかじめ絞ることになります。アドミッション・ポリシーは、理念です。理念を、ある教科の具体的な設問の採点基準に落としこむことなど、できるわけがありません。しかも作問者は大学入試センターなのです。

4)コンピュータ利用がキナ臭い

前掲の高大接続システム改革会議「最終報告」(平成28年3月31日)を読むと、新テストがこの先いくつかの場面においてコンピュータの利用を想定していることがうかがえます。このへんです↓。
f:id:hibi2007:20160905003805j:plain

大局的に見た場合、受験の姿は今後そのように変わっていくでしょう。しかし、この試行期には、かなりのドタバタが起こります。

私は情報技術のことは詳しくありませんが、受験の世界で情報技術に何が求められるのかについてはある程度予見することができます。センター「英語」のリスニングの前例があるからです。

リスニングのICプレイヤーの故障率について考えた記事を見つけました。
www.02320.net

故障率は、2006年当初で0.083%でしたが、2016年には0.008%にまで下がっています。2016年の場合53万人超が受けて、不具合数は43個です。

この驚異の低故障率でも、不具合が出れば絶対に新聞に載ります。どんなけ厳しいんだと思いますが、この国で、受験生の人生がかかっているセンター試験に要求されるレベルとは、0.00x%の世界です。

受験生の手書き答案に対するOCR認識が、このパーセンテージの誤差レベルまでたどり着けるのは、何年後か。
受験生の答案をタイプ別に「クラスタリング」するという技術が、このレベルの精確性まで到達するのは何年後か。

私にはそれが何年後に実現するかわかりません。意外に早いのかもしれません。しかし、コンピュータによる採点が「けっこう信用できる」レベルに到達するまで、その尻ぬぐいが回ってくるのは現場の「人間」です。

しかし、上図「記述式採点の効率化」のCBTのように、いまに本当に「受験生が直接入力によりテキスト化」とかやるようになるんでしょうか。あのシンプルなICプレイヤーでさえこの騒動なのに、パソコンを使うとか、・・・・悪寒しかしません。

5)新テストは2日間で終わらないかもしれない

現在センターの「国語」は「評論+小説+古文+漢文」で問題が構成されていますが、上記の記述問題の「たたき台」を見ると、もしかしたら問題構成自体が変わるのかもしれません。たとえば、「評論+小説+古文+漢文」+「記述」のように。

となると、解答時間は現行の80分では足りそうにありません。もしかしたら、現在の「リスニング」のように、別立ての時間が取られたりするかもしれません。将来的に「国語」だけでなく「数学」やその他の科目へと記述式問題が広がっていった場合、試験は2日間で収まらない可能性が出て来ます。

もしも収めるならば、現在の問題構成も、かなり比率が変わってくる可能性がありそうです。


さて、いい加減長くなりましのたで、まとめに入ります。まとめはシンプルです。


Ⅲ まとめ

以上要約すると、次になります。

いいかげん、研究者に研究させろよ!(怒)