MedulavaAIと医学を学ぶ

記事を読み込み中です…

CBTで使われるIRTとは？同じ正答率でも点数が変わる理由とMedulavaのMIRT問題選定ロジック | Medulava ブログ | Medulava

CBTで使われるIRTとは？同じ正答率でも点数が変わる理由とMedulavaのMIRT問題選定ロジック

CBTの成績表を見たとき、「IRTって何？」「なぜ正答率ではなくIRT標準スコアが出るの？」と感じた人は多いはずです。医学部の共用試験CBTでは、単純な素点だけではなく、項目反応理論（IRT）という考え方が使われています。

この仕組みを知ると、CBTの見え方が変わります。さらに、日々の問題演習でも「とにかく数を解く」より、「今の自分にとって意味のある1問を選ぶ」ことが大切だと分かります。そこで重要になるのが、Medulavaが内部で採用しているMIRTベースの問題選定ロジックです。

CBTの点数は、なぜ正答率だけでは決まらないのか

まず押さえたいのは、CBTでは受験者ごとにまったく同じ問題が出るわけではない、ということです。問題はプールされた問題群から出題されるため、受験者によって問題セットが異なります。すると、単純な正答数だけでは公平に比較しづらくなります。

たとえば、同じ「1問正解」でも、その1問が「正答すると能力を見分けやすい問題」だったのか、「正答しても能力差をあまり反映しない問題」だったのかで、得られる情報は変わります。つまり、同じ正答率でも中身が違えば、評価も同じにはなりません。

ここで使われるのがIRTです。IRTは、「何問正解したか」だけではなく、「どの問題に正解したか」「その問題はどれくらい難しく、どれくらい受験者の力を見分けやすいか」まで考慮して能力を推定します。だからCBTでは、素点よりもIRT標準スコアのほうが本質に近い評価になりやすいのです。

IRT（項目反応理論）とは何か

IRTは、英語で Item Response Theory の略です。Item は問題、Response はその問題への反応、つまり正答・誤答のことです。言い換えると、IRTは「問題ごとの性質」と「受験者の解答パターン」から、見えない学力や能力を推定する考え方です。

ここで重要になるのが、各問題には固有の性質があるという視点です。代表的なのは、問題の難しさを表す「困難度」と、その問題が受験者の実力差をどれだけ見分けやすいかを表す「識別力」です。IRTでは、これらの特性が分かっている問題に対する解答状況から、受験者の能力値を推定します。

少しだけ専門用語を出すと、受験者の能力は θ（シータ）という軸で表されることがあります。能力が上がるほど正答しやすくなる、という関係を問題ごとに曲線で表し、その人の解答パターンに最も合う能力値を逆算していく、というイメージです。大事なのは数式そのものではなく、「同じ1問でも、評価に与える重みは一律ではない」という点です。

なぜCBTでIRTが使われるのか

CBTでIRTが使われる理由は、とてもシンプルです。受験者ごとに異なる問題が出題されても、なるべく公平に評価する必要があるからです。もし素点だけで評価してしまうと、少し易しい問題セットを引いた人と、少し難しい問題セットを引いた人を、そのまま比較することになります。

共用試験CBTでは、問題の事後評価、受験者ごとに異なる問題セット間の難易度調整、そして受験者の能力評価にIRTが使われます。つまりIRTは、CBTの裏側で「問題の質を見る」「問題セットの差をならす」「受験者の力を推定する」という3つの役割を担っています。

この考え方があるからこそ、CBTは「別の日に受けた」「別の問題が出た」という条件の違いをある程度吸収しながら、比較可能なスコアを返しやすくなります。CBTの成績表にIRTが出てくるのは、単に難しい統計用語を載せているからではなく、公平性を支える実務上の理由があるからです。

IRTの強みと、知っておきたい限界

IRTの強みは、問題の難しさと受験者の能力をできるだけ切り分けて考えられることです。これによって、「この人は何問当てたか」ではなく、「どのレベルの問題にどう反応したか」から評価しやすくなります。全国規模で実施される試験や、問題セットが変わる試験と相性が良いのはこのためです。

ただし、IRTは魔法ではありません。問題ごとの特性値を事前に推定しておく必要があり、そのためには十分な解答データと継続的な校正が必要です。問題プールの質が低ければ、どれだけ理論がきれいでも、出てくる推定値の質は上がりません。

もう1つ大事なのは、基本的なIRTは「能力を1本の軸」で扱いやすいという点です。たしかに試験全体の実力を大きく1つで表すことはできますが、現実の学習では「循環器は強いが腎は弱い」「知識想起は強いが臨床推論は弱い」といった複数の偏りが普通にあります。そこまで見に行こうとすると、単一のIRTだけでは足りない場面が出てきます。

MIRTとは何か

そこで出てくるのが、MIRTです。MIRTは Multidimensional Item Response Theory の略で、日本語では多次元項目反応理論と呼ばれます。ざっくり言えば、能力を1本の線ではなく、複数の軸で捉えるIRTです。

単一のIRTが「この人の総合力はどのあたりか」を見るのに向いているとすれば、MIRTは「この人はどの軸が強く、どの軸が弱いか」まで見やすくなります。これは学習文脈では非常に大きな意味があります。なぜなら、次に解くべき問題は、総合正答率だけでは決まらないからです。

同じ正答率70%でも、中身が違えば必要な次の1問は変わります。Aさんは消化器は強いが循環器が弱いかもしれない。Bさんは臓器別ではなく、病態整理や鑑別の詰めが甘いかもしれない。この2人に同じ問題を出し続けても、効率の良い学習にはなりません。MIRTは、この「弱点の形が違う」という現実に、より正面から対応しやすい考え方です。

MedulavaがMIRTを使う意味

Medulavaが内部でMIRTを用いた問題選定ロジックを採用している意味は、まさにここにあります。学習者を単純な「正答率の高い人・低い人」で分けるのではなく、複数の能力軸の偏りを踏まえて、次に解く価値が高い問題を選びにいくためです。

言い換えると、Medulavaが目指しているのは「平均点をなんとなく上げる問題演習」ではなく、「その人の理解地図を少しずつ正しく埋めていく問題演習」です。得意分野ばかり解いて気持ちよく終わるのでもなく、難問だけを浴びて消耗するのでもなく、その時点の理解に対して意味のある1問を当てにいく設計です。

内部の具体的な重み付けや各パラメータの実装詳細はここでは触れません。ただ、考え方としてははっきりしています。学習者を1本の尺度だけで見ないこと、そして「今この人に必要な問題」を複数軸で見極めること。この発想が、MIRTベースの問題選定ロジックの価値です。

だから、勉強効率が変わる

問題演習でいちばん無駄が大きいのは、「今の自分にとって情報量の少ない1問」をたくさん解くことです。簡単すぎる問題ばかりでも伸びませんし、逆に難しすぎて何も回収できない問題ばかりでも効率は落ちます。

本当に効率が良い学習は、「今の自分を最もよく測れて、しかも次の伸びにつながる問題」に寄せていくことです。IRTはこの考え方を試験評価に持ち込みました。Medulavaはさらにその先で、MIRTによって学習支援の問題選定にまで持ち込もうとしているわけです。

CBT対策において重要なのは、単に問題数を積むことではありません。自分の現在地をできるだけ正しく捉え、その現在地に対して最もリターンの大きい問題を選ぶことです。その精度が上がるほど、限られた学習時間の価値は大きくなります。

CBT対策で、今日から意識したいこと

IRTやMIRTを知ったうえで勉強するときに、まず変えるべきなのは「正答率だけで学習の出来を判断しない」ことです。何割取れたかはもちろん大事ですが、それ以上に「どの領域で落としているか」「どのタイプの問題で崩れるか」を見るべきです。

次に大事なのは、苦手を1つの箱にまとめないことです。臓器別、疾患別、病態理解、診断推論、知識想起など、弱点は複数の軸に分解できます。ここを雑に扱うと、演習量は増えても手応えだけが空回りしやすくなります。

そして最後に、次に解く問題の選び方を変えることです。「とりあえず間違えた問題をもう一回」だけでは不十分なことがあります。今の自分に必要なのが、同じ論点の再確認なのか、隣接領域への展開なのか、より見分けのつく問題なのかを考える。その発想自体が、IRT的であり、MIRT的な学習です。

まとめ

CBTで使われるIRTとは、問題ごとの難しさや識別力、そして受験者の解答パターンをもとに能力を推定する考え方です。受験者ごとに異なる問題が出題されるCBTで、公平性を保ちながら評価するために非常に相性が良い理論です。

ただ、学習は試験よりも複雑です。人の理解は1本の軸ではなく、複数の軸で凸凹しています。だからこそ、学習支援ではIRTをさらに発展させたMIRTが効いてきます。MedulavaがMIRTを用いた問題選定ロジックを採用しているのは、「平均的に問題を出す」ためではなく、「その人にとって意味のある次の1問」を選ぶためです。

CBT対策をもっと合理的に進めたいなら、正答率だけを見る勉強から一歩進んで、「どの問題が今の自分に一番効くか」を考える学習に切り替えていくことが重要です。その視点を、Medulavaはアルゴリズムとして支えようとしています。

よくある質問

Q1. IRTは偏差値と同じですか？

同じではありません。似たような「相対的な位置」を把握する感覚で語られることはありますが、IRTは単純な順位や平均からのズレではなく、問題の特性と解答パターンを使って能力を推定する考え方です。

Q2. 同じ正答率なのにIRTスコアが違うことはありますか？

あります。どの問題に正解したかによって、得られる情報が変わるからです。実際に、同じ正答数でもIRT標準スコアが異なる例は珍しくありません。

Q3. MIRTとIRTの違いは何ですか？

一番大きな違いは、能力を1軸で見るか、複数軸で見るかです。IRTは総合的な能力推定に強く、MIRTは複数の得意・不得意を扱いやすいのが特徴です。

Q4. CBT対策では何を指標に勉強すべきですか？

正答率は見つつ、それだけで終わらせないことです。どの領域で落ちたか、どのタイプの問題で崩れたか、次にどの問題を解くべきかまで見にいくと、学習効率は大きく変わります。

Medulavaは、MIRTの指標を元にあなたに最適な問題セットを作成し、また忘れたころに復習問題を出題してくれるので、効率的に実力を伸ばし、最短ルートでCBTに合格することができます！