facebook pixel code

Artemis(*☻-☻*)

另一個聲音∼無信效度的考試真能考出學生程度?

2016年02月25日
無信效度的考試比哪所學校滿級分有幾人更值得關切
劉仁沛、季瑋珠/臺大教授,臺北市

學測成績出爐,媒體有興趣的似乎集中在總共有幾個,以及哪所學校有幾個學生滿級分,公立明星和私立明星學校哪個表現好。但是大家都忽略了一件事,就是我們升大學的學測和指考為何各個級分的人數年年不同,各科的各種也「標」,也像浮標一樣年年變動。譬如說今年學測普遍分數比較低,滿級分只有138人,占總人數的百分之0.1,而103年學測滿級分就高達295人,占總人數的百分之0.2,而各科的各種標,也相差頗大。其主要原因為,學測級分是利用統計學的直方圖〈histogram〉將當年各科考生分數由低到高分成15組,所以會受到每年考試難易的影響,更重要的是,這樣的分級只是相對的成績,無法反映出考生真正的學科能力。學測與指考的區別,除了範圍和科目外,只是學測用級距,指考用原始分數而已。

升大學的考試,是一個年年變動,沒有標準化,及缺乏信效度評估的測驗。這個問題,遠比誰考得比較好更重要。進高中的考試由臺師大心測中心負責,雖然題庫尚無法滿足一年多次考試的期望,但至少還有定錨的理論基礎,分為精熟、基礎和待加強三等第,還可以據以調整題目的難易程度;進大學的考試由大考中心負責,無論學測指考,卻題庫不足,也無定錨,更無信效度,所有題目年年變動,年年重新入闈出題,難易、涵蓋範圍也跟著年年變動。臺灣教育無論怎麼改,總脫不了考試,這樣的考試出題方式,有足夠的代表性、鑑別力,足夠的信度效度嗎?

反觀美國集各種升學就業考試大成的教育級考試服務中心ETS--包含托福、GRE、多益等語文考試,還有美國大學入學參考或採計的SAT,以及英國的雅思官方IELTS,對於各種考試,不但有穩定的題庫,每年考試多次,也提供級分的組距,還對於各種級分給予清楚的能力描述,並且定期評估題目的信度效度,公諸於世,提供大家檢視,托福還更上層樓,進入電腦適性測驗的階段。即使在臺灣,全民英檢已經做到有常模,有題庫,每年考多次,分級考試。國家考試也有分科的題庫,定期補充更新。高中入學的會考已經有題庫,而且有清楚的定錨,技職的統測,也將正式使用題庫。我們的大學入學考試,該加把勁了,期待不但要建力充足的題庫,進行信效度評估,公諸於世,學測對每一級分代表的能力,也能有清楚的描述,以供考生和各科系參考。