Skor Ujian Pelajar Beritahu Kami Lebih Banyak Mengenai Komuniti Mereka Hidup Daripada Apa Yang Mereka Ketahui

Setiap tahun, penggubal dasar di seluruh Amerika Syarikat membuat keputusan mengubah kehidupan berdasarkan hasil ujian standard. Keputusan-keputusan yang tinggi ini termasuk, tetapi tidak terhad kepada, promosi pelajar ke peringkat gred berikutnya, kelayakan pelajar untuk mengambil bahagian dalam kursus lanjutan, kelayakan untuk lulus sekolah menengah dan kepemimpinan guru. Dalam 40 menyatakan, guru dinilai sebahagiannya berdasarkan keputusan dari ujian piawai pelajar, seperti pentadbir sekolah di hampir 30 negeri.

Walau bagaimanapun, penyelidikan menunjukkan bahawa hasil ujian piawai tidak mencerminkan kualiti pengajaran, kerana ia bertujuan untuk. Rakan sekerja dan saya telah menjalankan kajian di Jersi baru, Connecticut, Massachusetts, Iowa and Michigan.

Keputusan menunjukkan bahawa mungkin untuk meramalkan peratusan pelajar yang akan mendapat skor mahir atau ke atas pada beberapa ujian piawai. Kita boleh melakukan ini dengan melihat beberapa ciri penting masyarakat, bukan faktor yang berkaitan dengan sekolah sendiri, seperti nisbah pelajar-guru atau kualiti guru.

Ini menimbulkan kemungkinan terdapat kekurangan serius yang dibina dalam sistem akauntabiliti pendidikan dan keputusan mengenai pendidik dan pelajar yang dibuat dalam sistem tersebut.

Ujian piawai

Skor pelajar pada ujian standard yang diperintahkan telah digunakan untuk menilai pendidik, pelajar dan sekolah AS sejak Presiden George W. Bush menandatangani Tiada Kanak-kanak yang Left Behind Act (NCLB) di 2002.

Walaupun lebih daripada 20 menyatakan sebelum ini menguji ujian negeri pada beberapa peringkat gred oleh 1990 akhir, NCLB mengesahkan ujian seragam tahunan dalam semua keadaan 50. Ia memerlukan ujian matematik yang standard dan ujian seni bahasa Inggeris dalam gred tiga hingga lapan dan sekali di sekolah menengah. Pegawai pendidikan negeri juga perlu mengendalikan ujian sains yang standard dalam gred keempat, gred lapan dan sekali di sekolah menengah.


grafik langganan dalaman


Pentadbiran Obama memperluas ujian seragam melalui keperluan dalam program geran Race ke atas dan dengan membiayai pembangunan dua ujian berstandar nasional yang berkaitan dengan Standard Negeri Teras Biasa: Konsortium Penilaian Smarter Balanced (SBAC) dan Perkongsian untuk Penilaian Kesediaan Kolej dan Kerjaya (PARCC).

Empat puluh lima negeri pada mulanya menerima pakai Core Common dalam beberapa bentuk. Kira-kira 20 kini menjadi sebahagian daripada consortia PARCC atau SBAC. Bahagian utama Perlumbaan ke aplikasi Teratas yang diperlukan negara menggunakan hasil ujian pelajar untuk menilai guru dan pengetua.

Meramalkan skor

ia sudah mantap bahawa keluar sekolah, demografi komuniti dan pembolehubah peringkat keluarga sangat mempengaruhi pencapaian pelajar dalam ujian berskala besar berskala besar.

Sebagai contoh, pendapatan keluarga median adalah peramal yang kuat dari keputusan SAT. Faktor lain yang sangat berkaitan dengan pencapaian ujian seragam negeri termasuk tahap pendidikan ibu bapa, peratusan ibu bapa tunggal dalam komuniti sekolah dan peratusan keluarga yang hidup dalam kemiskinan dalam masyarakat.

Kami memutuskan untuk melihat sama ada kami boleh meramalkan skor ujian piawaian berdasarkan faktor demografi yang berkaitan dengan komuniti di mana pelajar tinggal. Dengan melihat tiga hingga lima pembolehubah demografi masyarakat dan keluarga dari data Banci AS, kami telah dapat meramalkan dengan tepat persentase pelajar yang mendapat skor mahir atau lebih tinggi pada markah ujian standard untuk gred tiga melalui 12. Ramalan ini dibuat tanpa melihat faktor data daerah sekolah seperti saiz sekolah, pengalaman guru atau perbelanjaan murid.

Model kami dapat mengenal pasti berapa banyak pemboleh ubah tertentu mempengaruhi skor murid. Ini membolehkan kita mengenal pasti ciri demografi yang paling penting kerana ia berkaitan dengan keputusan ujian. Sebagai contoh, dengan melihat hanya satu ciri - peratusan keluarga dalam komuniti tertentu yang hidup dalam kemiskinan - kita dapat menerangkan hampir 58 peratus skor ujian dalam seni bahasa Inggeris kelas lapan.

Kajian terbaru kami meneroka tiga tahun skor ujian dari gred enam hingga lapan dalam lebih daripada sekolah 300 New Jersey. Kami melihat peratusan keluarga dalam masyarakat dengan pendapatan melebihi US $ 200,000 setahun, peratusan orang dalam komuniti dalam kemiskinan dan peratusan orang dalam komuniti dengan ijazah sarjana muda. Kami dapati bahawa kami dapat meramalkan peratus pelajar yang mendapat mahir atau lebih tinggi dalam 75 peratus sekolah yang kami sampel.

Satu kajian awal yang menumpu pada skor ujian gred kelima di New Jersey meramalkan keputusan tepat untuk 84 peratus sekolah selama tempoh tiga tahun.

Penilaian lebih bijak

Untuk menjadi jelas, ini tidak bermakna wang menentukan berapa banyak pelajar boleh belajar. Itu tidak boleh jauh dari kebenaran. Malah, keputusan kami menunjukkan bahawa ujian standard tidak benar-benar mengukur berapa banyak pelajar belajar, atau seberapa baik guru mengajar, atau bagaimana pemimpin sekolah yang berkesan memimpin sekolah mereka. Ujian ini adalah instrumen tumpul yang sangat mudah untuk mengukur faktor-faktor luar sekolah.

Walaupun sesetengah penyokong taksiran penilaian standard bahawa skor boleh digunakan untuk mengukur peningkatan, kami mendapati bahawa terdapat terlalu banyak bunyi. Perubahan dalam skor ujian dari tahun ke tahun boleh dikaitkan dengan pertumbuhan normal sepanjang tahun sekolah, sama ada pelajar mengalami hari yang buruk atau merasa sakit atau lelah, kerosakan komputer, atau faktor lain yang tidak berkaitan.

Menurut manual teknikal yang diterbitkan oleh pencipta penilaian standard, tiada ujian yang sedang digunakan untuk menilai keberkesanan guru atau pentadbir sekolah atau pencapaian pelajar telah disahkan untuk penggunaan tersebut. Sebagai contoh, tiada penyelidikan PARCC, sebagai yang disediakan oleh PARCC, menangani isu ini secara langsung. Ujian ini tidak direka untuk mendiagnosis pembelajaran. Mereka hanya memantau peranti, seperti yang dibuktikan oleh laporan teknikal mereka.

Intinya adalah ini: Sama ada anda cuba mengukur kecekapan atau pertumbuhan, ujian seragam bukanlah jawapannya.

Walaupun keputusan kami di beberapa negeri telah menarik, kami memerlukan lebih banyak penyelidikan di peringkat kebangsaan untuk menentukan betapa banyak skor ujian yang dipengaruhi oleh faktor luar sekolah.

Sekiranya keputusan ujian piawai ini dapat diramalkan dengan tahap ketepatan yang tinggi oleh faktor komuniti dan keluarga, ia akan mempunyai implikasi dasar yang besar. Pada pendapat saya, ia mencadangkan kita harus melepaskan seluruh dasar dasar yang menggunakan keputusan ujian sedemikian untuk membuat keputusan penting mengenai kakitangan sekolah dan pelajar. Lagipun, faktor-faktor ini berada di luar kawalan pelajar dan kakitangan sekolah.

Walaupun terdapat pertikaian ideologi tentang merit keputusan ujian standard, sains telah menjadi lebih jelas. Hasilnya menunjukkan hasil ujian yang seragam memberitahu lebih banyak tentang komuniti di mana pelajar hidup daripada jumlah pelajar yang dipelajari atau pertumbuhan akademik, sosial dan emosi pelajar semasa tahun sekolah.

Walaupun sesetengah mungkin tidak mahu menerimanya, dari masa ke masa, penilaian dibuat oleh guru adalah penunjuk prestasi pelajar yang lebih baik daripada ujian seragam. Sebagai contoh, IPK sekolah tinggi, yang berdasarkan penilaian bilik darjah, adalah pencapaian pelajar terbaik dalam tahun pertama kolej daripada SAT.

PerbualanPerubahan ini akan memberikan banyak maklumat penting tentang pengajaran yang berkesan, berbanding dengan skor ujian yang tidak berkaitan dengan guru.

Mengenai Penulis

Christopher Tienken, Profesor Madya Pengurusan dan Dasar Kepimpinan Pendidikan, Universiti Seton Hall

Artikel ini pada asalnya diterbitkan pada Perbualan. Membaca artikel asal.

Buku oleh Penulis ini

at InnerSelf Market dan Amazon