본문 바로가기
교육학

교육평가의 유형(교수・학습, 참고준거에 따른 평가)

by 똑똑한우주맘 2023. 5. 11.
반응형

병원을 찾게 되면 의사는 환자에게 아픈 곳에 대한 증상을 묻고 진찰과 검사를 한다. 그리고 병의 상태를 설명하며 약을 처방한 후 2~3일 뒤에 다시 오라고 한다. 이후에 다시 진료받으러 가면 환자의 상태를 진찰하고 완쾌되었다고 하거나 혹은 한 번 더 오라고 한다. 이와 같은 환자의 치료과정을 보면 의사의 평가는 처음 환자가 왔을 때, 처방・치료를 실시할 때, 치료가 끝났을 때의 세 단계의 평가로 나눌 수 있다. 교육평가도 이와 유사한 단계를 거치게 되는데, 각 단계에서 이루어지는 평가를 진단평가, 형성평가, 총합 평가라 한다. 의사가 처방을 위하여 환자에게 질문하고 진찰을 하는 것과 마찬가지로 교사도 교수・학습을 시작하기 전에 학생의 학습에 대한 심리상태와 무엇을 얼마만큼 알고 있는가를 파악해야 할 필요가 있다. 이처럼 진단평가란 교수・학습이 시작되기 전에 학생이 소유하고 있는 특성을 체계적으로 관찰・측정하여 진단하는 평가로써 사전학습 정도, 적성, 흥미, 동기 등을 측정한다. 진단평가는 학습자에게 적절한 수업전략을 투입하기 위한 목적으로 시행된다. 이를 위해 다음의 사항들을 고려해야 한다. 첫째, 학습 목표를 달성하기 위해 요구되는 능력과 기능을 갖추고 있는가를 확인한다. 둘째, 사전에 학습 목표를 달성했는가를 분석한다. 셋째, 적절한 교수법이나 대안을 제공하기 위해 학생의 특성을 파악한다. 교수・학습을 성공적으로 수행하려면 진행 과정에서의 문제점이 무엇인가를 확인하고 이를 해결해 나가는 절차가 필요하다. 형성평가는 교수・학습이 진행되고 있는 동안에 학생과 교사에게 학습 진행 정도를 알려주고 교육과정 및 수업 방법을 개선하기 위한 평가다. 형성평가라는 용어를 최초로 사용한 스크리븐(Scriven, 1967)은 교육과정의 개선을 통하여 수업을 발전시키기 위한 평가라고 정의하였다. 그러므로 형성평가는 개인별 능력에 맞추어 학습을 진행할 수 있도록 학습을 개별화할 수 있어야 하며, 평가 결과를 학생에게 적절한 방법으로 알려 줌으로써 피드백 효과가 있어야 하고, 학습 곤란을 진단하여야 하며, 학습 동기를 유발해야 한다. 이와 같은 목적을 위해서 형성평가에서는 진행되고 있는 교육내용에 부합하는 필수적이고 적절한 수준의 문항을 출제하는 것이 일반적이다. 총합 평가는 교수・학습이 완료된 시점에서 교육목표의 달성 여부나 정도를 종합적으로 판정하는 평가로써 총괄평가라고도 한다. 스크리븐은 이를 교수・학습을 통해서 성장이 이루어졌는가를 확인하고 교육목표를 성취했는가를 판정하는 평가라고 정의하였다. 일반적으로 성적표에 제시되는 서열이나 합격 혹은 불합격 판정 등을 총합 평가의 예로 들 수 있다. 총합 평가는 성취 수준의 도달 여부 판정, 서열화, 자격증 부여, 집단 간 비교, 프로그램 시행 여부 결정, 책무성 부여 등의 목적을 위하여 시행된다. 이러한 목적에 따라 교수・학습이 끝난 후에 의사결정을 위하여 총합 평가를 실시하며, 주로 교과 내용 전문가와 평가 전문가에 의해 제작된 표준화 검사를 사용한다. 총합 평가는 검사의 목적에 따라서 서열화를 목적으로 상대 비교평가를 실시하거나 성취기준의 통과 여부에 대한 판단을 목적으로 절대평가를 시행할 수도 있다. 교육평가는 대상의 특성에 대한 가치를 판단하는 것이므로 판단을 위한 기준이 필요하다. 예를 들어, 한 학생의 영어점수가 상위 3%라거나 혹은 합격 기준인 80점을 통과하였다고 평가한다. 전자는 상대적 서열에 따라서 판단한 것이고, 후자는 준거를 기준으로 하여 판단한 것이다. 평가 결과의 해석에서 참조하는 기준에 따라 규준 참조 평가, 준거참조평가, 능력 참조 평가성장 참조 평가로 분류할 수 있다. 규준 참조 평가(norm-referenced evaluation)는 개인이 얻은 점수나 측정치를 비교집단의 규준에 비추어 상대적인 서열에 의하여 판단하는 평가를 말하며, 상대 비교평가라고도 한다. 대학수학능력시험에서 제공되는 백분위(percentile), T점수9등급 점수(stanines) 등은 모두 상대적인 서열에 따른 규준 참조 평가에 해당한다. 규준(norm)이란 원점수의 상대적인 위치를 설명하기 위해 쓰이는 자(scale)로써, 평가 대상의 모집단을 잘 대표하도록 포집된 규준집단에서 얻은 점수를 기초로 만들어진다. 예를 들어, 규준집단의 영어점수 평균이 60점이고 표준편차가 10점일 때 어떤 학생의 점수가 60점이면 평균과 같으므로 백분위는 50이고 Z점수는 0점, T점수는 50점이 된다. 다른 학생의 점수가 70점이면 그 학생은 84.13 백분위에 해당하고 표준적인 Z점수는 1, T점수는 60이 된다. 규준 참조 평가는 서열화가 쉽고 경쟁을 통해 학습 동기를 유발할 수 있다는 장점이 있다. 그러나 학생이 무엇을 얼마나 아는가에 대한 평가가 아니고 상대적인 위치를 판단하기 위한 평가이므로 교수・학습의 개선에 필요한 직접적인 정보를 제공하지 못한다. 또한 고등정신 능력 함양보다는 암기 위주의 학습 유도, 서열주의식 사고의 팽배, 경쟁심의 조장, 검사 불안 등으로 인해 평가 대상의 정의적 특성에 부정적 영향을 미칠 수 있다는 단점이 있다. 의사나 간호사 자격시험에서 상대적 서열에 의하여 자격증을 부여한다면 매년 일정 수준 이상의 높은 의료인의 수준을 유지하기 어려울 것이다. 그러므로 자격증을 부여하는 검사에서는 일정 점수 이상을 획득한 대상에게 자격증을 부여하는데, 이와 같은 평가를 준거참조평가(criterion-referenced evaluation), 또 쉽게는 절대평가라고 한다. 준거참조평가는 학습자가 학습해야 할 학습과제의 영역에 대해 얼마만큼 알고 있는지를 준거에 비추어 판단하는 평가다. 준거참조평가에서 가장 중요한 요소는 과제의 영역(domain)과 준거(criterion, standard, cut-off, cut score)다. 영역은 측정하고자 하는 교육내용이며, 준거는 피험자가 어떤 일을 수행할 수 있다고 대중이 확신하는 지식이나 기술 수준을 말한다. 그러므로 준거는 교육목표를 달성하기 위해 도달해야 하는 최저기준(minimum competency level)이며, 준거 점수는 성패나 당락을 구분하기 위해 기준이 되는 점수라고 할 수 있다. 이 평가 방법은 미국의 학습 부진과 방지정책(NCLB: No Child Left Behind Act) 및 우리나라의 국가 수준 직업성취도 평가에 널리 적용되고 있으며, 2014년부터는 모든 교과서에 적용될 계획이다. 준거참조평가는 경쟁을 통한 학습자의 외적 동기 유발이 부족하다는 점이 있으나, 무엇을 알고 무엇을 모르는가에 대한 직접적인 정보를 제공함으로써 교수・학습을 개선할 수 있다는 본질적인 장점을 가지고 있다. 또한 탐구 정신과 협동심의 함양, 서열 의식보다는 지적인 성취동기 자극, 학습효과의 증진 등을 장점으로 들 수 있다. 능력 참조 평가(ability-referenced evaluation)는 학생이 지니고 있는 능력에 비추어 얼마나 최선을 다하였는가에 초점을 두는 평가다. 예를 들어, 90점의 능력을 갖춘 학생과 70점의 능력을 갖춘 학생 모두 70점을 받았을 경우 두 학생을 동일하게 평가하지 않고 각자의 능력에 비추어 보다 최선을 다한 후자의 학생에게 더 좋은 평가 결과를 부여하는 것이다. 교육평가는 교수・학습을 극대화하며 학생들이 긍정적 자아개념을 갖도록 해야 하므로 후자에게 교육적 관점에서 보다 좋은 평가 결과를 부여하는 것이 바람직하다는 이론이다. 우스터호프(Oosterhof, 2001)는 개인의 능력과 수행 결과를 비교하는 평가에서 '결과가 그 학생이 지닌 능력을 최대한 발휘한 것인가?'와 '충분한 시간이 있었다면 더 잘할 수 있었는가?'의 두 가지 질문이 고려될 수 있다고 하였다. 이처럼 능력 참조 평가는 학생 개인이 지니고 있는 능력을 최대한 발휘하였는가에 관심을 두므로 모든 학생에게 일률적인 평가 기준을 적용하는 것이 아니라 각 학생의 능력과 노력에 따라 개별적으로 평가된다는 특징이 있다. 능력 참조 평가는 특정 기능과 관련된 능력의 정확한 측정치에 의존하게 되므로 해당 능력에 제한해 학습자의 수행을 해석하게 되는 한계가 있지만, 개인을 위주로 각자의 고유한 기준을 참조함으로써 학생 개개인에게 보다 의미 있는 개별화된 평가가 가능하다는 장점이 있다. 좋은 학교와 우수한 교사는 능력이 낮은 학생을 능력이 높은 학생으로 성장시킨다. 최근에 교육을 통한 학생의 변화와 성장에 대한 관심이 증가하고 있으며, 이러한 교육적 상황을 고려해 볼 때 교육평가에서도 상대적 서열이나 준거 점수에 비추어 평가하는 것보다 교육의 진행 과정을 통하여 얼마나 성장하였는가에 비추어 평가하는 것이 더 바람직하다는 것이다. 성장 참조 평가(growth-referenced evaluation)는 일련의 교육과정을 거치면서 학생이 어떻게 얼마만큼 성장하고 변화하였는가에 초점을 두는 평가다. 최종적인 성취보다는 초기 능력 수준에 비추어 얼마만큼 능력이 향상되었는가를 기준으로 사전 능력 수준과 현재 능력 수준 간의 차이를 참조하여 평가한다. 그러므로 최종적인 평가 결과의 상대적인 위치와 관계없이 교수・학습 과정 동안에 많은 성장을 한 학생일수록 좋은 평가 결과를 받는다. 성장 참조 평가는 학생들에게 학업 증진의 기회를 부여하고 평가의 개별화를 강조한다는 특징을 지닌다. 검사 결과를 해석하기 위하여 규준 참조 평가는 개인과 타인을 비교하고 준거참조평가는 특정 영역의 준거와 비교를 하는 데 반하여, 능력 참조 평가와 성장 참조 평가는 비교의 기준이 각 개인 내에 있다는 특징이 있다. 검사의 교수적상담적 기능이 강조되는 환경에서 능력 참조 평가나 성장 참조 평가는 개별화 학습을 촉진함으로써 평가의 교육적 효과를 증진하는 방안이 될 수 있다. 즉, 능력 참조 평가와 성장 참조 평가는 개인 존중의 평가로써 개별학습을 지향하고 있으며 평가의 교수적 기능을 강조하는 선진화된 평가 방법이라 할 수 있다.

반응형

댓글