교사평가

전문가, 교사를 공정하게 평가할 기준 마련에 나서다

Rebecca Gibson
28 October 2015

1 min read

교사의 성과를 판단하는 일은 어렵지만 반드시 해야 할 일이다. 교육전문가들은 얼마나 많은 평가방법을 결합해야 개별교사의 성과를 정확하고 공정하게 측정할 수 있는지 연구하고 있다.

핀란드 교육노동조합(Trade Union of Education in Finland, OAJ)의 노동시장 상담가인 라우라 누미넨(Laura Nurminen)은 교사를 어떻게 평가해야 하느냐는 질문에 다음과 같은 비유로 답변을 시작한다. “사고로 심각한 부상을 입은 사람이 있는데 외과의사가 그 사람의 목숨을 구했습니다. 하지만 다리를 절단할 수 밖에 없었는데 그렇다면 그 외과의사는 잘한 것일까요 잘못한 것일까요?”

이렇게 운을 뗀 누미넨은 교육계에서 일어날 수 있는 일을 예로 든다. “교사와 관련해서도 이와 유사한 질문을 던질 수 있습니다. 학습장애를 지닌 학생을 가르쳐 읽고 쓰고 짧은 글을 이해할 수 있게 만들었습니다. 그러나 연말이 되어도 해당 학생은 정확한 맞춤법을 구사하지 못했습니다. 그렇다면 그 교사는 ‘좋은’ 교사일까요 ‘나쁜’ 교사일까요?

이 질문은 여러 나라의 정부와 교육 관련 협회 및 학교가 직면한 난제인데, 반드시 해답을 찾아야 하는 중요한 문제다. 2015년 5월 경제협력개발기구(OECD)는 “보편적인 기본 기술 – 국가가 확보해야 하는 것(Universal Basic Skills – What Countries Stand to Gain)”이라는 보고서를 발간했다. 보고서는 조사 대상 76개국 중 9개국의 학생 66% 이상이, 그리고 세계에서 가장 부유한 국가인 OECD 국가 중 일부 국가에서도 상당한 비중의 학생이 반드시 필요한 기본 기술조차 습득하지 못한 채 학교를 졸업한다고 밝혔다. 연구결과는 많은 나라들이 교사에 대한 평가방법을 재검토할 필요성이 있다고 촉구했다. 보고서는 특히 한 나라의 교육시스템의 질과 해당국가의 GDP 성장 사이에는 밀접한 상관관계가 있음을 밝혀냈다.

STEM 교육연대(STEM Education Coalition) 사무국장인 제임스 브라운(James Brown)은 이에 대해 다음과 같이 강조했다. “과학, 기술, 공학, 수학(STEM) 교육은 근대 글로벌 경제에서 미국이 경제적으로 번영할 수 있을 것인지의 문제와 밀접하게 관련됩니다. 강력한 STEM 기술은 다방면에 걸친 교육의 핵심요소이자 효과적인 시민을 육성하는데 반드시 필요한 필수요소입니다. 수 많은 연구를 통해 아동의 교육에 가장 큰 영향을 미치는 요인은 교사라는 사실이 입증되었습니다. 미국 정부가 STEM 교육 컨텐츠에 대한 지식과 수업 능력을 갖춘 신규 채용 교사들을 교육시키고 유지시키는데 탄탄하고 지속적인 투자를 해나가는 것이 무엇보다 중요합니다. 그렇게 되면 학생들이 STEM 관련 직종에 흥미를 갖게 할 수도 있을 것입니다.”

“NOTHING IS MORE IMPORTANT TO A CHILD’S EDUCATIONAL SUCCESS THAN A GOOD TEACHER.”

JAMES BROWN
EXECUTIVE DIRECTOR, STEM EDUCATION COALITION

다양한 평가방법

OECD 연구의 대상이었던 많은 나라에서 학생의 시험점수에서 수업참관, 동료교사평가, 학생설문조사에 이르는 여러 가지 구조화된 평가방법을 통해 교사의 성과를 평가하고 있었다. 그러나 대부분은 교사가 학생에게 미치는 영향을 정확하고 공정하고 신뢰할 수 있도록 평가하는 일은 어려운 문제라고 입을 모은다. OECD 교육 및 기술부(Directorate of Education and Skills) 책임자 겸 OECD 사무총장의 교육정책 자문가인 안드레아스 슐라이허(Andreas Schleicher)는 이렇게 말했다.

“학생 발전은 교사의 성과를 평가하는 지표가 됩니다. 학생에게 아무런 진전이 없으면 교사의 성과도 낮게 평가되어야 합니다. 그러나 ‘효과적인 교육’에 대한 규정이 없기 때문에 양적으로 측정하기도 어렵습니다. 학습의 질과 경험이 동일한 것 일까요? 비판적 사고와 토론하는 능력을 배양시키는 교사보다 학생의 점수를 향상시킨 교사를 더 높게 평가해야 할까요? 아니면 앞서 말한 모든 것뿐 아니라 그 이상의 것을 성취한 교사만이 효과적으로 가르쳤다고 할 수 있는 것일까요?”

호주 멜버른 교육대학원(Australia’s Melbourne Graduate School of Education)의 멜버른 교육연구소(Melbourne Education Research Institute, MERI) 소장인 존하티(John Hattie)는 교사의 성과를 평가함에 있어 고려해야 할 문제는 두 가지뿐이라고 믿는다. 하나는 무엇으로 학생들에게 미친 전반적인 영향을 입증할 것인가 하는 문제고 다른 하나는 그 결과 교사가 취한 행동은 무엇인가 하는 문제다.

하티는 “모든 학생은 매년 성장을 지속”해야 하지만 “학생의 성장을 구성하는 요소는 학교마다 다르다”고 강조한다. 따라서 교사의 성과는 학교가 무엇을 기대했는가에 따라 달라질 수밖에 없습니다.”

학생점수 활용

일부 국가에서는 외부 관계자들이 규정한 표준화된 기준에 따라 교사를 평가한다. 예를 들어 2015년 엔리케 페냐니에토(Enrique Peña Nieto) 멕시코 대통령은 교사채용, 교사평가, 교사 승진 시 의무적으로 표준화된 자격시험을 치르도록 하는 규정을 도입했다.

미국에서는 2001년 아동낙오방지법(No Child Left Behind, NCLB)이 도입되면서 부가가치 평가법이라고도 부르는 표준화된 시험점수가 규범이 되었다. OECD에 따르면 미국교사의90% 이상이 이 방법을 통해 평가를 받았고 오바마 대통령이 이끄는 행정부가 도입한 “1등을 향한 경쟁(Race to the Top)” 사업은 교사 평가 프로그램에 학생 점수를 활용하는 주와 지역학교에 연방 자금을 추가 지원한다.

그와 같은 프로그램의 전제는 단순하다. 효과적인 교사일수록 학생의 표준화된 시험점수가 높다는 것이다. 그러나 이 방법의 지지자와 반대자들의 반응은 절대 단순하지 않다.

미국에서는 학생 점수를 바탕으로 교사를 평가하는 문제와 관련해 뜨거운 논쟁이 한창인데 미국 교사평가 전국 위원회(National Council on Teacher Quality) 회장 케이트 월시(Kate Walsh)가 이 문제에 대해 견해를 밝혔다. “가르치는 일이 복잡한 일이므로 교사의 수업에 대한 평가는 다양한 요인을 바탕으로 이루어질 수 있고 그래야 합니다. 그러나 분명한 사실은 교사의 수업이 훌륭하면 학생의 성취도가 향상된다는 점입니다. ‘효과적인’ 교사에 대한 의미 있고 객관적인 평가를 내리려면 학생이 낸 결과물을 바탕으로 평가해야 합니다. 교사 평가에서 학생의 성장에 초점을 맞추는 것은 학생의 학업 성취도 향상이라는 교사의 일차적인 책무를 반영하는 것입니다. 따라서 학생의 성장 및 부가가치 데이터야말로 성과 평가에 가장 중요한 요소가 되어야 하는 것입니다.”

콜럼비아 법과대학 사이먼 H. 리프킨드 교수 겸 공공연구 및 리더십을 위한 콜럼비아센터 센터장인 제임스 리브맨(James Liebman)도 이에 동의한다. 리브맨은 학생의 시험점수를 토대로 한 부가 가치분석은 서로 다른 학생수를 고려하여 유사해 보이는 교사와 학교를 서로 비교할 수 있는 토대를 제공한다고 주장한다.

리브맨은 이렇게 말했다. “학생들은 얼마나 많은 것을 배웠는지 알고 싶어합니다. 현재 미국에서 활용하는 ‘스마터 밸런스드(Smarter Balanced)’와 ‘대학 진학 및 취업 적합성 여부 평가를 위한 파트너십(Partnership for Assessment of Readiness for College and Careers)’ 평가는 지속적으로 개선되어 왔습니다. 따라서 불완전할지는 모르지만 시험 점수는 중요한 학습 결과를 측정하는 평가근거로서 적절하다고 봅니다.”

높은 수준의 책임감

그러나 비판가들이 표준화된 시험은 교수 학습과정의 복잡성을 정확하게 반영하지 못하므로 시험점수를 바탕으로 교사를 평가하는 것은 공정하지 못하다고 주장하고 나서면서 학생의 시험점수를 바탕으로 이루어지는 교사평가는 강한 반발에 부딪혔다.

피터 Z. 쇼체트(Peter Z. Schochet)와 핸리 S. 창(Hanley S. Chiang)은 “학생시험점수를 바탕으로 한 교사 및 학교성과 평가의 오류율(2010)”이라는 제목의 보고서에서 일 년치 시험데이터를 활용해 교사의 평균성과를 평가할 경우 오류율이 35%, 3년치 시험데이터를 활용하는 경우 오류율이 25%에 달한다고 보고했다. 한편 토마스 J. 케인(Thomas J. Kane)과 더글라스 O. 스테이저(Douglas O. Staiger)는 “학교시험 점수의 변동성: 시험점수를 바탕으로 책임감을 평가하는 제도에 시사하는 바(2002)”라는 제목의 보고서에서 상승 또는 하락한 학생점수의 50%-80%는 일회적인 요인 때문이라고 보고했다. 그 예로 시험 도중 주차장에서 개가 짖어대는 등의 요인을 꼽을 수 있다.

테네시 교육협회(Tennessee Education Association)와 텍사스주의 휴스턴 교사연맹(Houston Federation of Teachers)을 비롯한 미국의 일부 교사노동조합은 연방법원에 소송을 제기해 시험점수 기반교사 평가에 맞서고 있다. 이들은 정부가 마련한 표준시험 비대상 학교의 교사들은 학생의 성적이 좋지 못할 경우 부당한 징계를 받는다고 주장한다.

AFL-CIO 소속 미국교사연맹(American Federation of Teachers, AFT) 사무부국장인 메리 캐서린 리커(Mary Cathryn Ricker)는 다음과 같은 견해를 밝혔다. “표준화된 시험은 교사, 학부모, 학교에 학생들의 향상을 돕기 위해 필요한 정보를 전달하는 목적으로만 활용되어야 하며 개별교사를 제재할 목적으로 사용 되어서는 안됩니다. “아동낙오방지법(NCLB법)으로 평가 및 제재정책이 도입되었습니다. 그 결과 교사들은 깊이 있는 수업을 하기보다 시험에서 높은 점수를 받게 만드는 데 집중하게 되었습니다. 하지만, 시험점수에 대한 집착은 교사나 학생의 전반적인 학습 품질을 개선시키지 못했습니다. 학생이 성공하는 데 필요한 수준 높은 교육을 실현하기 위해 시험 점수의 오용 및 남용을 막을 필요가 있습니다. ”

교사 역시 학습자다

슐라이허는 OECD 국가 교사의 65%가 학생의 시험점수가 자신의 성과를 평가하는 데 중요하게 작용한다고 여긴다고 말했다. 그러나 훌륭한 교육시스템을 갖춘 상위권 국가 대부분은 교사가 학습목표에 얼마나 부합하는 수업을 했는지, 학교 내에서 자신의 맡은 역할을 얼마나 충실히 수행했는지를 분석하는 평가를 더 선호한다.

예를 들어 가나는 올해 제3차 교사의 전문성 개발 및 관리(Pre-tertiary Professional Teacher Development and Management) 정책을 새롭게 도입해 시범운영에 들어갔다. 이 정책이 도입된 뒤부터는 교사의 헌신도와 전문성 개발 수준에 따라 교사를 평가해 보상하게 된다. 런던에 위치한 아크 글로브 아카데미(Ark Globe Academy) 교장은 매주 축구방식의 지도세션을 도입해 개별 교사들에게 제공하고 있다.세계 최고의 교육시스템을 갖춘 나라로 널리 인정받는 핀란드의 교사들은 전문성 개발목표를 수립하고 교장과 함께 매년 열리는 연례성과 평가회에 참석해야 한다.

핀란드 교육노동조합의 누미넨은 이렇게 설명했다. “핀란드 교사들은 석사학위를 취득해야 합니다. 따라서 교육전문가로서 인정받을 뿐 아니라 전문가로서의 자율성도 인정받고 있습니다. 표준화 된 평가를 받아야 하는 부담이 없으면 학생들의 성과가 더 높아지는 것과 마찬가지로 교사 역시 교육할 자유를 누리게 되면 매년 치러지는 평가를 통과할 방법을 터득하려 애쓰기보다 자신의 교수법을 향상시킬 방법을 찾는 데 전념하게 됩니다.”

적극적인 역할 수행

대부분의 연구자들과 교육자들은 교사평가의 일차적인 목적과 방법이 무엇이든 관계 없이 교사들은 제대로 훈련 받고 전문성을 개발할 능력을 갖추고 있을 때 가장 효과적인 교사가 될 수 있다고 입을 모은다.

OECD 보고서 “탈리스 2013 결과: 교수학습관련 국제전망(TALIS 2013 Results: An International Perspective on Teaching and Learning)”는 여러 국가에서 이와 같은 접근법이 훌륭하게 작동하고 있다고 지적했다. 예를 들어 일본교사의 80%는 공식적인 평가를 통한 피드백을 받은 뒤 가르치는 역량이 ‘중’에서 ‘상’으로 높아졌다. 이와 유사하게 2012년 국제학생 평가프로그램(PISA)에서 상하이와 경합 끝에 1위를 차지한 싱가포르에서는 신임교사의 99%가 공식적인 신임교사교육 프로그램에 참여하고 40%는 멘토를 두고 있으며 교장의 80% 이상이 교사들에게 교사 자신과 학생의 학습을 개선할 책임을 지우고 있다.

AFL-CIO 소속 미국교사연맹의 리커는 이렇게 말했다. “교사와 노동조합이 협업하여 구축한 평가모델이 가장 강력한 평가방법입니다. 신임으로 열과 성을 다하는 좋은 교사들이 온전한 지원을 받지 못했다면 낙오되고 말았을 학생이 누구인지 찾아내어 끌어주도록 지원하기 때문입니다. 교사는 수업을 진행한 몇 달 뒤에 외부행정가로부터 피드백을 받을 수 있습니다. 그러나 학생들과 마찬가지로 교사도 스스로 평가하거나 학생들에 대해 잘 알고 있는 동료들로부터 실시간으로 조언을 받을 때 더 많이 개선되는 경향을 보입니다.”

더 나은 평가시스템 구축

많은 사람들은 효과적인 교육에 대한 보편적인 정의가 이루어지지 않는 한 교사의 성과를 정확하게 평가할 수 있는 유효한 도구를 개발하는 것은 불가능에 가까울 것이라고 입을 모은다.

영국에 위치한 교육컨설팅기업인 에비던스 베이스드 닷 에듀케이션(evidencebased.education) 소장인 스튜어트 킴(Stuart Kime)은 이렇게 말했다. “현재의 평가시스템은 교사가 갖춘 교육 콘텐츠에 대한 지식 같은 요인을 평가하는 데 사용할 수 있습니다. 그러나 교사가 학생들의 학습에게 영향을 미치는 데 기여할만한 측면들은 매우 다양해서 양적으로 측정할 수 없는 요인도 많습니다. 예를 들어 학급관리는 학습에 영향을 미치는 요인입니다. 하지만 가장 널리 사용되는 평가시스템에서조차 학급관리를 신뢰성 있게 평가하기란 어렵습니다. 학급관리가 학생의 학습에 미치는 영향을 평가하기란 아주 어렵습니다.”

킴은 잉글랜드에 위치한 더햄 대학교, 노르웨이 오슬로, 럿거스대학교와 하버드대학교, 미국의 교육평가기관인 ETS, 독일국제교육연구소(German Institute for International Educational Research)의 연구원들과 함께 협업하여 교육의 품질을 신뢰성 있고 타당하게 평가할 수 있는 새로운 방법에 대해 연구하고 있다. 킴은 “여러 가지 시스템을 평가해 교사에게 각자의 교육활동에 대한 진단적인 통찰력을 제공하는 방법이 무엇인지에 대해 연구”하는 한편 “신뢰할 수 있는 동료들 사이에 오가는 동료 코칭 상담을 통해 교사가 개선할 수 있는 부분을 파악하는 데 기여하는 방식에 대해서도 연구”하고 있다고 설명했다. 그는 “교사들에게 다양한 출처에서 나온 포괄적이고 다각화된 정보를 제공할 수 있다면 그리고 교사들이 전문가로서 책임감 있게 행동할 것이라고 신뢰할 수 있다면 지속가능하고 반복 가능한 평가방법을 찾아낼 수 있을 것”이라고 덧붙였다.

많은 교육전문가들과 마찬가지로 OECD의 슐라이허 역시 앞으로는 다양한 방법을 결합한 더 정확한 평가시스템이 나오리라고 생각한다. 그리고 그럼으로써 자신의 전문성을 개발하려는 교사들에게 힘을 북돋아 줄 수 있으리라고 생각한다.

슐라이허는 “최고의 교사를 영입해 보유하려는 것이 교사평가의 궁극적인 목적입니다. 그러기 위해서는 교사들 모두가 고품질의 교육과 훈련을 받고 지속적으로 조언을 받으며 역량을 개발할 기회를 제공 받을 수 있도록 조치할 필요가 있다”고 강조했습니다. 또한 교사를 지지하고 협력하는 문화를 바탕으로 합리적인 수준에서 전문가로서의 자율성을 누릴 수 있도록 교사들에게 힘을 실어주어야 합니다. 교사평가는 마법의 도구가 아닙니다. 그러나 교사평가를 올바른 방식으로 수행한다면 교사 평가는 교육의 품질을 높이고 학생의 성공 정도에 변화를 가져올 만큼 중요한 요인이 될 수도 있을 것입니다.”◆

Related resources

Subscribe

Register here to receive a monthly update on our newest content.