快乐十分走势图连线|快乐十分开奖结果
   

第三屆“中國基礎教育質量監測與評價學術年會”會議綜述

2018年03月22日來源:《教育測量與評價》(2018年第3期)

作者介紹


朱婭梅/華東師范大學考試與評價研究院教師,學科分析師,主要研究方向為數學學業測評。

劉 姣/華東師范大學考試與評價研究院教師,博士,主要研究方向為數學學業測評、高職數學教育。




【摘  要】2017年12月,北京師范大學舉辦了“第三屆中國基礎教育質量監測與評價學術年會”。該會議采用特邀報告、分會場報告和博士生論壇等形式,圍繞關鍵影響因素,監測技術與理論,語文、數學、科學學科監測,以及體育、藝術、德育學科監測等主題,探討了教育質量監測與評價的眾多最新研究成果。


【關鍵詞】質量監測;監測技術;學科測評;核心素養


為集中展示教育質量監測與評價研究和實踐的最新成果,探討教育質量監測與評價的理論發展、方法改進及研究創新,北京師范大學中國基礎教育質量監測協同創新中心于2017年12月24—25日召開了“第三屆中國基礎教育質量監測與評價學術年會暨博士生論壇”。年會主要采用大會特邀報告、分會場報告和博士生論壇三種形式。11個特邀大會報告、將近百個分會場報告及博士論壇,分別圍繞如下主題展開:關鍵影響因素,監測技術與理論,語文、數學、科學學科監測,體育、藝術、德育學科監測。

中國基礎教育質量監測協同創新中心副主任、北京師范大學羅良教授首先匯報了該中心2017年工作進展和2018年度重點工作。他強調,該中心的工作焦點為兩項——基礎教育質量監測和基于監測的基礎教育質量提升,中心的工作,無論是學科建設、科學研究,還是人才培養、國際交流、管理,都是圍繞這兩個焦點展開的。2017年,該中心的主要工作如下:

(1)國家義務教育質量監測工作深入推進。2007年,教育部基礎教育質量監測中心成立,同年開始第一次試點監測;2015年,《國家義務教育質量監測方案》發布,同年開始國家義務教育質量正式監測,三年為一個監測周期,2015年監測數學和體育學科,2016年監測語文和藝術學科,2017年監測科學與德育學科。經過十年,國家義務教育質量監測體系已然形成,建立了國家義務教育質量監測十年數據庫,基本形成一體化教育評價網絡化平臺,形成適合監測工作特點的協同團隊工作模式,并研發了數學等值方案,實現了輪次間測試等值,研發了體育電子錄入系統。

(2)國際學生評估項目(PISA)進展順利。中國基礎教育質量監測協同創新中心受教育部委托,統籌負責PISA 2018實施工作,明確年度主要工作,協同中心多方力量,完成工具修訂、抽樣、材料準備、預試問卷編碼等工作。

(3)基于質量監測,從三個方面面向全國開展多種基礎教育質量提升工作:解讀監測結果,研發由高校引領、地方協同的質量提升模型“GDZ”;實施“中國好老師”行動計劃;在北京實施高校參與小學體育、美育發展項目。

(4)為了監測相關學科,推進監測高端人才培養,實施了多種措施:布局研究教育監測重大問題、圍繞監測產出高水平科研成果(發表于SSCI期刊40余篇,發表于CSSCI期刊90余篇)、協同舉辦學術會議(如“首屆京師教育大數據挖掘與應用年會”)、共享高端課程資源(慕課網站上線15門課程)、聘請國際專家、培養學生深度參與監測的實踐能力,等等。

一、監測技術與理論

東北師范大學史寧中教授介紹了核心素養下高考評價改革的思考,強調“無論是教育質量監測還是高考,未來必須有一個新的理念、新的考試形式與監測形式。在中國未來大概十年,離不開核心素養”。他首先回顧了從教學大綱到課程標準、從“雙基”(即基礎知識與基本技能)到“四基”課程標準的改革歷史,并回歸現今核心素養的提出,以此對核心素養背景下的高考評價改革進行思考:

(1)1923年的“新學制課程標準起草委員會”確定了“6+3+3”的學制;1952年,教學大綱學習蘇聯,關注基礎知識和技能訓練,確定知識窄而深的傳統;1963年,教學大綱明確提出“雙基”和三大能力(計算能力、邏輯思維能力、空間想象能力);1978年,教學大綱形成課程內容混合編排、不再分科的模式。從過去到現在,我國實現了從“以知識為本”到“以人為本”理念的轉變,實現了從“以知識技能為核心”的一維目標到三維目標再到核心素養的轉變,實現了從“一看就會,一做就對”的注重結果的“應試教育”到強調經歷過程、發展思維的注重“結果+過程”的核心素養教育的轉變。

(2)在黨的十八大提出、黨的十九大進一步強調“立德樹人作為教育的根本任務”的背景下,史教授提出核心素養的概念為:后天習得的、與特定情境有關的,通過人的行為所表現出來的知識、能力和態度,涉及人與社會、人與自己、人與工具。因此,數學教育的終極目標為:會用數學的眼光觀察現實世界(數學抽象、直觀想象),會用數學的思維思考現實世界(邏輯推理、數學運算),會用數學的語言表達現實世界(數學模型、數據分析),分別體現數學的一般性、嚴謹性和廣泛性。

(3)核心素養下高考評價需要從強調扎實的基礎知識和熟練的基本技能,轉變為增加考試時間(2小時拓展為3小時)、減少考試內容。史教授提出,要給學生更多的思維時間,而不是一味強調速度。此外,要建立新的理念,強調基于核心素養的學科理念、課堂理念、核心素養理念。數學是研究數量關系和空間形式的科學,它源于對現實世界的抽象,并基于抽象結構,通過符號運算、形式推理、模型構建等,理解和表達現實世界中事物的本質、關系與規律。數學課堂要把握數學知識的本質,把握學生認知的過程,創設合適的教學情境,提出合適的數學問題,啟發學生思考,鼓勵學生與教師交流、學生之間相互交流,讓學生在思考和交流中掌握知識技能的同時,理解知識的本質,感悟數學思想,積累思維的經驗,形成和發展自身的數學核心素養。同時,還要增加考查學生思維的試題。

西南大學宋乃慶教授的報告題目是“基礎教育測評模型構建及應用探析”。宋教授在上一屆年會報告過的測評模型內涵和表現形式、構建目的和意義,以及構建測評模型的主要步驟的基礎上,嘗試以初中生課業負擔測評模型、小學數學教科書難易測評模型、初中生信息技術素養為例說明基礎教育質量監測測評模型的應用與實踐:

(1)對于初中生課業負擔測評模型,先用探索性因素分析劃分維度、構建測評指標體系(課業難度、課業消耗、課業任務等),并在3所典型學校中檢驗模型的可操作性與可靠性。宋教授發現,好學校容易陷入“校內減負,校外增負”的尷尬,城郊普通中學面臨“貫徹減負”還是“提高成績”的兩難選擇,多方博弈讓它們深陷減負困境。此外,“學霸”自己有追求,會自己增負,而“學困生”表面上負擔減輕,實際上負擔很重。

(2)基于大數據,從16個指標中選擇3個主要指標(內容廣度、深度、習題難度)構建數學教科書難度模型,探索國際小學數學教科書難度。研究表明,在12套教材中,我國小學數學教科書的總體難度居中等偏上水平,而所研究的歐洲國家小學數學教科書比我國小學數學教科書總體難度更大,但其學生的數學學業負擔普遍較我國學生輕,可見,影響小學生數學課業負擔重的原因不在教科書。我國小學數學教科書的內容廣度(知識點數量)相對靠后,處于中間偏后位置,而習題難度相對靠前,處于中間偏前位置,因此,我國數學教科書還可以在知識點上進一步增加,以拓寬學生的數學視野,同時可適當降低習題的難度,以進一步減輕學生的數學學習難度。

(3)初中生信息技術素養模型,則通過析取各國信息技術素養的維度(如信息意識、信息知識、信息獲取、信息管理與組織、信息交流與利用、信息評價、信息創新、信息道德),得到了學生信息技術素養的操作性定義,然后采用探索性因素分析、驗證性因素分析以及信度、效度檢驗,構建了初中生信息技術素養測評模型,從信息技能、信息知識的外在表現、信息道德與安全、信息意識、“互聯網+”思維的內在思維等維度,檢驗城鄉差異和性別差異,并進行了個案追蹤,提出提升方案(基于測評的問題、三方協作的路徑、三大能力的目標)。

美國孟菲斯大學的胡祥恩教授介紹了語義分析的一般框架及其應用。語義表征分析(semantic representation analysis,SRA)是一個基于向量的語義分析的一般框架。在這個框架內,自然語言的語義以誘導語義結構(ISS)的形式表示。SRA在信息檢索(IR)、文本分析和智能導學系統(ITS)中都有應用。智能導學系統使用的是對話評估。對話評估是相對于試題評估而言的,它與試題評估的不同之處在于:對話評估不是通過學生對試題的回答來評估學生,而是通過學生與系統的交互對話來評估學生,語義表達是對話評估的一項重要技術。語義表達首先要建立語義空間,即字、詞、段落用向量表示。建立語義空間需要三個步驟:建立語料庫(corpus)、方法(encoding methods)、應用(applications)。語料是最小的語言單元,通常它是單詞,但有時候也會是習語。目前還沒有一個理論框架能解決語義表達的質量評估。構建語義空間的三個公理及推論能確定學生的答案與標準答案之間的關系,而且可以像光譜分析一樣分析任何兩段話之間的關系。最后,胡教授認為,自然語言交互是一種最古老的人類交流方式,計算機理解和表達自然語言是一種重要技術,從文本中抽取語義,并提高其質量是終極目的,也可能成為中國在世界測量學領域的一項領先技術。

二、關鍵影響因素

香港中文大學侯杰泰教授的報告題目是“教育監測:怎樣引發公眾對教育的關注”。教育質量監測自1960年在美國率先開展,其重要性日益為人們所認識。目前,幾乎世界上所有的國家都開展了國家或地區層面的教育質量監測,以此來監控教育工作的進步,以及教育部、區域和學校各層面的變化。通過一系列相應的問卷,教育質量監測體系可以幫助甄別有利于學生學習的成功因素。報告介紹了香港近期在教育監測方面所采用的方法及結果。侯教授參照OECD所主持的國際學生評估項目(PISA)的報告,并基于香港的資料報告了一些議題(如早餐、睡眠、家長參與、網絡欺凌、網絡成癮、體育鍛煉等對學生學業成績的影響)的研究結果。例如,堅持吃早餐能提高學生學習成績1.5年;家庭收入對吃早餐沒有影響;英文幼兒園并不能提高孩子的英語成績,卻使得其語文成績和數學成績下降;學校之間的差異在初中會比在小學大;母親教育水平、父親教育水平、家庭收入是學生學業成績的高影響因素,而幼兒園、英文學習動機、家長討論學校生活、體育運動是學生學業成績的低影響因素,動機、興趣、師生關系、控制感、焦慮、家庭參與等對小學3年級和初中3年級學生的影響比例在1%到6%之間。報告也分享了如何利用一系列的研究通訊和出版物,引起香港公眾及各界對學校和學生成功因素的關注。無疑,社會公眾、學校和家長對教育的關注及了解,會進一步促進各方協力為孩子提供更高品質的教育。

西南大學的李玲教授報告了西部9年級學生學科素養及影響因素監測追蹤數據庫及其分析結果。他們團隊建立了追蹤數據庫平臺,以國際標準每年對西部107所學校7000多名9年級學生的語文、數學、科學、藝術、計算機信息技術素養進行監測;同時,對學生的身心健康、學習效能、輟學情況、家庭狀況、師生關系、同伴關系、校園環境、教師教學效能、校長領導力、學齡人口、經濟社會發展狀況、各級政府教育發展的努力程度等背景變量進行監測。基于質化和量化數據分析,他們運用教育學、管理學、社會學、經濟學等的理論和方法,對區域、城鄉、學校的教育資源配置狀況進行了動態監測和預測,并初步探究了校長的各種領導力、城鄉教師教研組活動、不同學生的社會階層、學生的教育期望、同伴關系等對學生學科素養的影響路徑,以期為西部教育精準脫貧、為西部教育戰略和決策提供智力支撐。此外,還有其他文章予以佐證。《省級教育經費統籌改革的分配效果理論與實踐問題》一文使用經濟學、社會學、教育學監測教育資源配置的均衡性,得到結論:財政分權體制國家,省級統籌不會產生替代效應,城市內部和農村內部差異大于城鄉差異。發表在Current China的一篇文章得到結論:省級政府為保持“三增長、兩不變”,動員各種地方政府資源,這種情況不穩定。發表在《教育研究》的一篇文章研究了城鄉義務教育未來20年學齡人口的變動趨勢。一篇研究“科學資本”對西部學生科學職業愿望影響的文章得出結論:高科學資本學生更易受家庭文化資本、自我科學態度及科學自信的影響,愿意從事科學相關工作;中、低科學資本的學生則更多受自我教育期望(自我選擇)的影響。一篇研究“西部學生教育期望生成機理及群體差異”的文章得出結論:中學生家庭社會經濟地位和父母教育期望(“接受機制”)對自我教育期望的影響存在群體差異,閱讀素養和科學素養測試成績(“適應機制”)對自我教育期望的影響存在群體差異。還有一篇文章則發現:校長領導力顯著正向預測教師組織承諾與學生數學素養,教師組織承諾在校長教學領導力和學生數學素養之間起部分中介作用。

三、語文、數學、科學學科監測

北京師范大學鄭國民教授的報告“對語文考試與評價的思考”主要從兩個角度——中考、高考語文測試的發展與變化,語文考試的“中國特色”與“國際化”,對考試進行探討。他有如下觀點:

(1)一直以來,中考語文試題的內容主要是詞語積累與運用、古詩文閱讀、現代文閱讀、口語交際、綜合性學習、寫作,高考語文試題的內容主要是語言積累與運用、現代文閱讀、古詩文閱讀、寫作。但近幾年來,積累知識部分的考試內容由原來的字音、字形、字義、標點符號、使用詞語、辨析并修改病句、修辭、文學常識,更改為優秀詩文、名言警句、成語、名著閱讀,而且主要在情境中進行考查。這種變化體現了我們由要求學生占有知識到要求學生運用知識解決問題的考試理念的轉變,也體現著人們認識到語文實踐活動具有情境性,實踐者必然受其自身的文化背景、個體經驗以及具體的、特定的活動情境和條件的影響。優秀詩文的誦讀,不僅豐富了學生的語言材料,而且保證了考試質量,因為這些語言材料生成能力較強;從優秀詩文中獲得的一流的語言材料會在學生的言語活動中煥發無限的生機和活力;優秀詩文還會給學生展示豐富多彩的文章樣式,以及作者對社會、人生等方面深刻的認識與體驗。

(2)語文核心素養包括語言建構與運用、思維發展與提升、審美鑒賞與創造、文化傳承與理解,這些核心素養該怎么考查?其實,學生所做的習題的數量與孩子最后的閱讀水平毫無關系。另外,大量實驗證明,學生的文化知識背景對于其閱讀能力具有重大影響;不同的語言文字、文化對寫作教學發揮著重大的作用。人總是在特定情境下進行閱讀寫作活動的,所以,教師可以將閱讀和寫作能力放置在情境中進行考查,并要重視具有不確定性的跨學科探究主題和社會實踐活動,創設整合的、情境化、不完整結構的任務。教師要從關注碎片化學科知識技能的習得,轉變為關注復雜、不確定性的現實問題解決;從關注對他人知識的理解或反應,轉變為關注綜合運用和主動創造知識;從關注學什么,轉變為關注如何學習和學會學習;從關注自我學習,轉變為關注團隊合作和溝通。

最后,鄭教授總結了語文測試的“中國特色”:“優秀詩文和經典名著反映了中華民族的智慧,凝練地表達了對自然社會和人生的典型認識和體現,這樣的內容具有奠基作用和生成價值。我們希望學生能在學習過程中逐漸將其融入血脈,使得我們中華民族的文化智慧得以延續下去。”

陜西師范大學胡衛平教授的報告“高階科學思維能力的測評”主要介紹了高階科學思維能力的概念及其重要性、高階科學思維能力的核心要素、高階科學思維能力各個要素的測評。高階思維能力從哲學上看,是具有高階思維的人所具有的品質和特征;從心理學上看,則關注思考過程,指人們解決問題、作出決策、學習新的概念等的過程中表現出來的心理過程、策略和表征;從教育學上看,關注行為表現,整合各種信息,形成新的標準,作出正確的判斷、推理、決策,并解決問題。高階思維的要素包括批判性思維、創造性思維、問題解決、決策思維、元認知。批判性思維主要指推理、分析與預測、評價、自我調節。創造包括創造性的產品、過程、個人、環境。問題解決實質上是運用創造性思維(多種組合的、序列的思維能力)、批判性思維(理性的反思、審慎的評判)的創造性問題解決過程。明智的決策者思考的五個問題亦是創造性思維和批判性思維。因此,高階思維的核心要素是批判性思維和創造性思維。最后,胡教授還報告了一些科學高階思維測評的案例,包括推理能力、論證能力、批判性思維能力、創造性思維能力,等等,提出了可以用于大規模測評的整合批判性思維和創造性思維的思路。如,科學推理測評包括理論推理、組合推理、比例推理、控制變量、概率和關系推理;創造性思維測評包括物體應用、問題提出、產品改進、創造想象、問題解決、實驗設計、創造活動;技術創造力測評包括產品設計、材料運用、功能設計、技術方法、科技想象。

華東師范大學周兢教授的報告題目為“中國幼兒園語言教育質量的評價指標體系研究”。報告執行教育部2011創新研究“基礎教育質量監測”課題任務,聚焦幼兒園語言教育質量的評價指標體系探討,以學前兒童語言學習與發展核心經驗為基本立足點,觀察不同年齡階段兒童在幼兒教育環境中語言學習與發展的成長梯度,從而反觀幼兒園語言教育環境與互動過程,捕捉對促進兒童語言學習產生影響的重要因素。

四、體育、藝術、德育學科監測

美國伊利諾伊大學香檳分校朱為模教授的報告“體育到底應該怎樣考?”旨在對國外過去百余年間的體育教學和考試的演變做個簡要回顧,希望能為中國體育考試改革提出參考和建議。百余年來,國外體育教學發生了巨大變化,從過去的人多器材少、以競技運動為主、運動技能優先、教師主導、強調比賽等,逐漸轉變為今天的小群/個人教學、充足的器材、每個人都有可能成功、測量健康、知識并行、教師作為“私人教練”或指導,以及強調團隊合作。教師隊伍則從最早的醫生兼任,漸變到過去大多有運動教練背景,到今天具有現代運動和健康知識與技能的專業人才。考試的重點也從過去的是否上課、著裝、運動技能水平、體適能成績,轉變為今天的測量個人提高、自我評價、同學間互評診斷、運動行為/習慣的追蹤,以及運動與健康知識的測評。目前,國外中小學體育大規模標準化測驗有以下幾個特點:以健康體適能(healthrelatedfitness)為核心的測評、以國家體育標準(standard-based)為依據的測評、以體育綜合素養(physicalliteracy)為中心的測評。評價的方法也從過去的相對標準(與同齡和同性別的孩子相比)轉向與健康有關的絕對標準。過去只是體育人關心的“有氧能力”在2016年12月被美國心臟協會認定為臨床生命體征的一個部分,從而讓“體醫融合”有了一個共同的測評指標。因此,中國21世紀體育的考試應該是一個以健康為綱,以有氧能力、身體成分和力量的健康體適能為中心,結合運動行為/習慣,包含運動與健康的知識與技能,采用絕對評價標準為基礎的評分體系的考核系統。

首都師范大學美術學院尹少淳教授的報告“美術學科核心素養本位及其測評”主要介紹了三個方面的內容:如何界定美術學科核心素養,如何認識核心素養與知識、技能的關系,美術如何測評:

(1)依據學科核心素養提煉得到美術學科核心素養,包括圖像識別(指對美術作品、圖形、影像及其他視覺符號的觀看、識別和解讀)、美術表現(指運用傳統與現代媒體、技術和美術語言創造視覺形象)、審美判斷(指對美術作品和現實中的審美對象進行感知、評價、判斷與表達)、創意實踐(指在美術活動中形成創新意識,運用創意思維和創造方法)、文化理解(指從文化的角度觀察和理解美術作品、美術現象和觀念)。

(2)一個形象的比喻是,知識和技能像鑰匙,可以開鎖(解決問題),因此,知識技能沒有“原罪”,問題在于我們沒能將知識、技能轉化為核心素養,知識、技能不是萬能的,但沒有知識、技能是萬萬不能的。我們應該將知識與技能放在任務情境中學習。

(3)基于核心素養的美術評價,不再是對知識與技能的記憶,而是在情境中考查學生運用知識與技能解決問題的能力。如,考查成角透視有幾個消失點等,可以命制這樣的題目:站在天安門正門的位置,描繪人民大會堂應該運用什么樣的透視方法?描繪人民英雄紀念碑又該運用什么樣的透視方法?

國家德育監測首席專家邊玉芳教授的報告題目為“德育監測的幾個關鍵問題”。2015年《國家義務教育質量監測方案》確定監測學科為語文、數學、科學、體育、藝術、德育。立德樹人是教育的根本任務。義務教育階段的德育學科監測有助于客觀、準確了解我國中小學生德育狀況的特點和發展趨勢、中小學德育工作的現狀與特點,可以為促進義務教育階段學生品德發展、德育工作改進提供科學的依據和重要的決策參考。報告圍繞德育學科領域監測中的一些重要的核心問題展開。如,德育狀況是否可測?德育監測到底監測什么?德育與《品德與社會》《思想品德》及即將統一為《道德與法制》的學科是什么關系?學生德育狀況監測指標框架的依據是什么?德育狀況監測主要應該采用什么方法?學生思想品德狀況應該采用自評還是他評?德育狀況監測結果如何呈現和解讀?邊教授基于對國內外大型相關項目的調研分析、相關學術研究成果及我國首次國家基礎教育德育監測的實踐探索,對以上問題進行了思考和回應。德育是可測的,內在的思想、情感、態度、價值觀也可通過外顯行為反映。德育監測內容的重點是測查學生對社會主義核心價值觀以及中華優秀傳統文化的理解,對日常生活中道德行為規范的掌握,對基本國情、地理和歷史常識、安全和法律常識等的了解,與他人、與社會、與自然關系的認識。德育包括但不限于品德學科相關課程。通過國家德育相關政策文件、義務教育課程標準、國內外相關項目、文獻分析、訪談調研、專家論證,邊教授得到的學生德育狀況監測的指標框架主要是:理想信念和價值觀、行為規范、中華優秀傳統文化、國情常識、法律素養。學生德育狀況可以采用的測評方法包括測驗法、問卷法、表現性評價法、觀察法、訪談法及其他的新技術和新手段(如大數據分析等)。

五、總結

本次會議圍繞“從知識到核心素養的新時代測評”,從語文、數學、科學、體育、藝術、德育學科的測評,關鍵影響因素,監測技術與理論等多個領域探討了在新時代如何將測評知識轉換為測評核心素養,提出了注重考察思維、注重情境、注重過程、注重問題解決的綜合品質的考察。總之,“第三屆中國基礎教育質量監測與評價學術年會暨博士生論壇”為各位專家學者打開了基于核心素養測評的大門,引領中國的基礎教育質量監測走向新的征程。



快乐十分走势图连线 时时彩预测家app下载 11选5技巧任选七 稳赚 pk10计划走势技巧 幸运飞艇软件平刷 打鱼一年赢了20万 集成开发平台 欢乐生肖直播 时时自由的百科天堂 旧版彩计划app 欢乐二人雀神手机版下载