国产18禁黄网站免费观看,99爱在线精品免费观看,粉嫩metart人体欣赏,99久久99精品久久久久久,6080亚洲人久久精品

《漢字應用水平等級及測試大綱》研制報告

時間:2008-06-24 19:45:00   來源:中國語言文字工作網(wǎng)     [字體: ]
《漢字應用水平等級及測試大綱》研制報告


“漢字應用水平測試研究”課題組

提要 漢字應用水平測試的目的是衡量中等以上受教育程度人群在以規(guī)范漢字為媒介的閱讀或書面表達等活動中,使用漢字所達到的水平。這項測試既遵循國家通用語言文字的相關規(guī)范和標準,也遵循漢語漢字的約定俗成和使用規(guī)律,同時還采用了教育測量學的理論與方法構建測評體系。在確定測試范圍及內(nèi)容、測試形式、評分依據(jù)及標準、分數(shù)體系等過程中,廣泛運用了語料庫語言學、計算語言學、教育測量學等理論成果及操作方法,達到了理論與實踐的有機結合。
關鍵詞 漢字 應用水平 等級 測試大綱 研制報告

《漢字應用水平等級及測試大綱》是國家語言文字應用“十五”科研規(guī)劃重點項目“漢字應用水平測試研究”的終成果,經(jīng)專家鑒定委員會鑒定和國家語言文字工作委員會語言文字規(guī)范(標準)審定委員會審定后,2006年8月28日由中華人民共和國教育部和國家語言文字工作委員會作為語言文字規(guī)范(GF2002—2006)向社會正式發(fā)布,2007年2月1日起試行。

該項目由教育部語言文字應用管理司和語言文字信息管理司提出,批準立項時間是2002年11月,項目批準號WT105-31。項目研制任務由教育部語言文字應用研究所普通話和語言教學研究室承擔。該項目是國家語委重點科研項目“漢字應用水平等級標準及測試大綱研究”的延續(xù)項目,前一項目屬于調(diào)研性項目,工作重點是了解社會上有關行業(yè)漢字應用的現(xiàn)狀和需求,特別是用于評核相關人員漢字應用水平的需求,為開展課題研究和將來開展測評工作提供依據(jù)和參考。

2002年延續(xù)立項后,明確了后續(xù)項目為標準研制項目,主要任務是在前一項目調(diào)查的基礎上建立一整套科學的、標準化的測評系統(tǒng)和測量工具,用來衡量有關行業(yè)從業(yè)人員及高等院校學生等人群應用漢字的能力和水平。研制的主要內(nèi)容包括作為標準頒布的漢字應用水平等級、漢字應用水平測試大綱,以及作為標準附件的漢字應用水平測試字表和作為測評系統(tǒng)輔助部分的漢字應用水平測試詞語表、試題、試卷和題庫等。

從2002年至2004年,課題組先后三次進行了相關行業(yè)人群和在校大學生識字情況調(diào)查,涉及的調(diào)查對象主要有新聞出版行業(yè)的編輯、記者,高等院校學生,中小學教師等,總計3600余人;然后整理、分析了調(diào)查數(shù)據(jù);同時還對上述人群進行了試題、試卷方面的預測和試測。調(diào)研的省市有北京、天津、上海、河北、黑龍江、廣東等?蒲泻献鲉挝幌群笥袕V東教育出版社、山西大學、北京師范大學、北京教育學院等。在研制過程中,課題組還就漢字應用水平等級、漢字應用水平測試大綱和漢字應用水平測試字表反復征求了海內(nèi)外30多位語言文字學、語言教學和教育測量學等領域?qū)<业囊庖,并召開了10余次專家咨詢、研討和評審會。2005年還征求了全國15個地方語委辦的意見。課題組對專家和各地語委辦的意見做了深入、細致的分析和討論,吸收了其中絕大多數(shù)意見和建議,進一步完善了測評系統(tǒng)。

下面就《漢字應用水平等級及測試大綱》一些主要內(nèi)容的研制情況分別做一點說明。

一、研制《漢字應用水平測試字表》


《漢字應用水平測試字表》(以下簡稱《字表》)是這項課題的重點之一,因為建立測評系統(tǒng)很重要的一點就是測評的內(nèi)容范圍,對這項課題而言,就是確定測試用字的數(shù)量和范圍,以便據(jù)此逐步建立漢字應用水平等級及測試大綱,并建設相應的測試題庫,為等級的劃分、測試大綱的編寫及題庫的建設等提供基本的內(nèi)容和大致的范圍。

研制《字表》,首先要考慮幾個方面的問題:第一,《字表》與國家已經(jīng)頒布過的有關漢字的規(guī)范或標準,特別是幾種字表之間的關系;第二,《字表》與漢語真實文本中漢字使用情況的關系;第三,《字表》與相關人群掌握漢字情況的關系;第四,《字表》與現(xiàn)代漢語通用詞語用字情況的關系;第五,《字表》與漢字自身系統(tǒng)性之間的關系。這幾種關系是研制《字表》的根本問題,既涉及到國家法律、政策層面的規(guī)范和標準,也涉及到現(xiàn)實社會語言生活的狀況,比如漢字的使用頻率、覆蓋率、構詞情況以及人們掌握漢字的平均數(shù)量和集中情況等,同時還涉及到漢字字形、讀音、意義等方面的系統(tǒng)性,比如天干地支、節(jié)氣等特定表義范疇的系列用字等。

按照上述思路,課題組以《現(xiàn)代漢語常用字表》所收3500常用字為測試用字的基本內(nèi)容,在《現(xiàn)代漢語通用字表》所收7000通用字范圍內(nèi),對社會上經(jīng)常使用文字的人群先后三次進行了識字情況測查,并根據(jù)所獲得的數(shù)據(jù)初步篩選了測試用字;同時,依據(jù)國家語委“現(xiàn)代漢語大型通用語料庫”和國家高技術研究發(fā)展計劃(863計劃)《智能化中文信息處理平臺》課題的子課題“超大規(guī)模通用平衡語料庫”的漢字頻率統(tǒng)計數(shù)據(jù),對經(jīng)測查而篩選出來的漢字進行了必要的對比分析和調(diào)整;隨后,通過和測試詞語表用字情況的對比,并著重考察了低頻字的分布、構詞能力、意義范疇等,對《字表》又做了部分微調(diào);終確定了測試用字的大致框架。

在研制《字表》過程中,我們所遵循的選字原則主要有以下幾條:

1)規(guī)范性原則:測試用字均為規(guī)范的現(xiàn)代漢字字形,不規(guī)范的字形不收,如異體字;另外,屬于方言語詞范圍的用字也一律不收,如:囡、伢、嬤、甭、摜、矬、擼等。

2)應用性原則:篩選測試用字均以抽樣人群識字情況測查數(shù)據(jù)和語料庫中字頻的統(tǒng)計數(shù)據(jù)為重要參數(shù),選取高識別率和高頻率的字。同時依據(jù)頻率統(tǒng)計原理,測試用字還要考慮到其在語料庫中的覆蓋率,盡量選取分布廣泛、覆蓋率大的字。另外,充分考慮現(xiàn)代漢字的實際使用情況,對于一些常用的口語用字,如:洇、焯、磴、硌、蕻、痄、搽等,雖然這些字在書面語中較少使用,字頻統(tǒng)計或統(tǒng)計不到或頻率很低,但在日常生活中卻較常用,因此也適當選取了一些;對于現(xiàn)代通用漢字之外的文言用字,如:筮、笏、耜、騍等,一般不收。

3)系統(tǒng)性原則:對一些成系列的字要進行縱橫相關的多種聯(lián)想,綜合考慮其取舍。如:天干地支、節(jié)氣用字,數(shù)字的漢字大寫用字,民族名稱,省、自治區(qū)、直轄市的簡稱和別稱,地、縣級以上的地名用字以及連綿字等,我們都綜合考慮,平等對待,成系列收;其中為保持地縣級以上的地名用字的完整性,我們收入了琊、埗、埇、猇等4個7000通用字以外的縣級地名用字。對動植物名稱,金屬、化學元素名稱以及姓氏、人名用字等則根據(jù)常用程度和頻率的高低決定取舍。

在研制過程中,以上3條原則都不是孤立的,而是綜合運用以決定字的取舍。終,《字表》確定為5500字,并分成三個子表,其中甲表4000字;乙表500字;丙表1000字,成為《漢字應用水平等級及測試大綱》的附錄A(規(guī)范性附錄)。

《字表》的具體研制過程詳見《語言文字應用》2004年第1期63-70頁《漢字應用水平測試用字的統(tǒng)計與分級》。

二、研制《漢字應用水平等級》


研制《漢字應用水平等級》,實際上就是建立漢字應用水平的評價體系。與此同時,再依照一定的方法確定測量工具和測量方法。

建立一種特定的評價體系,實際上就相當于對人的身高、體重等指標或數(shù)據(jù)按照一定的參考值給予判斷一樣,例如是正常,還是偏高、偏矮,等等。進行這樣的判斷,大致又需要若干前提。其中主要有目標參照或常摸參照,也就是絕對標準或相對標準。前者是以要達到的目標為參照,重點考察、衡量所收集到的評價客體的數(shù)據(jù)與目標之間距離的大小,例如一個健身計劃,目標是每位參與者都要將當前體重減少20千克,那么,計劃結束時,評價健身效果就是考察每位參與者所減少的體重與20千克這個目標之間的差距。后者則是以常模數(shù)據(jù)為參照,重點考察、衡量所收集到的評價客體的數(shù)據(jù)與常模數(shù)據(jù)之間的差異,例如判斷一名中國城市12歲男童身高方面的發(fā)育情況,就可以將他的身高數(shù)據(jù)與中國城市12歲男童身高方面的常模數(shù)據(jù)進行比較,然后對其發(fā)育情況進行推斷和評估。

漢字應用水平等級一方面要明確使用漢字的目標,即絕對標準,例如關于漢字字形、讀音、意義及用法方面的規(guī)范及依據(jù);另一方面,也要以相關人群識字量調(diào)查、語料庫的字頻統(tǒng)計等數(shù)據(jù)為基礎,整理出可供參照的相對標準。

在漢字應用水平等級中,目標和參照標準都要十分明確。首先,使用者在以規(guī)范漢字為媒介的閱讀和書寫活動中,辨別和使用法定的國家通用文字,必須遵循國家頒布的漢字字形規(guī)范、讀音規(guī)范,而且還要了解和掌握漢字在權威工具書中的普通話讀音和現(xiàn)代漢語義項及用法,并在應用過程中與其保持一致。評價使用者水平的高低,主要考察他們辨別和使用漢字時,在字形、讀音、意義及用法幾方面的表現(xiàn)與目標之間的差異程度。其次,源自一些實際調(diào)查、試測的客觀數(shù)據(jù),經(jīng)嚴格的整理、分析后,也可以形成評價的參照標準。在能夠掌握和使用的漢字數(shù)量方面,按照相關人群識字量調(diào)查收集到的平均識字量、集中識字量(眾數(shù))以及現(xiàn)代漢語真實文本中漢字的使用頻度、分布情況等數(shù)據(jù),三個等級的參照標準由低到高依次確定為3500-4000、4000-4500和4500-5500個漢字。與此同時,漢字應用水平測試并不是識字量的競賽,因此能夠掌握和使用的漢字數(shù)量也不是衡量水平高低的參照標準。根據(jù)4000→4500→5500三級字量以及具體的漢字,考察它們在不同類別現(xiàn)代漢語真實文本中的使用頻度、分布情況等數(shù)據(jù),就可以從一個側面建立起使用者閱讀、書寫綜合表現(xiàn)的參照標準,因為不同數(shù)量、不同范圍的漢字在不同類別文本中的覆蓋率也是不同的,如果使用者所能駕御的漢字在數(shù)量和范圍方面都是確定的,那么就可以推斷他在應對不同類別漢語文獻時可能具有的表現(xiàn),例如他在閱讀不同類別漢語文獻時,碰到生字的概率肯定是不統(tǒng)一的,而這一點將直接影響到閱讀的順暢性。另外,不同人群在識字量調(diào)查和試測中的表現(xiàn)明顯具有群體性特征,這些特征就可以固化為漢字應用水平不同等級的參照標準,例如是否具備了接受不同程度教育的漢字基礎;是否具備了接受某種與漢字應用密切相關的工作任務的基本條件;在漢字應用水平測試中的基本表現(xiàn),等等。作為漢字應用水平的評價體系,漢字應用水平等級主要由使用漢字時的規(guī)范性、準確性目標和基于實際調(diào)查、試測數(shù)據(jù)而構建的參照標準兩部分組合而成。

在漢字應用水平等級中,還應當明確不同等級所對應的答對率、導出分數(shù)等基本的測試表現(xiàn),從而使評價體系與具體的測量工具和測量方法能夠有明確的對應關系。

關于《漢字應用水平等級》的具體研制過程,詳見《語言文字應用》2004年第1期56-62頁“《漢字應用水平等級標準》研制報告”。

三、研制《漢字應用水平測試大綱》


研制測試大綱,要解決的問題主要有:測試的目的、性質(zhì)和用途;測試的對象;測試的內(nèi)容范圍和形式;試題類型和試卷構成;評分依據(jù);分數(shù)體系,等等。

關于測試目的,有測試本身的目的和由測試影響所及而預期的目的。前一個目的非常明確,就是通過測試的方法衡量應試者在閱讀、書面表達以及其他與漢字應用有關的活動中,掌握漢字形、音、義以及使用漢字的正確程度和準確程度。后一個目的指的是測試本身并不是終目的,而是通過測試提高使用者掌握漢字、應用漢字的能力和水平,其重要性更體現(xiàn)在貫徹《中華人民共和國國家通用語言文字法》,提高我國國民的語言文字規(guī)范意識,提倡準確、健康地使用國家通用語言文字,完善漢字應用環(huán)境,弘揚中華文化。

就測試本身的目的而言,這是衡量測試效度的重要依據(jù)。一個測試的有效性如何,關鍵在于是否實現(xiàn)了測試目的。這個問題主要涉及試題、試卷的質(zhì)量。如果試題的內(nèi)容、形式和試卷的結構能夠反映漢字應用的實際情況;試題的難度、鑒別度等指標適當,拼合試卷的程序規(guī)范,能夠反映出不同能力水平的差異,那么,這樣的測試就達到了預期目的。

在研制測試大綱過程中,課題組在逐步明確測試目的的同時,圍繞測試內(nèi)容、試題、試卷等相關問題進行了大量的數(shù)據(jù)采集、研究分析等工作,從收集到的數(shù)據(jù)和分析結果看,試卷的有效性非常顯著。

測試的性質(zhì)往往取決于測試的規(guī)模和標準化程度,反過來它也影響測試的規(guī)模和標準化程度。漢字應用水平測試是由教育部和國家語委組織研制并組織實施的一項語言類標準化測試。它的信度、效度、施測程序、評分程序、題庫的容量等都要符合和滿足大規(guī)模標準化測試的要求。

測試的用途主要涉及預期的測驗使用者,這里既有個人,也包括團體;既包括應試者,也包括希望測驗結果能夠為某種決策提供參考的單位或部門等。為滿足這些潛在的需求,漢字應用水平測試須要盡可能準確、明確地向使用者提供測試結果,并合理地解釋這些結果,而且這種解釋必須具有穩(wěn)定性和一致性。
測試對象與測試用途密切相關,它要解決的主要是誰來參加測試;或者說測試更適用于哪些應試者;測試分數(shù)和分數(shù)解釋能提供什么信息;這些信息能夠用于什么目的,等等。這些問題將直接影響到確定測試內(nèi)容、編制試題、設定測試時限,等等。漢字應用水平測試是一項體現(xiàn)國家語言文字方針政策的舉措,被賦予了衡量并間接提高有關行業(yè)從業(yè)人員和學生漢字應用水平的功能,因此,測試用途就必須體現(xiàn)這種功能。通過實際調(diào)查與試測,這項測試定位于“適用于公務員,編輯、記者、校對和文字錄入人員,各級各類學校教師,文秘及辦公室工作人員,廣告業(yè)從業(yè)人員,中文字幕機操作人員,高等學校和專科類中等學校學生以及日常工作與漢字應用緊密相關的其他人員;同時也適用于想要了解自己漢字應用水平和能力的其他人士!边@些由測試用途而界定的測試對象,是一種可供操作的界定,而對于測試對象的概括性表述,則應當具有明確測試對象背景資格的作用,因此,在《漢字應用水平等級及測試大綱》中,與此相關的表述為“本規(guī)范規(guī)定了具有中等以上受教育程度人群使用漢字應當達到的水平”。

關于測試形式,漢字應用水平測試選擇了集體作答的紙筆測驗,試題卷和答題紙分開,以便機器閱卷。從將來的發(fā)展趨勢看,計算機化無紙測驗、計算機輔助自適應測驗、基于網(wǎng)絡技術支持的網(wǎng)上測驗等,都是需要進一步研究的問題。

此外,由于考慮到機器閱卷,試題類型必須滿足客觀性要求,避免主觀判斷,因此,絕大部分試題都采用了四選一形式的選擇題;另外還有一部分需要閱卷者依據(jù)統(tǒng)一標準判斷的書寫題。另外,根據(jù)漢字應用水平測試的目的,試卷構成要比較全面地反映應試者的漢字應用水平,因此,漢字的識別和書寫、漢字形音義各要素的均衡等,都要反映在每一套試卷中。后還有測試時間,應當充分考慮獲得信息大化所需的試題量以及與此相關的合理時限。

關于評分標準,也就是漢字形音義的正確與否如何判定,這里面存在著兩種情況:一種是國家已經(jīng)頒布了標準或規(guī)范的,比如規(guī)范漢字及其字形;另一種是國家還沒有制定、頒布規(guī)范或標準,而是見于各權威工具書、并被廣泛認可的研究成果,比如除《普通話異讀詞審音表》所涉及的漢字及讀音之外的其他漢字的讀音。課題組終確定的評分依據(jù)為:字形指漢字的規(guī)范字形,規(guī)范字形的依據(jù)是《現(xiàn)代漢語通用字表》;字音指漢字的普通話讀音,其依據(jù)是《普通話異讀詞審音表》和權威工具書中漢字的普通話讀音;字義指權威工具書中漢字在現(xiàn)代漢語中的義項,以及某些字在部分詞語中的特殊用法。

依照評分標準判斷應試者在每一道試題以及整套試卷上的作答情況,就初步形成了應試者在特定試卷上所獲得的原始分數(shù),而對于標準化測試,原始分數(shù)并不是足以形成評價的終分數(shù),因此需要對原始分數(shù)按一定規(guī)則進行處理,從而產(chǎn)生導出分數(shù)。漢字應用水平測試采用的導出分數(shù)是500分為平均分,滿分為800分。導出分數(shù)稱HZC分數(shù)。

HZC分數(shù)是評價應試者漢字應用水平的主要依據(jù)。此外,考慮到漢字應用的現(xiàn)實狀況、常用漢字的數(shù)量及范圍、不同應試者個人的語言生活環(huán)境及經(jīng)驗等,為了更切近使用漢字的實際情況,并減少和避免由于個人因素的不確定性對測試結果產(chǎn)生誤差影響,在用HZC分數(shù)確定應試者的漢字應用水平等級之前,測試大綱又規(guī)定了進入等級的標準。這個標準定為:對涉及測試字表甲表范圍的試題,由于所涉及的漢字都是識別率和使用頻率比較高的漢字,作答正確率必須達到80%(含)以上。滿足此條件后,HZC分數(shù)在200分(含)至500分(不含)之間的,漢字應用水平評定為三級;HZC分數(shù)在500分(含)至600分(不含)之間的,漢字應用水平評定為二級;HZC分數(shù)達到600分(含)以上的,漢字應用水平評定為一級。

這里需要說明的是,80%的作答正確率指的是如果把涉及測試字表甲表的所有內(nèi)容都編制成試題,那么作答正確率應當達到80%,但是具體到每一套試卷,都是在全部測試內(nèi)容中進行抽樣的結果,是一個具有一定代表性的樣本,這個樣本與全部測試內(nèi)容的總體存在著一定的對應關系,因此首先要控制不同試卷之間總體質(zhì)量的平衡,其次也要按照每一套試卷的特殊性,對測試結果進行轉換,轉換的目的是求出每套試卷的作答正確率和總體作答正確率之間的對應關系,確定試卷作答正確率中的哪一點,投射到總體作答正確率中相當于80%。所以說80%的作答正確率是一種轉換后的結果。

后,測試大綱還明確了測試的操作流程及備考要點,以便測試的使用者了解這項測試的相關信息。

四、研制漢字應用水平測試詞語表、試題、試卷和題庫等


漢字測試既針對漢字本身的屬性,也針對漢字的使用情況,比如字形問題,既有筆畫、偏旁和結構等方面的對錯問題,也有具體使用中的正誤問題,明顯的例子就是錯字和別字。因此,衡量人使用漢字的正確程度和準確程度,既要針對單個的漢字,也要針對具體使用環(huán)境中的用字。課題組根據(jù)測試的目的、性質(zhì)、需求等,同時參照詞頻統(tǒng)計數(shù)據(jù)和若干種權威工具書,以及一些關于成語、固定表達形式等材料,按照規(guī)范性、系統(tǒng)性原則,經(jīng)過反復篩選、整理,確定了作為漢字使用環(huán)境及試題范圍的參考詞語46000余條,編制成《漢字應用水平測試詞語表》列為附錄B(資料性附錄)。

除了使用環(huán)境的依托問題,漢字測試的本質(zhì)還是要圍繞漢字本身的形音義等屬性。因此,課題組對漢字的形、音、義做了適用于測試的梳理,比如易錯易混的筆畫、部件、結構及整字,多音字的若干讀音,漢字的現(xiàn)代漢語義項等。以漢字的讀音為例,經(jīng)過反復討論修改,考核的要點終落實為由于多音混淆而產(chǎn)生的錯誤,如揣度、提防、屏棄等;常見的讀音錯誤,如緘、訕、熾等;不常用字的讀音錯誤,如秈、膪、莠,等等。

在編制試題過程中,課題組逐漸認識到,漢字測試具有非常明顯的特殊性,其中突出的例子是相同類型、同一內(nèi)容范疇的試題,其答案具有可組合性,例如:在詞語中判斷用字是否正確的四選一試題,如果確定在一份試卷中可以容納10個題目,那么40個答案則可組合出91390道試題;而這些試題再以10個一組滿足試卷需求,則會形成一個更可觀的數(shù)量。當然,這里面還有兩個問題需要解決:第一,因為有些相同的答案出現(xiàn)在不同的試題中,從而可能導致同一份試卷中出現(xiàn)相同的項目,這就需要有查重的篩選機制,當然這類篩選性程序就涉及到試題的指標標注、題庫管理及拼卷程序等問題了;第二,這40個答案所有可能的組合雖然能夠生成數(shù)量巨大的試題,但是,對標準化測試來說,每一道試題都是獨立的,在正式使用前都要經(jīng)過試測的檢驗,都需要標注相關的指標,以備拼合試卷時使用。

為檢驗試題試卷的質(zhì)量,獲取有關數(shù)據(jù),課題組先后兩次抽取具有一定代表性的樣本數(shù)千名,進行了模擬實測。試測數(shù)據(jù)提供了非常必要的和重要的信息,其中一些主要信息如下:第一,根據(jù)預期分別代表漢字應用水平初、中、高三種程度的受測群體,在識字量調(diào)查(在字表上標出認識的字)和試測中的表現(xiàn)相關程度很高,三種人群識字量和試測得分的排序完全一致,調(diào)查結果進一步驗證了此前做過的同類調(diào)查,試測得分組間差異顯著,表明測驗的效度較高;第二,整份試卷難易度適中,總體上稍稍偏低;第三,占總題量93%強的試題,鑒別度參數(shù)在可接受范圍,表明絕大多數(shù)試題具有較好的鑒別作用;第四,選擇判斷試題與書寫試題經(jīng)因素分析,表明所考查的不是同一種能力,這也證實了漢字應用的綜合性,要求各項能力均衡發(fā)展,不可偏廢,特別是漢字應用水平測試更不能顧此失彼;第五,根據(jù)試題貢獻率指標,可以看出題量不必太大,這個結果與此前一些專家的建議基本吻合,因此,兩次試測題量雖然分別為200和170,但實測題量終確定為130。

實測結果也為等級標準和應試人測驗得分的對應關系提供了重要參考。實測結果表明:根據(jù)預期分別代表漢字應用水平初、中、高三種程度的受測群體,對占總題量70%涉及測試字表甲表內(nèi)容的試題,按照試題的能力參數(shù)和特征參數(shù),經(jīng)轉換后,作答正確率達到或超過80%的人分別占該受測人群總體的80.1%、82.5%和84.3%;三種程度的受測群體在這部分測試內(nèi)容上的平均答對率分別為80.5%、81.7%和89.6%。代表漢字應用水平初、中程度的受測群體,雖然在平均答對率上差異不顯著,但是所答對的試題質(zhì)量上卻有顯著差異,因此獲得的HZC分數(shù)也有顯著差異。

實測結果除了滿足試題、試卷的需求外,對于題庫建設更具有非常重要的作用,因為根據(jù)實測數(shù)據(jù),可以量化試題的各項指標,而這些指標是判斷試題是否可以進入題庫的重要依據(jù),同時也是計算機生成試卷的必要條件。

給試題標注各項指標,涉及到題庫的管理系統(tǒng)和運行系統(tǒng)。根據(jù)漢字應用水平測試的特殊性和題庫建設的新研究成果及其發(fā)展趨勢,課題組采用項目反應理論(IRT)作試題分析和題庫建設的基礎;與此同時,題庫還劃分字形、字音、字義和綜合運用幾個部分,構建板塊框架,進行板塊管理,每一個進入題庫的試題都要標注所要考查的方面,并且標注作為考點的字屬于測試字表中的哪一級,以此滿足試卷各部分按一定比例進行拼合的需求;后,題庫的運行系統(tǒng)中,還要包括查重、篩選的過濾程序,避免考點重復,尤其是涉及字形判斷、書寫方面的試題,不能在考查其他任何方面的試題中出現(xiàn)。

五、有待進一步研究解決的幾個主要問題


從2002年底到現(xiàn)在,漢字應用水平測試的主體框架已經(jīng)初現(xiàn)端倪,基本上能夠滿足實測的需求了,課題組感謝各方面的專家和同行在項目進行過程中所給予的支持和幫助,并將不斷改進和完善測試框架和系統(tǒng),以滿足社會的需求。

在今后幾年時間里,還有一些問題需要繼續(xù)探索和研究。第一是根據(jù)國家語言文字政策、語言文字規(guī)范和標準的發(fā)展對測試的有關內(nèi)容適時進行調(diào)整。第二是適應社會語文生活發(fā)展、變化的現(xiàn)實,處理好漢字應用水平測試的相關內(nèi)容。第三是測試手段的現(xiàn)代化和多樣化,比如計算機輔助測試、計算機化自適應測試等。第四是研究針對特定人群的等級標準和HZC分數(shù)對應,以至開發(fā)專門用于特定人群的測評子系統(tǒng)。第五是針對社會上整理傳統(tǒng)文獻等需求,以及臺、港、澳和海外漢字應用的現(xiàn)狀,研究涉及繁體字的測評方案問題。

參考文獻

1.教育部 國家語委 2006 《漢字應用水平等級及測試大綱》,廣州:廣東教育出版社

2.國家對外漢語教學領導小組辦公室漢語水平考試部 1992 《漢語水平詞匯與漢字等級大綱》,北京:北京語言學院出版社

3.張敏強 1998 《教育測量學》,北京:人民教育出版社

4.田萬海 1995 《數(shù)學教學測量與評估》,上海:上海教育出版社

5.許嘉璐 1999 《語言文字學及其應用研究》,廣州:廣東教育出版社

6.張一清 2004 《漢字應用水平等級標準》研制報告,《語言文字應用》第1期,56-62頁

7.孫曼均 2004 漢字應用水平測試用字的統(tǒng)計與分級,《語言文字應用》第1期,63-70頁

8.Bernard Spolsky 1999 《Measured Words》,上海:上海外語教育出版社

9.Lyle F.Bachman & Adrian S.Palmer 1999 《Language Testing in Practice》,上海:上海外語教育出版社

10.J.Charles Alderson,Caroline Clapham,Dianne Wall 2000 《Language Test Construction and Evaluation》,北京:外語教學與研究出版社,劍橋大學出版社

11.Lyle F.Bachman 1999 《Fundamental Considerations in Language Testing》,上海:上海外語教育出版社