国家社科基金重点项目《课题论证》活页
(2016-05-27 16:04:26)|
·项目登记号 |
|
|
项目序号 |
|
国家社会科学基金项目通讯评审意见表
|
评价 指标 |
权重 |
指标说明 |
专 家 评 分 |
|||||||
|
选题 |
3 |
主要考察选题的学术价值或应用价值,对国内外研究状况的总体把握程度。 |
10分 |
9分 |
8分 |
7分 |
6分 |
5分 |
4分 |
3分 |
|
论证 |
5 |
主要考察研究内容、基本观点、研究思路、研究方法、创新之处。 |
10分 |
9分 |
8分 |
7分 |
6分 |
5分 |
4分 |
3分 |
|
研究基础 |
2 |
主要考察课题负责人的前期相关研究成果和主要参考文献。 |
10分 |
9分 |
8分 |
7分 |
6分 |
5分 |
4分 |
3分 |
|
综合 评价 |
是否建议入围 |
A.建议入围 |
||||||||
|
备注 |
|
|||||||||
|
评审专家(签章): |
||||||||||
说明:1.本表由通讯评审专家填写,申请人不得填写。项目登记号和项目序号不填。
2.请在“评价指标”对应的“专家评分”栏选择一个分值画圈,不能漏画,也不能多画,权重仅供参考;如建议该课题入围,请在“综合评价”栏A上画圈,不建议入围的不做标记。“备注”栏可简要填写需要说明的其他事项或不填写。本表须评审专家本人签字或盖章有效。
国家社会科学基金项目《课题论证》活页
|
课题名称:基于证据的四六级、雅思、托福考试效度对比研究 |
|
1.本课题国内外研究现状述评,选题的价值和意义。2.本课题研究的主要内容、基本观点、研究思路、研究方法、创新之处。3.前期相关研究成果,开展本课题研究的主要参考文献。限4000字以内。 1.1 ·效度理论 效度(validity)是测试评价中最重要的考虑因素(APA/AERA/NCME 1985)。较早的效度定义为“一项测试是否测量了它所要测量的东西”(Kelly 1927:14)。自20世纪60年代以来,语言测试与评价的研究一直围绕效度展开(Kunnan 1998),效度理论取得了从“分类效度观”到“整体效度观”的重大发展。分类效度观(Lado 1961)认为效度可分为效标关联效度、内容效度、构念效度等多种类型(APA/AERA/NCME 1966, 1974)。其验证操作性强,但比较零散,且未考虑收集分数使用等方面的证据。整体效度观给出了具有突破意义的效度定义,即“对经验证据和理论依据在多大程度上支持分数的解释与使用进行的综合评价就是效度”(Messick 1989:13)。这种“一元多维”的效度观确定了构念的核心地位(Alderson & Banerjee 2001),明确了效度验证的对象是测试结果的解释和使用(Davies 2003)。 ·效度验证模式 整体效度观给语言测试的开发与研究带来了重大变革,但该理论高度概括、过于抽象,使效度验证缺乏可操作性。近年来更多的语言测试学家根据该理论提出了一些具体的效度验证框架:(1)“交际语言能力模型”和“测试方法层面框架”(Bachman 1990)为效度验证开启了新视角,Bachman et al.(1995)运用该框架,对CPE、FCE、TOEFL三项考试所考查的能力和测试任务特征做了分析,并对框架进行了完善。(2)“测试有用性框架”(Bachman & Palmer 1996)涵盖信度、构念效度、真实性、交互性、考试影响和可行性六个质量属性,进一步阐释了Messick的效度理论。该框架可操作性强,但质量属性之间的关联不甚明确(韩宝成、罗凯洲 2013)。(3)“基于论证的效验模式”(Kane 1992)与整体效度观一脉相承,包括两个步骤:提出效验观点、收集有关证据。Chapelle et al.(2008)运用该模式论证了TOEFL iBT的效度。(4)“测试使用论证框架”(Bachman 2003)发展了Kane的效度论证观。该框架遵循“事实à主张”的推理机制,包含构建与评价两个过程(Bachman & Palmer 2010)。不过其架构(后果、决策、解释、测试记录)比较抽象,能否成为指导测试开发与使用的新范式有待检验。(5)“基于证据的效验框架”(Weir 2005)从社会认知视角出发,涵盖五个方面的效验证据:基于理论的效度、环境效度、评分效度、效标关联效度和后果效度,可操作性较强,并在剑桥主体证书考试(KET、PET、FCE、CAE、CPE)的效度对比研究中得到丰富和完善,将基于理论的效度更名为认知效度,“受试特征”也成为效验证据很重要的方面(Shaw & Weir 2007;Khalifa & Weir 2009;Taylor 2011;Geranpayeh & Taylor 2013)。 目前关于效度理论和验证模式的研究主要集中在国外,国内类似的研究还处于起步阶段,主要是对国外相关领域的发展进行引介和评述(李清华 2006;韩宝成、罗凯洲 2013)。 ·三项考试的研究及存在的不足 本研究所涉及的大学英语四六级(以下简称四六级)、雅思、托福是全球极具代表性的语言考试。三项考试规模大、风险高、影响广,相关研究比较丰富,主要涵盖以下方面(括号中的文献仅为部分举例):(1)四六级的整体效度研究(杨惠中 & Weir 1998;Jin & Yang 2006)、各单项技能及题型研究(金艳、吴江1997, 1998;He & Dai 2006)、评分与网考研究(朱正才2005;王跃武等2006;金艳2012)、反拨效应及考试影响研究(Chen 2007;辜向东 2007, 2013)。(2)雅思的开发及效度验证(Clapham 1996;Davies 2008;Taylor & Weir 2012)、考官与评分(Furneaux & Rignall 2007;Huang 2013)、反拨效应及考试影响(Roger 2006;Saville 2014)。(3)托福的效度论证(Chapelle et al. 2008;Stricker & Attali 2010;Biber & Gray 2013)、网考设计(Roever & Powers 2006;Sawaki et al. 2009;Zhao 2013)、公平性与可及性(Wolfe & Manalo 2005;Lee et al. 2014)、评分与技术应用(Weigle 2011;Xi et al. 2012)、信度与可推广性(Lee 2005;Zhang 2008)、分数解释(Tannenbaum & Wylie 2008;Jamieson & Poonpon 2013)。 尽管关于三项考试研究的文献比较丰富,但将这些研究组织起来、形成有关联和强有力的论证的文献还很缺乏。涉及三项考试中任何一项的考试效度对比研究,尤其是实证研究也相当少。现有的对比研究多集中在分数等值方面(Taylor 2004),但事实上还有其他很多方面需要对比,如考试内容与测试表现的关系、受试特征与测试表现的关系、受试报告的考试策略与测试表现的关系等(Bachman et al. 1995)。此外,几乎没有将我国的考试与国际权威考试进行较全面的效度对比研究文献,现有的文献只是就两项或三项考试的某一技能、题型或考试媒介等做初步探讨(王丽2007;李鑫、修旭东2009;仇茵晴、张艳莉2011;金艳、张晓艺2013),全面系统的考试效度对比研究亟待开展。 1.2选题的价值和意义 ·学科理论与实践价值 理论上,验证基于证据的效度验证框架在考试效度对比研究中的可行性,并进一步构建更加科学合理的语言测试效度对比研究模型。实践上,通过对比三项考试的效度,形成将三项考试关联起来的论证。这不仅可以丰富考试对比研究领域的文献,而且能为类似的研究提供思路和方法上的借鉴。 ·社会和现实意义 一方面,本研究有助于推动我国语言测试开发与研究的国际化,有望提升我国自行开发的英语考试在国际上的认可度,为教育、人事部门及广大利益相关者提供入学、就业、流动等决策依据;另一方面,由于我国英语教学层次复杂、考试种类繁多,近年来关于制定我国统一的语言能力等级量表(韩宝成 2006;杨惠中等 2012)和语言测试标准(范劲松、金艳2010)的呼声越来越高,而本研究中的雅思和托福均已实现与国际公认的语言能力标准(ACTFL1986;CEFR 2001)对接,其开发与使用也遵循了国际公认的语言测试标准(ETS 2002;UCLES 2013),因此三项考试的效度对比研究有望为制定我国统一的语言能力等级量表和语言测试标准提供参考数据。 2.1本课题研究的主要内容 本课题拟从Weir(2005)“基于证据的效度验证框架”出发,从六个方面对四六级、雅思、托福进行较全面深入的考试效度对比研究。具体内容和研究问题如下:
1)
2)
3)
4)
5)
6) 这些具体内容和研究问题最终指向并回答一个总的问题:三项考试的效度有何异同? 2.2 基本观点 尽管四六级、雅思、托福这三项考试的目的、性质、构念、分数解释和结果使用等诸多方面存在不同,但三项考试都是以英语为外语或二语的大规模、高风险语言考试,受试将接受或正在接受高等教育,三项考试应该具有可比性,三者的效度应该既有较大的相似性,也存在一定的差异。而实际情况是否如此,有待全面深入的实证研究。 2.3研究思路和方法 本课题拟分五个阶段,采用七种方法收集三项考试六个方面的效度证据(见图1)。 图1 四六级、雅思、托福考试效度对比研究总体设计 具体方法和思路描述如下:
1)
2)
3)
4)
5)
6)
7) 2.4 创新之处
1)
2)
3) 3.1 前期相关研究成果 ·课题负责人前期相关研究成果:四六级专著2部、论文42篇,其中效度研究25篇、第一作者33篇、CSSCI 8篇、核心10篇;其他考试文集1部、论文40篇,其中效度研究22篇、第一作者33篇、CSSCI 4篇、核心3篇。代表性成果有:
1)
2)
3)
4)
5)
6)
7)
8)
9)
10) ·课题组前期相关研究成果:雅思和托福考试论文64篇、研究报告28分,其中效度研究78篇、第一作者48篇、SSCI 8篇;其他考试专著1部、论文62篇、研究报告3份,其中效度研究42篇、第一作者47篇、SSCI 6篇、CSSCI 5篇、核心5篇。代表性成果有:
1)
2)
3)
4)
5)
6)
7)
8)
9)
10) 3.2
[1]
[2]
[3]
[4]
[5]
[6]
[7]
[8]
[9] [10] [11] [12] [13] [14] [15] |

加载中…