“心理测评是测评考试的科学依据”— 与Pearson VUE 澳大利亚和东南亚地区首席心理测评师李峰(Edward)博士进行的问答访谈

“心理测评是测评考试的科学依据”— 与Pearson VUE 澳大利亚和东南亚地区首席心理测评师李峰(Edward)博士进行的问答访谈


Asian man with glasses and a black dress shirt

Dr. Edward Feng Li
Principal Psychometrician, Australia and Southeast Asia region

Pearson VUE 发送的考试对全球社区产生了直接且积极的影响,推动发展进步的同时也帮助我们的客户兑现了对其行业的承诺。在本系列中,通过与整个公司内在某个测评领域产生持久影响的人员交谈,我们深入了解了实现这一切的过程。

本次我们的访谈对象是我们的首席心理测评师李峰(Edward)博士,他常驻 Pearson VUE 亚太地区。

李博士拥有澳大利亚新南威尔士大学教育学博士学位,他运用教育心理学和定量方法改进考试主办方设计和分析测评的方式。

用他自己的话说,“心理测评是测评考试的科学依据”,他对我们公司采用人工智能等技术强化客户服务/产品、实现自动化流程和提高效率等举措感到高兴。

李博士请简单介绍一下您自己。我们很想了解您的博士背景。

我拥有教育学博士学位,主要研究心理学和定量方法。

我所在学院的教授专业知识丰富,向我深入讲解了这门技术学科众多方面的知识,我受益匪浅。我还接受了定性研究方法的相关培训,进一步拓展了我作为研究人员的技能。运用这些知识为我的博士研究项目开发测评工具十分有趣。

我的学术背景让我拥有了强大的分析框架,使我能够全面了解测评科学的复杂性及其在教育和专业环境中的应用。

您最近新任 Pearson VUE首席心理测评师。该职位负责哪些方面的工作?

作为 Pearson VUE 的首席心理测评师,我的职位负责多个方面的工作。不过,我认为我的主要工作重点始终是努力确保我们的测评解决方案的有效性和可靠性,以及根据各种不同的客户需求定制测评解决方案。现在,我身负“首席”重任,感到责任更为重大,不仅要培养团队的其他成员,工作重点也不再只是日常运营工作,还要关注更具战略性的考量。我现在更多地与 Pearson VUE 内部其他职能部门(例如技术和产品开发部门)协作,进一步增强我们考试服务的全部实力。Pearson VUE 之所以脱颖而出,依靠的不只是遵循行业标准,更是成为思想领袖并开拓创新方法,确定测评的最佳实践。

您通常一天需要负责哪些工作?

每天都不一样。某一天您会发现我在进行数据分析,另一天我可能在为客户制定测评解决方案,或与 Pearson 其他团队协作。在更长时间内,我一天的工作融合了战略规划、团队协作和实操分析。我也喜欢抽出时间了解心理测评方法和技术领域的最新进展,尤其是生成式 AI。

假设您在开发测评方案时需要与各种不同的利益相关者进行内部和外部协作。您能否向我们介绍一下这一过程?

协作是开发有效测评方案的关键所在。外部协作时,我会与客户接洽,了解其特定需求和挑战。这一举动至关重要,因为“教科书式”的做法并不适合每一个考试主办方。由于客户通常不具备深入的知识,我必须设法以外行能够理解的方式解释主要原则,才能让他们不会迷茫。只有当所有人都达成共识时,才能制定出强大而有战略性的计划。内部协作时,我们通常需要先与业务开发团队密切合作,初步评估客户需求,然后再由我们的项目管理、内容开发和考试发布团队提供反馈意见,确保我们的测评方案计划周密、设计巧妙,无缝衔接地交付给客户。这一协作过程使我们能够制定有针对性的解决方案,确保其有效且实用。

就您个人而言,一支高技能心理测评团队的重要性/价值是什么?

心理测评是测评考试的科学依据。一支高技能心理测评团队能以鉴定的眼光看待考试开发,确保测评公平、有效、可靠。我们的专业知识使我们能够在不同人群中准确测评潜在构念时应对各种复杂问题。包括确定需要评估的构念,确保考试项目能够有效评估考生对该构念的理解。除了技术技能,Pearson VUE 还强调心理测评团队所要求的“软”技能。例如,良好的沟通能力,这种技能对于获知客户的具体需求并帮助他们了解我们的技术解决方案如何使其测评得到改进很关键。强大的沟通能力有助于与客户建立长期关系。此外,软技能在考试开发过程中也至关重要,测评准备工作涉及大量人际互动。例如,促进标准制定和工作任务分析研讨会。

对于努力保持其证书的高标准的考试主办方/厂商,您有何建议?

必须定期审查和更新测评,反映主题和心理测评实践方面的最新变化。如果考试主办方/厂商无法确定合适的行动方案,则必须要先咨询心理测评师。有时,实施教科书式测评所需的努力和资源可能看起来令人难以承受,但请记住:“不要因为美好的事物不够完美就否定它”。任何小小的改进都很重要!

东南亚是我们的一个关键业务市场,即将推出一些令人兴奋的新产品。在这个充满活力的地区,您认为哪些地方对心理测评服务的需求最大?

作为生活和工作在澳大利亚墨尔本的心理测评师,我见证了近年来该地区的快速发展。越来越多的组织需要强有力的测评方法来确保获得认证的考生的能力,并保障其认证考试项目的可信度。随着该地区客户不断发展和扩展其考试项目,Pearson VUE 在计算机化考试方面的专业知识及其全球影响力将继续吸引该地区的客户。

在当前如此重视 AI 的形势下,您认为未来几年测评方法会如何发展?

这是一个棘手的问题,因为专家们对未来的预测往往是错误的。我在这里抛砖引玉下。AI 与心理测评学的整合并不新鲜。例如,我们利用机器学习来检测作弊行为和识别危害物品。目前对 AI 的重视很大程度上是受大语言模型(LLM)的开发和实现的影响。从翻译、总结和文本生成等基于文本的活动到写代码,甚至图片生成,LLM 经证明能够成功管理各种不同的任务。最近,Sora(一种 Open AI 工具)根据文本提示生成了高质量的短视频。

但是,我更愿意将 LLM 视为人类与机器之间的媒介,在某种意义上,LLM 可以更好地理解人类的提问,然后进行相应互动。但是,如果想要执行数字计算,计算器会比 LLM 更可靠。想想我们过去是如何通过磁盘操作系统(DOS)命令与计算机交互的,或者 Microsoft Windows 等基于图形的用户界面(GUI)的操作系统是如何简化计算机使用方式的。现在,有了 LLM,我们将进入一个能够使用自然语言指导计算机或软件执行复杂任务的时代,使技术变得更易于使用、更加直观。鉴于这一功能,我认为基于模拟的考试会成为我们测评工具包中更加实用的部分,为以前难以实施的技能和能力测评方式开辟新的可能性。


About Pearson VUE

Pearson VUE has been a pioneer in the computer-based testing industry for decades, delivering more than 16 million certification and licensure exams annually in every industry from academia and admissions to IT and healthcare. We are the global leader in developing and delivering high-stakes exams via the world's most comprehensive network of nearly 20,000 highly secure test centers as well as online testing in over 180 countries. Our leadership in the assessment industry is a result of our collaborative partnerships with a broad range of clients, from leading technology firms to government and regulatory agencies. For more information, please visit PearsonVUE.com.

媒体联系人

Greg Forbes, Global PR & Communications Manager
+44 (0) 7824 313448
greg.forbes@pearson.com
Asian man with glasses and a black dress shirt

Dr. Edward Feng Li
Principal Psychometrician, Australia and Southeast Asia region

Pearson VUE 发送的考试对全球社区产生了直接且积极的影响,推动发展进步的同时也帮助我们的客户兑现了对其行业的承诺。在本系列中,通过与整个公司内在某个测评领域产生持久影响的人员交谈,我们深入了解了实现这一切的过程。

本次我们的访谈对象是我们的首席心理测评师李峰(Edward)博士,他常驻 Pearson VUE 亚太地区。

李博士拥有澳大利亚新南威尔士大学教育学博士学位,他运用教育心理学和定量方法改进考试主办方设计和分析测评的方式。

用他自己的话说,“心理测评是测评考试的科学依据”,他对我们公司采用人工智能等技术强化客户服务/产品、实现自动化流程和提高效率等举措感到高兴。

李博士请简单介绍一下您自己。我们很想了解您的博士背景。

我拥有教育学博士学位,主要研究心理学和定量方法。

我所在学院的教授专业知识丰富,向我深入讲解了这门技术学科众多方面的知识,我受益匪浅。我还接受了定性研究方法的相关培训,进一步拓展了我作为研究人员的技能。运用这些知识为我的博士研究项目开发测评工具十分有趣。

我的学术背景让我拥有了强大的分析框架,使我能够全面了解测评科学的复杂性及其在教育和专业环境中的应用。

您最近新任 Pearson VUE首席心理测评师。该职位负责哪些方面的工作?

作为 Pearson VUE 的首席心理测评师,我的职位负责多个方面的工作。不过,我认为我的主要工作重点始终是努力确保我们的测评解决方案的有效性和可靠性,以及根据各种不同的客户需求定制测评解决方案。现在,我身负“首席”重任,感到责任更为重大,不仅要培养团队的其他成员,工作重点也不再只是日常运营工作,还要关注更具战略性的考量。我现在更多地与 Pearson VUE 内部其他职能部门(例如技术和产品开发部门)协作,进一步增强我们考试服务的全部实力。Pearson VUE 之所以脱颖而出,依靠的不只是遵循行业标准,更是成为思想领袖并开拓创新方法,确定测评的最佳实践。

您通常一天需要负责哪些工作?

每天都不一样。某一天您会发现我在进行数据分析,另一天我可能在为客户制定测评解决方案,或与 Pearson 其他团队协作。在更长时间内,我一天的工作融合了战略规划、团队协作和实操分析。我也喜欢抽出时间了解心理测评方法和技术领域的最新进展,尤其是生成式 AI。

假设您在开发测评方案时需要与各种不同的利益相关者进行内部和外部协作。您能否向我们介绍一下这一过程?

协作是开发有效测评方案的关键所在。外部协作时,我会与客户接洽,了解其特定需求和挑战。这一举动至关重要,因为“教科书式”的做法并不适合每一个考试主办方。由于客户通常不具备深入的知识,我必须设法以外行能够理解的方式解释主要原则,才能让他们不会迷茫。只有当所有人都达成共识时,才能制定出强大而有战略性的计划。内部协作时,我们通常需要先与业务开发团队密切合作,初步评估客户需求,然后再由我们的项目管理、内容开发和考试发布团队提供反馈意见,确保我们的测评方案计划周密、设计巧妙,无缝衔接地交付给客户。这一协作过程使我们能够制定有针对性的解决方案,确保其有效且实用。

就您个人而言,一支高技能心理测评团队的重要性/价值是什么?

心理测评是测评考试的科学依据。一支高技能心理测评团队能以鉴定的眼光看待考试开发,确保测评公平、有效、可靠。我们的专业知识使我们能够在不同人群中准确测评潜在构念时应对各种复杂问题。包括确定需要评估的构念,确保考试项目能够有效评估考生对该构念的理解。除了技术技能,Pearson VUE 还强调心理测评团队所要求的“软”技能。例如,良好的沟通能力,这种技能对于获知客户的具体需求并帮助他们了解我们的技术解决方案如何使其测评得到改进很关键。强大的沟通能力有助于与客户建立长期关系。此外,软技能在考试开发过程中也至关重要,测评准备工作涉及大量人际互动。例如,促进标准制定和工作任务分析研讨会。

对于努力保持其证书的高标准的考试主办方/厂商,您有何建议?

必须定期审查和更新测评,反映主题和心理测评实践方面的最新变化。如果考试主办方/厂商无法确定合适的行动方案,则必须要先咨询心理测评师。有时,实施教科书式测评所需的努力和资源可能看起来令人难以承受,但请记住:“不要因为美好的事物不够完美就否定它”。任何小小的改进都很重要!

东南亚是我们的一个关键业务市场,即将推出一些令人兴奋的新产品。在这个充满活力的地区,您认为哪些地方对心理测评服务的需求最大?

作为生活和工作在澳大利亚墨尔本的心理测评师,我见证了近年来该地区的快速发展。越来越多的组织需要强有力的测评方法来确保获得认证的考生的能力,并保障其认证考试项目的可信度。随着该地区客户不断发展和扩展其考试项目,Pearson VUE 在计算机化考试方面的专业知识及其全球影响力将继续吸引该地区的客户。

在当前如此重视 AI 的形势下,您认为未来几年测评方法会如何发展?

这是一个棘手的问题,因为专家们对未来的预测往往是错误的。我在这里抛砖引玉下。AI 与心理测评学的整合并不新鲜。例如,我们利用机器学习来检测作弊行为和识别危害物品。目前对 AI 的重视很大程度上是受大语言模型(LLM)的开发和实现的影响。从翻译、总结和文本生成等基于文本的活动到写代码,甚至图片生成,LLM 经证明能够成功管理各种不同的任务。最近,Sora(一种 Open AI 工具)根据文本提示生成了高质量的短视频。

但是,我更愿意将 LLM 视为人类与机器之间的媒介,在某种意义上,LLM 可以更好地理解人类的提问,然后进行相应互动。但是,如果想要执行数字计算,计算器会比 LLM 更可靠。想想我们过去是如何通过磁盘操作系统(DOS)命令与计算机交互的,或者 Microsoft Windows 等基于图形的用户界面(GUI)的操作系统是如何简化计算机使用方式的。现在,有了 LLM,我们将进入一个能够使用自然语言指导计算机或软件执行复杂任务的时代,使技术变得更易于使用、更加直观。鉴于这一功能,我认为基于模拟的考试会成为我们测评工具包中更加实用的部分,为以前难以实施的技能和能力测评方式开辟新的可能性。