有效性和符合性评估
本页所载的资料仅供一般参考之用,并不能代替专业的法律意见。
本页概述了Vervoe制定符合高有效性标准的评估的过程,以便雇主了解评估如何符合其合规性。Vervoe评估是根据这一过程创建的,以确保所有测试和AI分级减轻歧视或不公平的评估做法。
在这个页面:
平等就业机会委员会的具体信息
在美国,平等就业机会委员会(EEOC)提供了指导,帮助公司减轻在雇用前和挑选雇员的测试和其他甄选程序方面的歧视性做法。这些指引旨在澄清法律规定,包括:
- 1964年《民权法案》第七章(经1972年《平等就业机会法案》修正)
- 美国人的冠军,残疾人法案(ADA)
- 《就业年龄歧视法案》
本页信息概述了Vervoe如何创建和使用评估,以确保对特定群体没有不同的影响,与工作相关,并符合业务需要。
评估创建
Vervoe采用了一种标准化的流程来创建不同行业和角色类型的技能评估。我们的流程确保Vervoe的评估严格遵循上述标准化程序。所有评估都以技能为重点,并通过Vervoe平台进行在线管理。这确保了每个考生都有相同的机会参加考试,使用相同的指导、程序和时间限制(如果适用),以保持跨角色、组织和评估的考试条件一致。
创建时,Vervoe评估考虑以下信息:
- 识别完成工作所需的关键技能。分析相关的工作材料,包括工作和职位描述,以确定在角色中成功的技能和属性。在适用的情况下,Vervoe咨询组织中的关键人员,并进一步分析关键绩效指标和技能矩阵。这一过程确保了每个评估都包括候选人需要执行的技能。
- 与专家咨询。为了创建定制的评估,Vervoe涉及到来自您组织内部或市场更广泛领域的主题专家。通过咨询,我们开发与技能相匹配的特定内容,并在角色的背景下。在技术评估方面,Vervoe与主题专家合作进行内容创建和验证。
- 业务成果。为我们的客户创建的所有定制评估都与相关和关键的业务成果直接相关。这是一个迭代过程,用于确定招聘过程开始时使用的评估的预测有效性。
- 质量保证. 出版前,所有评估均由Vervoe的内部评估和I/O心理学团队进行审查。如果专门为您的组织创建了评估,则您的相关主题专家在使用前会大量参与质量保证和批准流程。
Vervoe专有的人工智能根据考生与该平台的互动情况,以及他们如何进行评估以及对每个问题的回答,对考生进行评分。考生的背景、教育、地理位置、性别、种族或任何其他个人因素都不会被软件所知道,因此,在评分时也不会考虑。唯一被分析的因素是一个人回答问题的能力,因此,扮演这个角色的能力。
此外,Vervoe还进行了质量保证检查,如果人工智能识别出可能存在的偏差,而这种偏差已经潜入手动分级,则数据科学团队将对其进行调查。如果发现违规,将调整评分。这是Vervoe为减少评估和招聘过程中出现偏差的可能性而实施的另一项措施。
我们的流程确保每一次评估都适当地测试了执行角色所需的相关技能(技术和软技能),并且可以在每次创建新的评估时进行复制。
评估有效性
简介:
- 任何直接模仿一个人在工作中的表现的测试都可以被认为是“有效的”
- 个性和软技能测试即使在“验证”的情况下也是一个风险更大的前景,因为它们通常缺乏符合EEOC要求的适当验证。
- 积极的应聘者经历和公平感是技能测试是一种有效且权宜之计的招聘实践的两个主要原因。
概述
在雇用候选人之前对他们进行测试的价值在于有一种权宜之计来评估他们是否适合这份工作。然而,基于测试做出的决策不能比测试提供的信息更好,这使得测试准确地表示它所表示的结构非常重要。
然而,这有点困难,因为正在评估的结构,如知识、技能、态度和认知过程,不能客观地知道,必须进行推断。为此,有许多统计测量用于评估测试的可靠性(一致性)和有效性(准确度)。
心理测量的有效性有很多种类型,很少有测试(如果存在的话)能针对每一种类型。特别是在寻找工作适合性的测试中,有几种不同类型的有效性特别相关,不仅是为了确保雇佣是一个好的,而且是为了确保符合EEOC的规定。
建立Vervoe评估的有效性
评估的有效性由多个类别组成,我们的行为科学团队在创建Vervoe的所有评估时都关注这些类别:
表面有效性
这个测试看起来像是在评估它声称要测量的东西吗?
面子效度是效度的最基本形式,需要普遍的共识,即参加此测试的人需要展示测试评估的结构。例如,一组用于评估算术能力的数学问题比一组单词问题具有更多的面子效度,因为后者评估的是一个组合n算术技能和阅读理解(这意味着测试是在特定环境下评估算术技能,但不是一般情况下)等。对于某些类型的技能测试,这是可用的主要有效性类型,有时是首次创建测试时可以获得的唯一有效性类型。
一般来说,这类技能测试要求应聘者从事的任务,理论上任何人都能完成。只要任务反映了个体为了正确完成工作而需要完成的活动,这些问题就具有表面效度,并且符合平等就业机会委员会的要求。
也就是说,一家公司应该始终注意在特定人口群体上的“不成比例的影响”,因为这可能是测试有问题的指标。例如,如果只有75%的人口统计成员通过测试,而其他人口统计学的93%,则测试仍然可以符合EEOC,但调查是必须的。
实践中的面子效度
对呼叫中心代理的评估可能会对如何在电话中管理愤怒的客户产生疑问,这将具有很高的面子效度。相比之下,如果要求呼叫中心代理完成一项财务建模任务,应聘者将不知道与该职位有何关联。这将具有较低的面子效度。
我们的所有评估都是针对特定的工作角色设计的,并且只包括与该职位相关的问题,在您的组织范围内,确保所有评估具有较高的表面效度。
内容有效性
测试是否涵盖了预期测量的结构的全部范围?
内容效度指的是一个给定的测试是否涵盖了它所测量的结构的全部范围的具有代表性的样本。对于工作测试,效度的问题应该集中在这一点上。除了确保问题似乎是关于主题相关职位(表面有效性),一组(一组)的问题需要评估范围足够的任务,以便评估者可以知道答案的描绘个体是否能做的任务所需的工作。
只要一组问题提供了一个具有代表性的样本,候选人将需要做的工作,并能正确地做这项工作的人肯定能提供可靠的答案的问题,问卷具有内容效度,并符合平等就业机会委员会。(再次强调,重要的是要意识到不成比例的影响的可能性,并准备好改变任务,如果你看到一个特定的人口统计得分低于另一个。)
实践中的内容效度
在前面的例子之后,如果呼叫中心代理只回答与愤怒的客户有关的问题,则该评估将有很低的内容有效性,因为角色有许多其他方面。但是,如果评估侧重于成功执行争议解决,客户服务,销售和多任务处理所需的多种技能,则此评估将具有高内容有效性,因为它涵盖了工作所需的任务范围。
我们的团队与您组织的专家进行协商,以了解角色的关键组成部分,并确保每次评估的高内容有效性。通常我们的团队会与您组织中对工作有深刻理解的人紧密合作。这个过程可能包括与该角色的经理或员工1:1的会议,了解该角色的挑战,高绩效人员的属性,以及需要发展的领域。
我们要求访问定位说明,培训材料,广告和性能指标,以完全了解工作所需的工作,因此应该包含在评估中的内容。从这项研究和调查中,我们努力包括成功履行作用所需的至少3-4个关键技能,以确保评估包含正在评估的完整构建体并涵盖工作的各种要素。
由此,您可以确信,在评估中得分较高的候选人更适合该职位,并且可能表现更好。
建构效度
测试是否实际测量了它声称测量的基于理论的结构?
在招聘中,构念效度对那些不直接评估将在工作中使用的知识和技能的测试有最大的影响。更确切地说,它是关于确定,比如说,对细节的关注(“软技能”的一个例子)或外向性(性格特征)的测试是否真的表明这个人具有所指示的特征。当人力资源人员问一个测试是否“有效”或“心理测量效度”时,这通常是他们所谈论的。
但是,当涉及到直接在工作中使用的技能测试时,与面孔和内容效度相比,结构效度的相关性要小得多。
然而,一般认知能力和/或个性测试绝对需要具备结构效度才能符合EEOC,因为它们间接关系到成功完成工作的实际任务。为了使人格或“软技能”测试有效,它必须评估一个理论结构,该理论结构的存在可以通过对科学文献的回顾来进行辩护,并且统计数据必须表明,这些测试问题确实共同作用于描述一个连贯的结构。
预测/外部有效性
我们是否从测试性能预测/适用于其他情况的信息?
预测/外部效度是关于测试是否预测未直接测试领域的绩效。尽管测试可能具有上述类型的有效性,但以无上下文方式测试的任务与在工作上下文中执行实际任务之间仍然存在差异。如果一家公司打算使用测试,那么证明该测试确实预测了工作中的高绩效和/或与公司/团队的良好契合度总是很有帮助的。对于将最终用于工作的技能测试,预测有效性对于EEOC合规性非常有帮助,但在技术上不是必需的。但是,对于任何其他类型的测试,这对一家公司来说都是至关重要的,他们必须在自己的公司内运行这些数字。
识别最重要的观点是预测有效性在公司之间没有转移。如果一项研究证明,测试A测试在一个大10次咨询公司的高性能上,那么它根本没有帮助一个大型的4个会计师事务所(特别是如果他们不得不捍卫自我与EEOC相关的诉讼)。如果您不能证明它在公司中的高低表演者之间区分它的人格测试(例如)是什么好的?
不幸的是,大多数测试不能做出这样的事情,部分原因是大多数运行预测有效性测试的人只能证明某种特定的组合作品 - 但是,他们无法做到这一点,证明它是最好的或只有最好的或唯一的组合这是有效的(这可以做到,但这是非常困难和工作要做的事情)。反过来,这意味着他们还没有实际证明其他分数应该导致人们被拒绝,这可能是有风险的,可以使公司错过梦幻般的人才。
此外,一个给定的公司只有在使用了一段时间并测量了在职表现之后,才能证明一项测试具有预测/外部效度,这意味着公司最初不能假设这些工作成功的间接衡量是有效的。
实践中的预测/外部效度
Vervoe的评估已经被证明对我们的客户具有预测效度。例如,在一个组织中,使用Vervoe评估的应聘者比销售目标高出4%。另一项研究表明,Vervoe的员工在呼叫中心职位上获得了更高的客户满意度得分。
技能评估的有效性和符合性
在招聘过程中使用基于技能的测试的主要价值之一是,在测试项目和工作中将要执行的任务之间有一个明确的对应关系。因此,技能测试同时具有表面效度和内容效度,符合平等就业机会委员会的要求。此外,在雇主花时间评估候选人的申请材料之前,这些测试可以方便地显示出哪些候选人名义上有能力胜任这份工作。相比之下,对未来工作表现的间接测试,如性格测试和一般认知能力和/或“软技能”的评估,需要广泛的评估,以确认构建和预测/外部有效性,这使它们成为一个风险更大、更不适宜的举动。
然而,在所有情况下,雇主必须始终注意在表现中的人口差异,并且如果发现重要的问题,立即调查。在Vervoe,我们不断监控我们的测试,以确保候选人正在进行一个公平的测试,这些测试评估他们将使用的技能做得好。作为一个额外的利益,许多公司发现,使用公平测试也会产生更多样化的最终选手,更像是世界上存在的广泛人才的代表。
虽然个性和认知评估很难验证招聘流程,但它们可以通过对自己的独特性量身定制的方式有所帮助,这些方式可以为他们量身定制的方式,这可以给他们一个平稳和上电的开始。但是,最重要的是候选人经历。一个愉快的候选经历,结合了过程公平的感知(以及实际上是公平的测试!),是确保候选人不仅向公司展示其能力而且对公司的积极观点来说是最好的方法无论招聘过程的结果如何。
减少偏见
Vervoe的评估严格按照上述标准化程序进行。所有评估都以技能为重点,并通过Vervoe平台进行在线管理。这确保每个考生都有相同的机会使用相同的说明、程序和时间限制(如适用)进行评估保持不同角色、组织和评估的考试条件一致。
Vervoe专有的人工智能根据考生与该平台的互动情况,以及他们如何进行评估以及对每个问题的回答,对考生进行评分。考生的背景、教育、地理位置、性别、种族或任何其他个人因素都不会被软件所知道,因此,在评分时也不会考虑。唯一被分析的因素是一个人回答问题的能力,因此,扮演这个角色的能力。
评估中的所有问题都是根据每位考生的情况来写的;无论背景、种族、性别、教育或宗教,都可以公平回答,如果他们具备相关技能,就没有差别待遇或影响。
客户使用Vervoe评估的责任
创建自己的问题或评估,或更改问题或评估以测试候选人的客户负责确保其评估符合EEOC指南,并将筛选过程中的不同影响或任何潜在歧视降至最低。
Vervoe不承担由个人雇主创建的评估的责任,也不支持根据应聘者的工作能力以外的因素对其进行有意筛选的评估。
雇主有责任根据《美国残疾人法》或其他同等法律的要求,为提出要求的候选人提供替代的筛选方法。
使用Vervoe既定评估的雇主了解将评估作为筛选过程一部分的局限性,并同意仅使用适合所雇佣角色的评估。
此外,雇主必须确保所有评估均按照EEOC的公平和公正雇佣实践指南使用