pte口语分数构成

ads


很多小伙伴都会问驼驼,一些关于评分机制的问题:
“驼驼,各个题型的占分比是怎样的哇”
“背了机经就能八炸嘛?”
“遇到难题分数反而容易高么?但是我又听说题目难分数就低”
“考试的评分机制究竟是怎样的
......


1、背机经产生的影响会比常规考试(例如高考)大。


对于词汇比较难的题,提前背好机经很容易和没背机经的同学拉开差距。因为词汇比较难的题有着更高的难度系数(Diffilcult Level)。


同时,在正态分布中,由于机经的影响也让数据更加离散,特别是对于难题考生间更容易拉开差距。正式考试时,你写下来机经上的一部分内容就能拿到高分,所以建议考生可以多刷刷机经。(PS:羊驼APP上面就有机经全库,还有一些题型命中率高达99%的每周更新的高频机经哦~)



2、每个题型的分数都是不确定的,之前网上流传的每个题型的数值都不准确。


之前有的机构说,测试了只做WFD,发现给写作贡献48分,听力贡献27分(这个和我们测试的结果一样),就断言WFD的写作占比是48/90,听力占比是27/90,这样是非常不科学的。


这只是一个大概的数值。并且在不同的分数段,每种题型提供的分值是会变化的。至于为什么显示的成绩会给写作贡献这么多,数学好的同学读完本文就知道了。




3、你拿到分数和题目的难易无关。


因为简单的题目更难得分,难的题目更容易得分,这样一来就抵消了题目的难度阻力。举一个极端的例子,如果一个考生发挥极其稳定,他做难题和简单题得到的分数是分毫不差的。



PTE考试不是打副本,而是一场排位赛

我们的高考是每个题题目都有固定的分数。比如,你错3个英语单选题,你就在英语总分里面被扣了3分,扣的分数非常固定,我们把这种评分机制叫做标准参照评价。

        

比如某一年湖南省的高考题目很难,考生群体的分数就会相对上一年度明显下降。但是,是不是大家分数都不高,就没人能考上清华了呢?肯定不是,清华的分数线也会随之下降。反之,则会水涨船高。

PTE成绩单的分数,就像学校的分数线,是会随着难易变化的。举一个极端的例子,假设其他所有考生的PTE原始分都只有1分,只有你考了2分,那你就是PTE满分90分。

你能不能够进清华,是你在当年高考全省的排名决定的。同样的,你的PTE成绩是多少,则是你在所有考生中的排名决定的。

所以,你在PTE考生中的排名就是你的分数,PTE是一场排位赛。

那么在机器眼中,你的口语是如何被打分的呢?

PTE在研发初期建立了一个语料库,该语料库搜集了世界各地的英语样本(所以这也是为什么,各国口音的样本PTE都能被接纳)。然后官方也会邀请human raters来为这些语料库做出评分,凡是human raters认为是Above Average的样本,就会被纳入语料库中。

那么你在考试中所读的音频,也将和这个语料库里的数据,做相似度的匹配,看看你和这些优秀的样本有多少相似度。也就是说,如果我们自己的音频能够对比到90分数段的音频,那么我们的口语分数就是90分啦。(这里要为我们RA拆解和RA排名下的满分示范老师们做一波宣传,他们就是所谓的90分高分样本音频示范哦~)



同时机器因为不像人耳一样对你的口语表达的情感,逻辑和词汇丰富度进行主观评判,那实际上,机器能够做到的判断音波、声能、词切分

音波(waveform) :音波排列松散或密集,起伏是否正常(PTE考试的耳机能够识别的声音是100hz以上,如果低于100hz很有可能识别不到,在这里推荐大家下载一个软件voice tools能够测出自己的说英语的赫兹是否达到标准。 音波分布松散,说明语速可能存在过慢的可能,音波起伏不正常,单词重音位置松散、无起伏,说明重音位置错误)



声能(Spectrum)声音的光谱图能够展示出声音的能量,能量越足颜色就越深,越像”native speaker"的发音,发音位置靠后,你的元音也会发得更加的饱满和地道,中气十足。越浅代表,你可能是发音位置靠前,音标发音模糊不清。


词切分(Words segmentation):  PTE的单词识别是按照音素去划分的,如果你的音素之间的切割和正常音素切割的范围差别很大,可能代表你的整个单词读出来并非是合理的节奏或者语速。或者你整体的速度和高分样本一样,但是词切分没有体现音节的重弱差别,说明也和高分音频存在差异。

所以这也是为什么我们在日常口语教学中和大家强调:声音的可识别度、均匀语速、单词发音饱满和重音位置突出的口语要求。就是为了贴近机器的喜好,匹配高分样本表现。



PTE评分机制的一些细节


在之前的文章里面,跟大家提到过正态分布。这次详细一点儿说:PTE的考试分数服从的正态分布的规律。大致如下图:

       

           


Sco=final score(最终分数)
X=Raw Score(原始分数)
Mean=样本均值
SD=Standard Diviation=标准差
S=相关系数 
D=均值

简而言之,μ就是公式中的均值,可以改变整个正态分布的横向位置。σ就是公式中的standard diviation,在统计学中代表整个大样本的离散程度。


以上公式很复杂,这里略过10000字。具体的原理,教研大大说可以等羊驼开设统计学专门课程再跟大家细聊。在这里,只说PTE官方模考给我们提供的两个证据。


写作只做WE, Writing 有31分。只做WFD, Writing 有48分。WFD+ SWT一起做,Writing 却只有54分。


RS+WFD都做好=53分listening。RS说一半+WFD做好=49分listening。RS在口语中的占比比较大,只做一半,少说了那么多词,却只扣4分。


所以,每个题型的得分不是1+1=2的简单相加,而是1+1<2的复杂算法



另外一个重要的引申


             

本图为了更形象,特意把斜率画得比较明显,实际上的斜率没这么夸张。


让我们做一个思想实验。假设,一个同学从零基础,在学习中稳步提升各个题目准确率(有点像牛顿力学实验的匀速直线运动的理想状态),该同学从0分-30分提升是比较快的,40-60则是一个瓶颈期,提升较慢(因为大部分考生都在这个区间,要超越很多人才能提升一分),70-90提升则相对来说比较快。


注意,这是一个理想的状态,并且提升速度的差别可能较小,但是确实会有分数段不同而造成区别。实际情况会有其他更大的影响因素,比如,要考79分会牵涉到高难度低分值题型的攻克、重要题型的精益求精,所以一般情况下还是建议头悬梁锥刺股啃机经,并且获取外部的帮助。



别再通过阅读来背PTE单词了,2万+的词汇量是这样积累的!

PTE考位 | 最新考位反馈,南京、杭州考场键盘很拉跨!

重磅!澳洲留学生毕业签证大改,最多6年!留澳人数猛增,直逼疫情前!

工作十年,大龄考生两个月八炸逆袭指南!

突发! 澳洲PR大变!本周RA新增2道,WFD新增1道,旧题翻新6道!

WE还能用万能模板吗?为什么你用了模板,机器评分依然低?

重磅!2023澳移民政策巨变?!留学生拿PR或更容易?!换题季over,WFD全中神仙命中率!

对不住大家!羊驼终究没能挺进“决赛圈”!!60%人中招!

本文由拔丝英语网 - buzzrecipe.com(精选英语文章+课程)收藏,供学习使用,分享转发是更大的支持!由 PTE原创,版权归原作者所有。

最后编辑于:2023/6/1 拔丝英语网

admin-avatar

英语作文代写、国外视频下载

高质量学习资料分享

admin@buzzrecipe.com