The Relationship Between Lexical Frequency Profiling Measures and Rater Judgements of Spoken and Written General English Language Proficiency on the CELPIP-General Test
Abstract
Independent confirmation that vocabulary in use unfolds across levels of performance as expected can contribute to a more complete understanding of validity in standardized English language tests. This study examined the relationship between Lexical Frequency Profiling (LFP) measures and rater judgements of test-takers’ overall levels of performance in the Speaking and Writing modules of the CELPIP-General test. In particular, the potential of measures such as lexical stretch and number of frequency bands accessed was examined. Randomized quota sampling from previously rated test-taker responses resulted in 200 speaking samples and 200 writing samples being compiled to create corpora of 211,602 running words and 70,745 running words respectively. Pearson r was used to examine the relationships between the LFP measures and rater judgements of CELPIP levels. Results point to significant correlations, with increasing CELPIP levels of performance generally accompanied by test-takers’ increasing ability to produce greater numbers of words, deploy a greater variety of words, rely less on high-frequency vocabulary, tap into mid-frequency vocabulary, and access a greater number of frequency bands. These results underline the contribution of independently obtained lexical measures toward a fuller understanding of concurrent validity in standardized English language proficiency testing.
La confirmation indépendante que le vocabulaire d’usage se répand sur plusieurs niveaux de performance tel que prévu peut contribuer à une meilleure interprétation de la validité des tests standardisés de langue anglaise. Ce e étude a examiné le rapport entre les mesures de profilage de la fréquence lexicale et les évaluations de la performance globale des élèves aux modules de parole et de rédaction du Programme canadien d’évaluation du niveau de compétence linguistique en anglais (CELPIP). Plus précisément, on a examiné le potentiel des mesures telles l’étendue lexicale et le nombre de bandes de fréquences a eintes. L’échantillon- nage par quota aléatoire de réponses d’élèves déjà évaluées a entrainé la formation de 200 échantillons de parole et 200 échantillons de rédaction représentant deux corpora, un de 211 602 mots liés et l’autre de 70 745 mots liés. On a employé le coe cient de corrélation de Pearson pour examiner les rapports entre les mesures de la fréquence lexicale et les évaluations en fonction des niveaux du CELPIP. Les résultats dévoilent des corrélations signi catives entre, d’une part, les meilleures performances au CELPIP et, d’autre part, une capacité à produire une quantité et une variété plus importantes de mots; à moins recourir aux mots les plus fréquents; à puiser dans du vocabulaire à fréquence moyenne; et à accéder à un plus grand nombre de bandes de fréquence. Ces résultats soulignent la contribution des mesures lexicales obtenues indépendamment à la compréhension de la validité concourante des évaluations standardisées des compétences linguistiques en anglais.