Rhythm variation in late-modern Stockholm, 2015-2019

PhD project, Queen Mary, University of London, Department of Linguistics
Supervisors: Dr. Devyani Sharma and Dr. Erez Levon
About

My Ph.D. project aims to explain how speech sound – i.e., phonetic variants and prosody – varies by style according to class and ethnicity in Stockholm, Sweden.

 

The data was collected in conjunction with an institutional visit at the Centre for Research on Bilingualism at Stockholm University.

 

The data come from a speech corpus that I assembled between 2016 and 2018. The corpus contains over 110 hours of casual and interview speech from over 50 men from diverse social classes and ethnicities in Stockholm.

Funding
Findings
Abstract

The main finding of this thesis is that rhythm is a stratified variable in the speech of men in Stockholm. An epicenter for the social forces associated with late modernity, Stockholm is also home to Europe’s ‘first’ multiethnolect (Rinkeby Swedish, Kotsinas 1988). Swedish-language researchers describe the variety as ‘staccato’, but rhythm has not been thoroughly investigated for any variety of Stockholm Swedish in production.

 

Data come from 36 male Stockholmers, ages 24–45, from a stratified sample of social classes. Seventeen self-identify by the term svensk (Swedish) and 19 by the highly racialized term invandrare (literal translation: immigrant). All were born in Sweden save for three who arrived before age seven. Three contextual styles were elicited to capture a speech-formality cline: casual, reading, and radio (reading like a radio announcer). Rhythm is operationalized with an adaptation of the nPVIV algorithm (Low, Grabe, & Nolan 2000).

Not only does rhythm stratify predictably in the direction of staccato (low alternation) for the racialized working class, it also is significantly high-alternation/non-staccato in the speech of the white working class. The former is interpreted to be a feature of multiethnolect; the latter a feature of Södersnack, Stockholm’s industrial-era working-class variety. The higher classes produce an intermediate degree of rhythm in their casual speech.

Rhythm variation among the working classes is also stylistically sensitive. Working-class reading and radio appear to target upper-class casual. The racialized working class shows a stylistic sensitivity that is stronger among younger speakers than old, implying a transition from indicator to marker (Labov 1972:179) for staccato rhythm. The white working class shows a high degree of stylistic sensitivity regardless of age, implying that high alternation is a Södersnack legacy feature.

Generational differences in rhythm production are examined within the racialized working class, and a change point is identified between those born before 1983 and those after. Those born before 1983 mainly achieve ‘staccato’ with a reduction of accented phonologically-long vowels. Those born after 1983 achieve it with an innovation; they enlarge unstressed vowels, both phonologically short and long. ‘Reduction’ and ‘enlargement’ refer to duration, f0, and energy. The change point coincides with historical spikes in migration, inequality, and school segregation that would have occurred when the speakers were in adolescence.

In all contextual styles, age is a stable predictor of rhythm, independent of social class and racialization. Younger speakers of any background have more staccato speech than older speakers of the same background. It is proposed that this is due to the diffusion of contact prosody, for which multiethnolect is one key conduit.

Samman-fattning

Denna avhandling visar att talrytm är socialt stratifierad i vardagsspråket hos vuxna män i Stockholm. Som ett symboliskt centrum för många senmoderna sociala förändringar i Europa är Stockholm också en hemvist för Europas ”första” multietnolekt (rinkebysvenska, Kotsinas 1988). Forskare i svenska har beskrivit varietetens prosodi som ’staccato’ och ’stötig’ men det saknas fortfarande en grundlig utredning av talrytm för alla stockholmska varieteter, inte minst för Stockholms multietnolekt.

Avhandlingens material består av ljudinspelningar med 36 män från Stockholm, i åldern 24–45, från ett stratifierat urval av sociala klasser. Sjutton deltagare identifierar sig med begreppet svensk och 19 med det rasifierade begreppet invandrare (begreppen problematiseras i avhandlingen). Alla deltagare är födda i Sverige förutom tre som invandrade innan de fyllde sju år. Tre talstilar spelades in för att fånga ett formalitetskontinuum: vardagsspråk, högläsning och radio (högläsning som härmar en radiopratare). Talrytmen mäts med en anpassad version av nPVIV -algoritmen (Low, Grabe, & Nolan 2000).

I enlighet med avhandlingens hypotes stratifierar talrytmen åt staccatohållet (låg vokalkontrast) hos den rasifierade arbetarklassen. Talrytmen stratifierar däremot också åt det motsatta hållet (’ickestaccato’, dvs. hög vokalkontrast) hos den vitsvenska arbetarklassen. Jag drar slutsatsen att det förstnämnda resultatet är ett drag av Stockholms multietnolekt och det senare ett drag av så kallat södersnack, Stockholms traditionella arbetarmål. Överklassen producerar en prosodisk rytm som ligger mittemellan de två arbetarklassernas rytmer.

Den rytmiska variationen hos arbetarklassen är systematisk och känslig för språkregister. Rytmen i båda arbetarklassernas högläsning och radio liknar rytmen i överklassens vardagsspråk. Hos den rasifierade arbetarklassen beror rytmens stilmässiga känslighet på ålder. Yngre talare dämpar staccatorytmen i högre grad än äldre talare, vilket tyder på att staccatoeffekten har utvecklats från indikator (indicator) till markör (marker) (Labov 1972:179). Den vitsvenska arbetarklassen visar en hög grad av stilmässig känslighet, vilket tyder på att den höga vokalkontrasten är ett etablerat drag som möjligtvis härstammar från södersnack.

Det finns en generationsskillnad inom den rasifierade arbetarklassen mellan dem som föddes före och efter år 1983. De som föddes före 1983 utför staccatoeffekten med en reduktion av betonade långa vokaler. De som föddes efter 1983 utför staccatoeffekten med följande novation: en utvidgning av obetonade vokaler, både korta och långa. Reduktionen och utvidgningen utförs genom duration, f0 och intensitet. Generationsskillnaden sammanfaller med betydande socialhistoriska utvecklingar som alla uppträdde när informanterna var i tonårsåldern, t.ex. 90-talets migrationsvåg, en ökad samhällelig ojämlikhet och segregation inom skolväsendet.

För alla talstilar är ålder en stabil förklaringsvariabel när nPVIV är responsvariabeln, oberoende av social klass, etnicitet eller rasifiering. Yngre talare, oavsett bakgrund, har lägre vokalkontrast än äldre talare. Jag föreslår att det här kan ses som en följd av en diffusion av prosodiska kontaktdrag in i stockholmska, där multietnolekten är huvudfaktorn.

References

Kotsinas, U.-B. (1988). Rinkebysvenska - en dialekt? [Rinkeby Swedish - a dialect?]. In P. Linell, V. Adelswärd, T. Nilsson, & P. Petersson (Eds.), Svenskans beskrivning 16 [The description of Swedish 16] (Vol. 1, pp. 264–278). Linköping: Tema Kommunikation.

Labov, W. (1972). Sociolinguistic Patterns. Philadelphia: University of Pennsylvania Press.

Low, L. E., Grabe, E., & Nolan, F. (2000). Quantitative Characterizations of Speech Rhythm: Syllable-Timing in Singapore English. Language and Speech, 43(4), 377–401.

© 2019 by Nathan Young.