Cronache linguistiche
Italiano parlato, okay


Sono usciti gli Atti del Convegno della Società di Linguistica Italiana dedicato alle "Linee di tendenza dell'italiano contemporaneo", quello tenuto a Lugano nel settembre 1991. Il volume è ricco di materiali e di idee che si adattano perfettamente agli obiettivi di questa rubrica. Ne discorreremo varie volte.

È d'obbligo cominciare dall'intervento di Tullio De Mauro e dei suoi collaboratori. L'obbligo deriva dal fatto l'oggetto di quell'intervento, il Lessico di frequenza dell'italiano parlato (LIP) è stato pubblicato, proprio in questi giorni (presso la ETAS LIBRI, nella collana della Fondazione IBM, per le cure di Tullio De Mauro, Federico Mancini, Massimo Vedovelli, Miriam Voghera).

Immagino che i lettori sappiano che cos'è un lessico di frequenza: è la lista di tutte le parole che compongono un corpus, scelto in modo da essere rappresentativo dell'uso di una lingua, ordinate dalla più frequente alle meno frequenti. I lessici di frequenza dell'italiano si basavano, fino ad oggi, su campioni scritti. Il LIP fa riferimento, invece - è questa la novità - ad un corpus di testi orali, differenziato geograficamente (sono rappresentate Milano, Firenze, Roma e Napoli) e tipologicamente variegato (comprende conversazioni faccia a faccia, conversazioni telefoniche, dibattiti, lezioni o comizi o omelie, trasmissioni radiotelevisive), per complessivi 3500 minuti di registrazione e 500.000 parole.

Da un lavoro come questo si possono imparare molte cose. Mi sono messo a leggere questa apparentemente arida lista di parole. Ho così scoperto, ad esempio, che una frase come «io non ho detto di averci avuto a che fare» è composta tutta di parole comprese fra le ventidue più usate nel corpus e che per giungere invece a comporre la frase «egli dice di avere anche questa cosa» bisogna arrivare fino alla quarantunesima parola della lista. E' significativo questo fatto? Eh sì, perché cosa, che è una delle parole più generiche che esistano, è il primo sostantivo della lista ma giunge, per l'appunto, solo al quarantunesimo posto. I 40 lemmi più usati sono costituiti da articoli (è l'articolo determinativo, il, la ecc., la parola più diffusa nel parlato), verbi (essere, avere, fare, dire, andare, potere, volere, dovere), pronomi, preposizioni, congiunzioni. Per raggiungere il sostantivo successivo, che è anno, bisogna proseguire fino alla settantacinquesima parola della lista (poi, con distacchi minori, arrivano parte, problema, volta, giorno - e siamo così al lemma numero 100). Il parlato, dunque, sembra proprio privilegiare i verbi rispetto ai sostantivi (i curatori segnalano che, confrontando i dati del LIP con quelli dei lessici di frequenza basati sullo scritto, si nota nel corpus parlato proprio un generale slittamento dei verbi verso l'alto, cioè verso un uso più frequente).

andiamo avanti a leggere il nostro elenco di parole. Chi si trova al posto 417? Okay, il primo forestierismo della lista. Per trovare il secondo esotismo, che poi è il latinismo ex, bisogna scorrere altre mille parole (si tratta appena di 247 okay e 24 ex). Ma allora che fondamento ha l'idea ricorrente di un italiano pesantemente insidiato dalle parole straniere? O degli intellettuali incantati dalle lingue straniere? Le lezioni e i dibattiti sono i tipi di testo che presentano la percentuale minore di esotismi (al polo opposto ci sono le conversazioni telefoniche, ma già la relativamente alta frequenza di okay può farci capire perché è proprio questo tipo di interazione orale ad essere meno povera di parole straniere).

Le possibilità di utilizzo del LIP non finiscono qui. Dalla lettura del libro possiamo passare alla lettura dei testi che hanno costituito il corpus, raccolti in due dischetti da computer, facilmente utilizzabili. Ci è così consentito di integrare i dati quantitativi, a volte in sé fuorvianti, con considerazioni qualitative. Due esempi, centrati ancora sui forestierismi: nella lista, week-end ha una frequenza non trascurabile (8 occorrenze); ma ricorrendo direttamente al corpus si scopre che provengono tutte otto dallo stesso testo. Il dato è, dunque, in realtà molto meno rilevante di quel che poteva apparire. Oppure, che cos'è quel white, che, inatteso, appare con frequenza 6? Risalendo al dischetto si chiarisce che si tratta della parte iniziale del nome della ditta fiorentina White Florence, nominata nel corso di due aste televisive.

Termino suggerendovi non solo di consultare, ma anche di leggere, il LIP. E in più di divertirvi con il LIP: poiché il repertorio presenta anche i nomi propri, provate a giocare al «Chi c'è?». Cercate Saddam e Bush, Curcio, Andreotti e Craxi, Maradona, Baggio e Gullit. Chi, fra questi, è citato nel corpus? Le sorprese non mancheranno.

Michele A. Cortelazzo

«Corriere del Ticino», sabato 20 marzo 1993, p. 29