Concetti fondamentali

Parole chiave

Per facilitare la visualizzazione e l’interpretazione dei risultati forniti dal Vocabolario, diamo qui un prospetto sintetico dei principali concetti operativi del lavoro lessicografico.

Concordanza: dizionario relativo a uno o più testi, in genere di un solo autore, contenente, in ordine alfabetico, i lemmi ai quali sono state ricondotte le parole del corpus concordato. La concordanza, sia essa in modalità KWIC (key-word in context) o KWOC (key-word out of context), riproduce di norma i contesti nei quali sono realizzati i lemmi nelle loro diverse forme e occorrenze. La concordanza è esaustiva quando prende in considerazione tutte le categorie grammaticali, anche quelle sinsemantiche.

Lemma: corrisponde alla parola posta in esponente nei dizionari, ovvero all’entrata lessicografica, sotto la quale vengono posti i contesti.

Forma: ogni realizzazione differente di un medesimo lemma (ad esempio, «vai» e «andrò» sono forme diverse del lemma andare).

Occorrenza: la ricorrenza o uso di parola in un testo concordato (ad esempio, nell’opera poetica di Montale il lemma sommergere ha frequenza 11, cioè appare 11 volte, ma in 6 forme diverse). Il totale delle occorrenze si identifica quindi con la frequenza assoluta del lemma.

Parola: nell’informatica linguistica indica una unità o forma grafica posta tra due spazi bianchi o due separatori (che possono essere sia spazi bianchi sia segni di interpunzione). In questo senso, anche i numeri vanno presi in considerazione nella lemmatizzazione (a meno che essi non indichino delle mere partizioni di opera o componimento). I nomi propri, i toponimi, i titoli di opere, ecc., anche se costituiti da più parole, vanno presi in considerazione come unità lessicale.

Frequenza: si distinguono la frequenza assoluta (cioè il totale delle realizzazioni nel testo) e la frequenza relativa, indicata dalla percentuale (arrotondata per difetto) risultante dal rapporto tra frequenza assoluta e totale di tutte le parole-occorrenze del testo.

Categoria grammaticale: nella concordanza accompagna sempre il lemma ed è costituita da una sigla di due lettere minuscole relative alla definizione grammaticale del lemma.

Contesto: nel caso specifico di ALPION, il contesto coincide con l’unità del verso (o della riga nel caso di titoli, dediche, epigrafi, didascalie, sezioni, sottosezioni).

Omografo: lemma che, nell’ambito della medesima categoria grammaticale, presenta la stessa forma grafica di un altro, dal quale va distinto o per radice etimologica o perché portatore di un significato nettamente distinto (ad es. razza¸’specie’ e razza, tipo di pesce).