﻿<?xml version="1.0"?>
<!DOCTYPE TEI.2 SYSTEM "cch-tei.dtd" >
<TEI.2 id="paper03">
   <teiHeader>
      <fileDesc>
         <titleStmt>
            <title>Le applicazioni di XML ai testi contemporanei: problemi di variantistica</title>
            <author><name reg="Silvi, Daniele">Daniele Silvi</name></author>
            <author><name reg="Geri, Lorenzo">Lorenzo Geri</name></author>
         </titleStmt>
         <publicationStmt>
            <publisher>Centre for Computing in the Humanities, King's College London - Marked up to
               be included in the CLiP 2006 Conference Abstracts book.</publisher>
            <address>
        <addrLine>Strand, London WC2R 2LS, England, United Kingdom. Tel:+44 (0) 20 7848 2684</addrLine>
        <addrLine>http://www.kcl.ac.uk/cch/</addrLine>
      </address>
         </publicationStmt>
         <sourceDesc>
            <p>No source: created in electronic format.</p>
         </sourceDesc>
      </fileDesc>
      <profileDesc>
         <langUsage>
            <language id="ita">Italian</language>
         </langUsage>
         <textClass>
            <classCode>paper</classCode>
            <keywords>
               <list>
                  <item>XML</item>
                  <item>Text encoding</item>
                  <item>Digital variants</item>
               </list>
            </keywords>
         </textClass>
      </profileDesc>
      <revisionDesc>
         <change>
            <date>2006-06-15</date>
            <respStmt>
               <name>AC</name>
            </respStmt>
            <item>correction of affiliations and quotes for attributes in examples</item>
         </change><change>
            <date>2006-06-06</date>
            <respStmt>
               <name>MK</name>
            </respStmt>
            <item>minor changes</item>
         </change>
         <change>
            <date>2006-05-31</date>
            <respStmt>
               <name>MK</name>
            </respStmt>
            <item>minor changes</item>
         </change>
         <change>
            <date>2006-04-21</date>
            <respStmt>
               <name>EL</name>
            </respStmt>
            <item>created XML doc</item>
         </change>
      </revisionDesc>
   </teiHeader>

   <text>
      <front>
         <docTitle>
            <titlePart lang="ita">Le applicazioni di XML ai testi contemporanei: problemi di
               variantistica</titlePart>
         </docTitle>
         <docAuthor>
            <name reg="Silvi, Daniele">Daniele Silvi</name>
            <address>
               <addrLine><xref type="email" url="silvi@lettere.uniroma2.it">silvi@lettere.uniroma2.it</xref></addrLine><addrLine type="affiliation">Università Roma Tor Vergata</addrLine>
               <addrLine>Rome</addrLine>
               <addrLine>Italy</addrLine>
            </address>
         </docAuthor>

         <docAuthor>
            <name reg="Geri, Lorenzo">Lorenzo Geri</name>
            <address>
               <addrLine type="affiliation">Università La Sapienza Roma</addrLine><addrLine>Rome</addrLine><addrLine>Italy</addrLine>
            </address>
         </docAuthor>

      </front>
      <group>
         <text lang="ita">
            <body>
               <head>Le applicazioni di XML ai testi contemporanei: problemi di variantistica</head>
              <p>La codifica informatica dei testi letterari, almeno in Italia, è stata per lo più
                  realizzata sulle opere "canoniche" della nostra ricca tradizione letteraria (sino
                  al primo Novecento). Ne consegue un modello di edizione elettronica pensato per la
                  costituzione di banche date testuali. In queste codifiche il testo formalizzato è
                  quello delle edizioni correnti, lo scopo della codifica è, da una parte mettere a
                  disposizione ricchi <foreign>corpora</foreign> di opere della nostra tradizione, dall’altro quello di
                  fornire raffinati strumenti di indagine con i quali indagare tali <foreign>corpora</foreign>
                  (concordanze e ricerche con operatori logici). Gli esperimenti di codifica per
                  così dire "filologica" si sono concentrati sui problemi, ingenti, che riguardano
                  la formalizzazione dei manoscritti, dato che nella nostra tradizione accademica
                 tutt’oggi è scarsamente presente la filologia dei testi a stampa (<foreign>textual
                    bibliography</foreign>). La codifica degli avantesti è poi un campo quasi del tutto
                  inesplorato.</p>
               <p>Lo scopo del progetto di ricerca <title>Codifica e analisi informatica di testi
                  letterari</title> dell’Università di Roma Tre, diretto da Domenico Fiormonte, è quello di
                  codificare e studiare un insieme omogeneo di testi di un autore contemporaneo dei
                  quali disponiamo di diversi stesure dattiloscritte con correzioni autografe sino
                  alle bozze riviste dall’autore. I testi in questione sono i racconti che Vincenzo
                  Cerami nell’estate del 1993 ha pubblicato, con scadenza settimanale, nell’inserto
                  culturale del quotidiano romano <title level="j">Il Messaggero</title>, all’interno di un rubrica dal
                  titolo <hi>Indiscreto</hi>, e ha poi raccolto in volume presso l’editore Einaudi,
                  con il titolo di <hi>La gente</hi>. Nel nostro intervento intendiamo discutere i
                  problemi relativi alla codifica di tali avantesti, partendo da un esempio
                  specifico: la codifica del racconto intitolato <hi>La donna serpente</hi>.</p>
               <p>Tale racconto è stato in precedenza studiato nell’ambito del progetto <title>Digital
                     Variants</title>. In quel contesto è stata realizzata la codifica in HTML del
                  testo definitivo (quello in volume) e di tre stesure precedenti. I testi sono
                  stati visuliazzati in <foreign>frames</foreign> per analizzare le differenze, utilizzando
                     <foreign>java-script</foreign>. Il risultato è la <title>Vincenzo Cerami Variants Machine</title>
                  realizzata dallo studente Mario Macciocca, al quale si è aggiunta la cura
                  linguistica di Cinzia Pusceddu, dell’Università di Edimburgo. La finalità di tale
                  strumento è essenzialmente didattica, dal momento che permette ai docenti di
                  lingua italiana all’estero di mostrare agli studenti in maniera piuttosto semplice
                  ed intuitiva il processo genetico e creativo di un testo letterario, commentando
                  le scelte linguistiche. Il modello di tale visualizzazione è in qualche modo
                  analogo a quello dell’edizione critica, in cui si riporta l’ultima volontà
                  dell’autore, registrando in apparato le varianti. In questo specifico caso, dal
                  testo definitivo, tramite un sistema di <foreign>link</foreign>, le varianti sono
                  visualizzate nel contesto di ogni singola stesura; come nei casi della <title>J.J.
                  Machine</title> e della <title>Versioning Machine</title>.</p>
               <p>Dopo aver studiato secondo un punto di vista filologico le due edizioni e gli
                  avantesti, abbiamo scelto di codificare le sei versioni in nostro possesso:
                  l’edizione pubblicata all’interno del <title level="j">Messaggero</title> del 10/08/1991, le tre
                  redazione dattiloscritte con correzioni autografe, le bozze riviste dall’autore, e
                  il testo pubblicato in volume.</p>
               <p>Analizzando la codifica in HTML già effettuata con i materiali a nostra
                  disposizione abbiamo notato una notevole perdita di informazione, inevitabile in
                  quanto tale codifica non è dichiarativa ma procedurale.</p>
               <p>Abbiamo scelto di codificare i testi utilizzando XML, che permette la
                  conservazione di tutti i fenomeni d’autore e, appoggiandosi per la visualizzazione
                  ai fogli di stile, può gestire diversi tipi di <foreign>output</foreign>. Siamo partiti, per
                  un principio di economicità dalla DTD TEI Lite, dalla quale abbiamo ricavato un
                  <foreign>set</foreign> dei tag più adatti a descrivere i fenomeni rilevati. Questa scelta è
                  stata possibile in quanto la tipologia degli avantesti a nostra disposizione non
                  presenta fenomeni eccessivamente stratificati, e non pone, di fatto, il problema
                  delle <foreign>overlapping hierarchies</foreign>.</p>
               <p>Il <foreign>tag set</foreign> da noi utilizzato è il più possibile semplice, dal momento che
                  abbiamo scelto di concentrare i nostri sforzi nell’utilizzare le non banali
                  possibilità degli attributi. La nostra codifica, infatti, intende essere
                  un’edizione diplomatica, al quale gli attribuiti affiancano parallelamente una
                  codifica interpretativa. I fenomeni correttivi e variantistici sono stati
                  segnalati da una parte nel loro aspetto sulla pagina: abbiamo registrato il tipo
                  di strumento utilizzato per correggere, penna o matita, il colore di tale
                  strumento; abbiamo distinto le tipologie di segni; abbiamo registrato dei segni
                  non immediatamente interpretabili nel loro significato. Allo stesso tempo tali
                  fenomeni sono stati interpretati: abbiamo distinto la correzione di un refuso da
                  una <hi>variatio</hi>; abbiamo cercato di categorizzare l’eliminazione di parti
                  del testo, distinguendo l’eliminazione di una ripetizione dall’eliminazione di una
                  porzione testuale sentita in fase di revisione dall’autore come scarsamente
                  efficace.</p>
               <p>Per raggiungere questo scopo abbiamo utilizzato principalmente due <foreign>tags</foreign>:<list>
                     <item>&lt;add&gt;, generalmente usato per marcare parti di testo
                        aggiunte dall’autore è stato arricchito con l’attributo <foreign>place</foreign> al quale
                        abbiamo assegnato i valori standard che indicano la posizione dell’aggiunta
                        all’interno del testo (per es. sopralineare, a margine, ecc). Queste
                        informazioni si rivelano invece perdute nella codifica in HTML dove le
                        diverse tipologie di aggiunta sono uniformate.</item>
                     <item>&lt;seg&gt;, un <foreign>tag</foreign> generico che serve a marcare
                        stringhe di testo e attribuirgli un valore; nel nostro caso è stato
                        utilizzato per quei fenomeni che non riguardano direttamente la lezione del
                        testo, ma che rivelano intenzioni di intervento da parte dell’autore, da noi
                        interpretate basandoci sulle modifiche effettivamente realizzate nelle
                        versioni successive nelle sezioni testuali in questione. Ad esempio abbiamo
                        indicato le sottolineature e le cerchiature in questo modo: <list><item>&lt;seg
                        type="ripetizione" rend="sottolineatura a matita"&gt;</item><item>&lt;seg
                        type="ripetizione" rend="tratto cerchiato a matita verde"&gt;</item></list>  In un caso
                        particolare abbiamo individuato la presenza di una serie di tratti a matita
                        verde posizionati a margine sinistro dei paragrafi. L’ipotesi
                        interpretativa, che non può avere una riprova certa, è che tali segni
                        indichino i nuclei narrativi del racconto. Questi fenomeni, perduti nella
                        precedente realizzazione, sono stati invece conservati mediante l’uso del
                           <foreign>tag</foreign>: <list><item>&lt;hi rend="tratto a matita
                        verde"&gt;-&lt;/hi&gt;</item></list></item>
                  </list></p>
               <p>Dal momento che a questo scopo la codifica dei fenomeni correttivi si accompagna
                  ad una interpretazione, abbiamo utilizzato il tag &lt;resp&gt; per
                  indicare il responsabile della interpretazione, ed eventualmente rimandare ad una
                  nota critica esterna alla codifica.</p>
               <p>Per rendere evidenti le potenzialità di questa tipologia di codifica abbiamo
                  scelto di analizzare automaticamente i dati. A questo scopo, per il momento, siamo
                  ricorsi alla soluzione più semplice, eppure, allo stesso tempo, più potente:
                  generare le concordanze su tutti i testi codificati, tramite il programma,
                  che permette di conservare le informazioni contenute nei <foreign>tags</foreign> e negli attribuiti.
                  Tale concordanze ci permettono di studiare concretamente le tipologie correttorie,
                  ponendoci domande come: quale racconto contiene il maggior numero di aggiunte? E
                  quale il maggior numero di tagli? Quale parola, tra quelle cancellate, ha la
                  maggiore frequenza? Quale rapporto token/types presentano i brani cancellati? Il
                  trattamento informatico dei dati codificati permette di affinare la critica
                  stilistica e/o linguistica.</p>
               <p>La nostra codifica, sia pure ancora da affinare e basata su un <foreign>tagset</foreign>
                  presistente, crediamo mostri quali prospettive si aprono nel caso si decidesse di
                  studiare un <foreign>tagset</foreign> dedicato alle bozze e ai dattiloscritti. A differenza
                  dei manoscritti, che per la loro multidimensionalità mostrano inesorabilmente i
                  limiti dell’XML, si può immaginare di arrivare ad una "completezza" della
                  codifica. Naturalmente alcuni fenomeni sono in ogni caso destinati ad essere
                  banalizzati. Su testi lunghi tale lavoro rischierebbe di essere inizialmente
                  antieconomico, ma al termine del faticoso processo di formalizzazione fornirebbe
                  un’importante messe di dati, particolarmente stimolante nel caso di
                  <foreign>corpora</foreign> testuali, e di testi che presentano diverse edizioni, intervallate
                  da numerose stesure.</p>
                            </body>
         </text>
      </group>
   </text>
</TEI.2>

