﻿<?xml version="1.0"?>
<!DOCTYPE TEI.2 SYSTEM "cch-tei.dtd" >
<TEI.2 id="paper34">
   <teiHeader>
      <fileDesc>
         <titleStmt>
            <title>Cultural Objects in Digital Resources: Imagining the Text</title>
            <author><name reg="Ciula, Arianna">Arianna Ciula</name></author>
         </titleStmt>
         <publicationStmt>
            <publisher>Centre for Computing in the Humanities, King's College London - Marked up to
               be included in the CLiP 2006 Conference Abstracts book.</publisher>
            <address>
               <addrLine>Strand, London WC2R 2LS, England, United Kingdom. Tel:+44 (0) 20 7848 2684</addrLine>
        <addrLine>http://www.kcl.ac.uk/cch/</addrLine>
      </address>
         </publicationStmt>
         <sourceDesc>
            <p>No source: created in electronic format.</p>
         </sourceDesc>
      </fileDesc>
      <profileDesc>
         <langUsage>
            <language id="eng">English</language>
            <language id="ita">Italian</language>
         </langUsage>
         <textClass>
            <classCode>paper</classCode>
            <keywords>
               <list>
                  <item>Material culture</item>
                  <item>Text encoding</item>
                  <item>image-based research</item>
                  <item>image processing</item>

               </list>
            </keywords>
         </textClass>
      </profileDesc>
      <revisionDesc>
         <change>
            <date>2006-06-06</date>
            <respStmt>
               <name>MK</name>
            </respStmt>
            <item>minor changes</item>
         </change>
         <change>
            <date>2006-05-31</date>
            <respStmt>
               <name>MK</name>
            </respStmt>
            <item>minor changes</item>
         </change>
         <change>
            <date>2006-05-23</date>
            <respStmt>
               <name>MK</name>
            </respStmt>
            <item>minor changes</item>
         </change>
         <change>
            <date>2006-04-25</date>
            <respStmt>
               <name>EL</name>
            </respStmt>
            <item>created XML doc</item>
         </change>
      </revisionDesc>
   </teiHeader>

   <text>
      <front>
         <docTitle>
            <titlePart lang="eng">Cultural Objects in Digital Resources: Imagining the Text</titlePart>
            <titlePart lang="ita">Oggetti culturali in risorse digitali: immaginando il
            testo</titlePart>
         </docTitle>
         <docAuthor>
            <name reg="Ciula, Arianna">Arianna Ciula</name>
            <address>
               <addrLine><xref type="email" url="arianna.ciula@kcl.ac.uk">arianna.ciula@kcl.ac.uk</xref></addrLine><addrLine type="affiliation">King's College London</addrLine>
               <addrLine>London</addrLine>
               <addrLine>United Kingdom</addrLine>
            </address>
         </docAuthor>



      </front>
      <group>
         <text lang="eng">
            <body>
               <head>Cultural Objects in Digital Resources: Imagining the Text</head>
               <div><p>This paper proposes an evaluation of humanities computing resources based on
                  their ability to represent texts. The discussion is based on the analysis of
                  several projects – to the development of several of which the author has directly
                  collaborated – different in nature, but all related to the representation of
                  textual material connected to its visual or graphic ‘counterpart’.</p>
               <p>It is well known that humanities scholars use images for their research in various
                  formats and combinations. In particular, copies, illustrations, surrogates are
                  used to observe and interpret the original cultural artefacts otherwise not
                  directly available and/or not legitimately transformable. When historical texts –
                  in the broad sense as understood by CLiP –
                  are taken into account, the connection
                  between the textual content and its physical object is particularly explicit. This
                  is valid for philology or palaeography as well as for archaeology and art history.
                  However, in the former case the text of interest generally refers to a support
                  perceived as a two dimensional image. It is an extreme case of symbiosis between
                  the text as a string of print/digital characters – already a first level of
                  interpretation and mark-up in itself –
                  and its extant materiality as a physical
                  artefact (codex, roll, early print edition etc.) recalled by a two dimensional
                  representation either analogical or digital.</p>
               <p>Although humanities computing projects can be very different in methodologies and
                  aims, within the digital resources created for supporting academic research it is
                  possible to identify some categories relevant to the focus of this paper:<list type="ordered">
                     <item>Digital resources which give priority to texts<list type="ordered" rend="lower_case">
                           <item>encoded texts</item>
                           <item>visualisation of the textual encoding</item>
                        </list></item>
                     <item>Digital resources which give priority to images<list type="ordered" rend="lower_case">
                           <item>low resolution images of texts</item>
                           <item> high resolution images of texts</item>
                           <item>virtual restoration of images of texts</item>
                           <item> annotation of images of texts</item>
                        </list></item>
                     <item>Digital resources which combine images and texts equally<list type="ordered" rend="lower_case">
                           <item>juxtaposition of independent sources (textual and graphic)</item>
                           <item>cross-references and connection of linked sources (textual and
                              graphic)</item>
                        </list></item>
                  </list></p>
               <p>This categorisation is not exhaustive nor exclusive –
                  indeed, different
                  subcategories can vary a lot semantically and can co-occur in the same resource –,
                  but it is appropriate for the evaluation which the paper aims to accomplish.
                  Although point 1.a is not relevant here, it has been included so as to
                  contextualise point 1.b. The visualisation of the encoding of a text is usually
                  hidden from the main interface of whatever encoded textual material a digital
                  resource provides. When the encoding is shown, a visualisation of the
                  interpretative layers beneath the textual sequence is made available. What is
                  visible is not the correspondent folio of a manuscript transcription for instance,
                  but the components that the encoder or the editor has considered as structural
                  parts of the text. This visualisation cannot be considered a graphic
                  correspondent. It is rather a visual representation of some selected elements of
                  which the user/scholar may already posses a mental image or, even more
                  interestingly, a new and unusual visual representation of the text generated by
                  the encoding process and open to further research.</p>
               <p>Similarly, point 2.a is not relevant to the issues this paper deals with. However,
                  a consistent amount of digital resources offer just low resolutions images for a
                  combination of reasons that can range from financial restrictions to copyright
                  permissions, from the aim of producing a cataloguing resource rather than an
                  imaging resource to the lack of consideration for image-based analysis. Whatever
                  the reason, the result is the same: the image of the text is subsidiary and can
                  only be explored to a minimal extent. Points 2.b, c and d apply to all those cases
                  in which the images are recognised as fundamental interfaces to the text they
                  contain. Provided that the browsing resources are good enough, detailed
                  observations of the material aspects of the image-pages can be carried out (given
                  point 2.b). The editorial effort related to the images themselves is minimal, but
                  the results can be very appealing for image-based research. Points 2.c and d
                  require instead careful planning of imaging pre-processing and post-processing
                  respectively, with no guarantee of the output results. When the operations of
                  image processing and image mark-up are successful, the developers of the resource
                  add their level of analysis to the graphical objects and make available a layer of
                  interpretations which adds value to the resource by casting, at the same time, the
                  representation of the primary source as such.</p>
               <p>Point 3 represents the balanced combination of the previous categories and implies
                  several complications both in terms of editorial process and fruition tools.
                  Indeed, if so far the analysis has not mentioned the dynamic aspects of a digital
                  resource, the active role of the user/reader as editor/developer is emerging more
                  and more in relation to this type of resources (especially point 3.b).</p>
               <p>To conclude, the objectives of the paper are to analyse the digital resources of
                  historical textual materials under a perspective where:<list type="bulleted">
                     <item> the encoded text, when made visible in all its stratification, is
                        considered itself a visual counterpart of the “normal” text;</item>
                     <item>the representation of the physical materiality of the text – often plural
                        because witnessed in many occurrences, especially in the case of classic and
                        medieval traditions – is evaluated in different grades on the basis of the
                        implications for image-based research.</item>
                  </list></p>
                  </div>
            </body>
         </text>
         <text lang="ita">
            <body>
               <head>Oggetti culturali in risorse digitali: immaginando il testo</head>
               <div>
                  <p>Questo articolo propone una valutazione delle risorse di informatica umanistica
                     sulla base della capacità delle stesse di rappresentare testi. La discussione
                     si basa sull’analisi di vari progetti – allo sviluppo di alcuni dei quali
                     l’autore ha partecipato direttamente – di natura diversa, ma tutti correlati
                     alla rappresentazione di materiale testuale connesso alla sua “controparte”
                     visiva o grafica.</p>
                  <p>E’ ampiamente noto il fatto che gli studiosi di discipline umanistiche usino
                     nel loro processo di ricerca immagini di vario formato in varie combinazioni.
                     In particolare, copie, illustrazioni, sostituti di varia tipologia sono
                     ritenuti utili nell’osservare e interpretare gli artefatti culturali originali,
                     altrimenti non direttamente accessibili e/o legittimamente modificabili. Nel
                     caso in cui si prendano in considerazione testi – intesi nel senso ampio che CLiP
                     considera –
                  di natura storica, la connessione tra il contentuo testuale e
                     l’oggetto fisico è particolaremente esplicita. Ciò vale per discipline come la
                     filologia e la paleografia, così come per l’archeologia e la storia dell’arte.
                     Tuttavia, nel primo caso il testo d’interesse ha generalmente come referente un
                     supporto percepito in forma di immagine bidimensionale. E’ questo un caso
                     estremo di simbiosi tra il testo in qualità di stringa di caratteri a
                     stampa/digitali – già un primo livello di intepretazione e codifica in se
                     stesso – e la materialità esistente come artefatto fisico (codice, rotolo,
                     edizioni a stampa antica etc.) richiamata da una rappresentazione
                     bidimensionale che sia analogica o digitale.</p>
                  <p>Anche se i progetti di informatica umanistica possono variare di molto in
                     metodologie e obiettivi, all’interno delle risorse digitali create per
                     supportare la ricerca accademica è possibile identificare delle categorie
                     rilevanti al tema del presente articolo:<list type="ordered">
                        <item>Risorse digitali che danno priorità ai testi<list type="ordered" rend="lower_case">
                              <item>testi codificati</item>
                              <item>visualizazzione della codifica testuale</item>
                           </list></item>
                        <item>Risorse digitali che danno priorità alle immagini<list type="ordered" rend="lower_case">
                              <item>immagini di testi a bassa risoluzione</item>
                              <item> immagini di testi ad alta risoluzione</item>
                              <item>restuaro virtuale di immagini di testi</item>
                              <item>annotazione di immagini di testi</item>
                           </list></item>
                        <item>Risorse digitali che combinano equamente immagini e testi<list type="ordered" rend="lower_case">
                              <item> giustapposizione di risorse indipendenti (testuali and
                                 grafiche)</item>
                              <item>riferimenti e conessione tra risorse collegate (testuali and
                                 grafiche)</item>
                           </list></item>
                     </list></p>
                  <p>La categorizzazione di sopra non ambisce ad essere né esaustiva, né esclusiva –
                     sotto categorie possono variare di molto tra loro in termini semantici e
                     possono co-occorrere nella stessa risorsa  –; tuttavia essa sembra appropriata per la
                     valutazione che il presente articolo intende delineare. Nonostante il punto 1.a
                     non sia qui rilevante, esso è stato incluso così da contestualizzare il punto 1.b.
                     La visualizzazione della codifica di un testo è solitamente nascosta a
                     vantaggio dell’interfaccia principale di qualsivoglia testo codificato messo a
                     disposizione da una risorsa digitale. Allorquando la codifica è resa evidente,
                     si rende disponibile una visualizzazione dei livelli interpretativi al di là
                     della sequenza testuale. Ciò che è visibile non è, per esempio, la carta
                     corrispondente alla trascrizione di un manoscritto, bensì i componenti che chi
                     fa la codifica o l’editore ritengono parti strutturali del testo. Questa
                     visualizzazione non può essere considerata un corrispondente grafico; si tratta
                     piuttosto di una rappresentazione visuale di alcuni elementi selezionati dei
                     quali l’utente/studioso potrebbe possedere già un’immagine mentale o, meglio
                     ancora, di una nuova e inusuale rappresentazione del testo scaturita dal
                     processo di codifica e aperta ad ulteriore ricerca.</p>
                  <p>Allo stesso modo, il punto 2.a non è rilevante relativamente agli argomenti di
                     questo articolo. Tuttavia, un numero consistente di risorse digitali offre
                     soltanto immagini a bassa risoluzione per una serie di ragioni che variano
                     dalle restrizioni finanziarie ai permessi di copyright, dall’intenzione di
                     produrre una risorsa catalografica piuttosto che prettamente grafica alla
                     mancanza di considerazione dell’analisi basata sulle immagini. Qualsiasi sia la
                     motivazione, il risultato rimane lo stesso: l’immagine del testo risulta essere
                     sussidiaria e si presta di fatto ad una esplorazione minima. I punti 2.b, c e d
                     sono validi per tutti quei casi nei quali alle immagini è riconosciuto il ruolo
                     di interfaccia fondamentale al testo che contengono. Se gli strumenti per la
                     navigazione in rete lo permettono, osservazioni dettagliate degli aspetti
                     materiali possono essere effettuate sulle pagine immagine (premesso il punto
                     2.b). Il lavoro editoriale relativo alle immagini è minimo, ma i risultati
                     possono risultare alquanto appetibili per la ricerca basata sulle immagini. I
                     punti 2.c e d richiedono invece una pianificazione accurata, rispettivamente,
                     del <foreign>pre-processing</foreign> and <foreign>post-processing</foreign> delle immagini, senza garanzia sui
                     risultati finali. Allorquando le operazioni di elaborazione dell’immagine e di
                     codifica della stessa hanno successo, coloro che implementano la risorsa
                     aggiungono il loro livello di analisi agli oggetti grafici e rendono
                     disponibile uno strato intepretativo che attribuisce valore aggiunto alla
                     risorsa, nascondendo allo stesso tempo la rappresentazione della fonte primaria
                     in quanto tale.</p>
                  <p>Il punto 3 rappresenta una combinazione equilibrata delle categorie precedenti
                     e implica delle complessità sia in termini di processo editoriale che di
                     strumenti di fruizione. Infatti, se finora l’analisi non ha fatto menzione
                     degli aspetti dinamici di una risorsa digitale, il ruolo attivo
                     dell’utente/lettore in qualità di editore/“implementatore” emerge proprio in
                     relazione a questo tipo di risorse (in modo specifico per il punto 3.b).</p>
                  <p>In conclusione, gli obiettivi dell’articolo sono quelli di analizzare le
                     risorse digitali di materiale testuale di valore storico in una prospettiva in cui:<list>
                        <item>il testo codificato, se reso visibile in tutta la sua stratificazione,
                           è considerato esso stesso una controparte visuale del testo “normale”;</item>
                        <item> la rappresentazione della materialità fisica del testo – spesso
                           molteplice, poichè testimoniata in diverse occorrenze, specialmente nel caso
                           di tradizioni classiche e medievali – è valutata in gradazioni diverse a
                           seconda delle implicazioni per la ricerca basata sull’immagine.</item>
                     </list></p>
               </div>
            </body>
            
         </text>
      </group>
      <back>
         <div>
            <head lang="eng">References</head>  <head lang="ita">Bibliografia</head>
            <listBibl>
               <bibl><title>Archimedes Project</title>. &lt;<xref url="http://archimedes2.mpiwg-berlin.mpg.de/archimedes_templates/">http://archimedes2.mpiwg-berlin.mpg.de/archimedes_templates/</xref>&gt;
                  (<date>December 2005</date>)</bibl>
               <bibl>
                  <author>Brown, Michael S.</author> and <author>W. Brent Seales</author>.
                  <date>2001</date>. <title level="a">The Digital Atheneum: New Approaches
                     for Preserving, Restoring and Analyzing Damaged Manuscripts</title>.
                  <title level="j">ACM</title>: 437-443.</bibl>
               <bibl><author>Bunke, Horst</author>, and <author>A. Lawrence Spitz</author>,
                  eds. <date>2006</date>. <title level="a">Document Analysis Systems
                     VII</title>.<title level="j"> Lecture Notes in Computer Science</title>
                  3872.</bibl>
               <bibl><author>Burnley, David</author> and <author>Alison Wiggins</author>, eds.
                  <date>2003</date>. <title>The Auchinleck Manuscript</title>.
                  &lt;<xref url="http://www.nls.uk/auchinleck/">http://www.nls.uk/auchinleck/</xref>&gt; (<date>December
                        2005</date>)</bibl>
               <bibl><author>Buzzetti, Dino</author>. Forthcoming. <title level="a">Biblioteche digitali e oggetti digitali complessi: Esaustività e
                  funzionalità nella conservazione</title>. In <title level="m">Atti del
                     Workshop ErpaNET Trusted Repositories for Preserving Cultural
                     Heritage</title> (Roma, Accademia dei Lincei, <date>17-19 November
                        2003</date>).</bibl>
               <bibl><author>Coombs, James</author>, and <author>Allen H. Reaner</author>,
                  <author>Steven J. De Rose</author>. <date>1987</date>. <title level="a">Markup Systems and the Future of Scholarly Text Processing</title>,
                  <title level="j">Communications of the ACM</title> 30: 933-47.</bibl>
               <bibl><title>Codices Electronici Ecclesiae Coloniensis (CEEC)</title>.
                  &lt;<xref url="http://www.ceec.uni-koeln.de/">http://www.ceec.uni-koeln.de/</xref>&gt;</bibl>
               <bibl><author>Dekhtyar, Alex</author>, and <author>Ionut E. Iacob</author>,
                  <author>Jerzy W. Jaromczyk</author>, et al.
                  <date>2006</date>. <title level="a">Multihierarchical XML Markup of
                     Image-based Electronic Editions</title>. <title level="j">International
                        Journal on Digital Libraries (IJDL)</title> 6.1: 55-69. &lt;<xref url="http://dblab.csr.uky.edu/~eiaco0/publications/JDL2004.pdf">http://dblab.csr.uky.edu/~eiaco0/publications/JDL2004.pdf</xref>&gt;
                  (<date>April 2006</date>)</bibl>
               <bibl><author>Duggan, Hoyt N.</author> gen. ed. <title>The Piers Plowman
                  Electronic Archive</title>. &lt;<xref url="http://jefferson.village.virginia.edu/seenet/piers/">http://jefferson.village.virginia.edu/seenet/piers/</xref>&gt;
                  (<date>December 2005</date>)</bibl>
               <bibl><author>Guyotjeannin, Olivier</author>, and <author>Gautier
                  Poupeau</author>. <title>Le Cartulaire blanc de Saint-Denis</title>.
                  &lt;<xref url="http://elec.enc.sorbonne.fr/cartulaireblanc/">http://elec.enc.sorbonne.fr/cartulaireblanc/</xref>&gt;
                  (<date>December 2005</date>)</bibl>
               <bibl>Harvard Law School Library. <date>2003</date>. <title>Bracton Online:
                  Bracton: De Legibus Et Consuetudinibus Angliæ</title>. &lt;<xref url="http://hlsl.law.harvard.edu/bracton/">http://hlsl.law.harvard.edu/bracton/</xref>&gt; (<date>December
                        2005</date>)</bibl>
               <bibl><title>Henry III Fine Rolls Project</title>. <date>2005-2008</date>.
                  &lt;<xref url="http://hlsl.law.harvard.edu/bracton/">http://www.frh3.org.uk/</xref>&gt; (<date>April 2006</date>)</bibl>
               <bibl> Institute for New Testament Textual Research of University of Münster.
                  <date>2003-2005</date>. <title>Digital Nestle-Aland Prototype</title>.
                  &lt;<xref url="http://nestlealand.uni-muenster.de/">http://nestlealand.uni-muenster.de/</xref>&gt; (<date>December
                        2005</date>)</bibl>
               <bibl><title>Irish Script on Screen</title>. &lt;<xref url="http://www.isos.dias.ie/">http://www.isos.dias.ie/</xref>&gt;
                  (<date>December 2005</date>)</bibl>
               <bibl><author>Kiernan, Kevin</author>, ed. <date>2002-2006</date>.
                  <title>Electronic Boethius</title>. &lt;<xref url="http://beowulf.engl.uky.edu/~kiernan/eBoethius/inlad.htm">http://beowulf.engl.uky.edu/~kiernan/eBoethius/inlad.htm</xref>&gt;
                  (<date>April 2006</date>)</bibl>
               <bibl><author>Kiernan, Kevin</author>, <author>Alex Dekhtyar</author>,
                  <author>Jerzy W. Jaromczyk</author>, et al. <date>2004</date>.
                  <title level="a">Edition Production Technology (EPT) and the ARCHway
                     Project</title>. <title level="j">DigiCULT Newsletter</title>.
                  &lt;<xref url="http://dblab.csr.uky.edu/~eiaco0/publications/DigiCULT04.html">http://dblab.csr.uky.edu/~eiaco0/publications/DigiCULT04.html</xref>&gt;
                  (<date>December 2005</date>)</bibl>
               <bibl>
                  <author>McGann, J. J.</author>
                  <date>2001</date>. <title level="m">Radiant Textuality: Literature after the
                     world wide web</title>. Palgrave: New York.</bibl>
               <bibl><title>Online Chopin Variorum Edition Pilot Project</title>.
                  <date>2003-2004</date>. &lt;<xref url="http://www.ocve.org.uk">http://www.ocve.org.uk</xref>&gt; (<date>December 2005</date>)</bibl>
               <bibl><title> Scholarly Digital Editions</title>. &lt;<xref url="http://www.sd-editions.com/">http://www.sd-editions.com/</xref>&gt; (<date>December 2005</date>)</bibl>
               <bibl><author>Sperberg-McQueen, C. M.</author>
                  <date>1991</date>. <title level="a">Text in the Electronic Age: Textual
                     Study and Text Encoding with Examples From Medieval Text</title>. <title level="j">Literary and Linguistic Computing</title> 6.1: 32-46.</bibl>
            </listBibl>
         </div>
      </back>
   </text>
</TEI.2>

