﻿<?xml version="1.0"?>
<!DOCTYPE TEI.2 SYSTEM "cch-tei.dtd" >
<TEI.2 id="paper29">
   <teiHeader>
      <fileDesc>
         <titleStmt>
            <title>Sobre unidades de traducción y su reconocimiento automático</title>
            <author><name reg="Fernández Carrelo, Patricia">Patricia Fernández Carrelo</name></author>
         </titleStmt>
         <publicationStmt>
            <publisher>Centre for Computing in the Humanities, King's College London - Marked up to
               be included in the CLiP 2006 Conference Abstracts book.</publisher>
            <address>
               <addrLine>Strand, London WC2R 2LS, England, United Kingdom. Tel:+44 (0) 20 7848 2684</addrLine>
        <addrLine>http://www.kcl.ac.uk/cch/</addrLine>
      </address>
         </publicationStmt>
         <sourceDesc>
            <p>No source: created in electronic format.</p>
         </sourceDesc>
      </fileDesc>
      <profileDesc>
         <langUsage>
            <language id="spa">Spanish</language>
         </langUsage>
         <textClass>
            <classCode>paper</classCode>
            <keywords>
               <list>
                  <item>Lingüística de corpus</item>
                  <item>Corpus linguistics</item>
                  <item>Lexías complejas</item>
                  <item>Complex lexis</item>
                  <item>Traducción</item>
                  <item>Translation</item>
                  <item>Basque</item>
                  <item>Euskara</item><item>Español</item>
                  <item>Spanish</item>
               </list>
            </keywords>
         </textClass>
      </profileDesc>
      <revisionDesc>
         <change>
            <date>2006-06-06</date>
            <respStmt>
               <name>MK</name>
            </respStmt>
            <item>minor changes</item>
         </change>
         <change>
            <date>2006-05-30</date>
            <respStmt>
               <name>MK</name>
            </respStmt>
            <item>changed keywords</item>
         </change>
         <change>
            <date>2006-05-25</date>
            <respStmt>
               <name>MK</name>
            </respStmt>
            <item>minor changes in references</item>
         </change>
         <change>
            <date>2006-05-23</date>
            <respStmt>
               <name>MK</name>
            </respStmt>
            <item>minor change</item>
         </change>
         <change>
            <date>2006-04-27</date>
            <respStmt>
               <name>EL</name>
            </respStmt>
            <item>created XML doc</item>
         </change>
      </revisionDesc>
   </teiHeader>

   <text>
      <front>
         <docTitle>
            <titlePart lang="spa">Sobre unidades de traducción y su reconocimiento
            automático</titlePart>
         </docTitle>
         <docAuthor>
            <name reg="Fernández Carrelo, Patricia">Patricia Fernández Carrelo</name>
            <address>
               <addrLine><xref type="email" url="patty.fil@gmail.com">patty.fil@gmail.com</xref></addrLine><addrLine type="affiliation">Universidad de Deusto</addrLine>
               <addrLine>Bilbao</addrLine>
               <addrLine>Spain</addrLine>
            </address>
         </docAuthor>



      </front>
      <group>
         <text lang="spa">
            <body>
               <head>Sobre unidades de traducción y su reconocimento automático</head>
               <p>El desarrollo alcanzado en las últimas décadas en herramientas y técnicas de
                  procesamiento del lenguaje natural aplicadas al campo de la traducción ha supuesto
                  grandes avances en la realización automática de este complejo ejercicio
                  lingüístico. No obstante, quedan aún espacios en los que la labor del lingüista
                  resulta de vital importancia para la obtención de resultados de calidad,
                  especialmente en la caracterización de las unidades en las que se ha de
                  descomponer el texto dentro del proceso traductológico.</p>
               <p>Tal y como recoge Abaitua (1997), "Toury (1995) sugiere que, en la traducción de
                  un texto, 'lo ideal sería traducir de una tacada el texto completo'. Sin embargo,
                  a no ser de que se trate de un texto muy breve, esto es humanamente inviable y el
                  traductor necesita proceder por partes." Así, mientras el traductor humano pone en
                  juego sus saberes lingüísticos y conocimientos del mundo para llevar a cabo este
                  proceso de segmentación, las herramientas automáticas necesitan de formalizaciones
                  lingüísticas que les permitan discriminar las unidades de traducción de manera
                  objetiva.</p>
               <p>Es indudable, por tanto, el interés de aquellas secuencias de palabras que actúan
                  como un mismo bloque en determinados niveles lingüísticos y que, en el campo de la
                  traducción, han de tratarse como una unidad única. Estas unidades, entendidas como
                  combinaciones lexicalizadas de palabras que establecen dependencias
                  morfosintácticas entre ellas, suponen la unidad base de estudio en el presente
                  proyecto. Partimos del supuesto de que las lexías complejas o unidades poliléxicas
                     (<foreign>multiword units</foreign>), se sitúan en un nivel superior al de las
                  colocaciones, en cuanto a grado de lexicalización se refiere, pero sin llegar a
                  alcanzar la categoría de locuciones, giros idiomáticos o fórmulas, elementos
                  discursivos de mayor complejidad y fijación en la lengua.</p>
               <p>Así, la presente comunicación pretende asomarse a las distintas tipologías
                  existentes para la clasificación de estos elementos morfoléxicos, junto a algunas
                  de las herramientas existentes para su procesamiento automático en el par de
                  lenguas euskara-castellano. Estas dos lenguas, muy lejanas tipológicamente pero
                  cercanas geográficamente, se encuentran aún en proceso de análisis y desarrollo en
                  el ámbito de la traducción automática, y es cada vez mayor la aparición de
                  herramientas orientadas a esta tarea, por lo que la recopilación de estos datos
                  puede resultar de gran interés.</p>
               <p>Para ello, se efectuará un recorrido por la amplia tradición teórica recogida en
                  Abaitua (2001) y obras posteriores, como Hurtado Albir (2001), a la vez que se
                  indagará en los procedimientos automáticos para el reconocimiento de este tipo de
                  unidades de traducción. Puesto que en la base de estos procesos se sitúan los
                  analizadores morfosintácticos, se partirá del estudio de las aportaciones del
                  Grupo IXA para el euskara (fundamentalmente MORFEUS y EUSLEM), así como de otras
                  herramientas disponibles para el castellano: FreeLing y SVMTool, tecnologías del
                  Centro de investigación TALP (Universitat Politècnica de Catalunya y Centre de
                  Llenguatge i Computació, Universitat de Barcelona); CLiC (Universitat de
                  Barcelona); FLAPE y SCOGEME (Universidad de Las Palmas) o DATALEXICA (Empresa
                  Bitext), entre otros. No obstante, no se profundizará en la caracterización de
                  estas herramientas por no tratarse de objeto de estudio de este trabajo.</p>
               <p>Dado que las unidades que analizamos (denominadas en euskera <hi>hitz anitzeko
                     unitate lexikalak</hi> -HAUL-), han sido ya tratadas desde la perspectiva
                  monolingüe, pero no entendidas como unidad de traducción, se atenderá a un enfoque
                  multilingüe en la revisión de las numerosas tipologías existentes para la
                  clasificación de estas locuciones léxicas, basadas en criterios que van desde la
                  composicionalidad semántica hasta la disposición sintáctica de los elementos.</p>
              
            </body>
         </text>
      </group>
      <back>
         <div>
            <head lang="spa">Bibliografía</head>
                  <listBibl>
                     <bibl><author>Abaitua, J.</author>
                        <date>2001</date>. <title>Memorias de traduccion en TMX compartidas por
                           internet. Tradumàtica 0</title>. &lt;<xref url="http://www.fti.uab.es/tradumatica/revista/articles/jabaitua/art.htm">http://www.fti.uab.es/tradumatica/revista/articles/jabaitua/art.htm</xref>&gt;</bibl>
                     <bibl><author>Abaitua, J.</author>
                        <date>1997</date>. <title>Segmentos y unidades de traducción</title>.
                           &lt;<xref url="http://paginaspersonales.deusto.es/abaitua/konzeptu/l2uutts.htm">http://paginaspersonales.deusto.es/abaitua/konzeptu/l2uutts.htm</xref>&gt;
                        (April 2006)</bibl>
                     <bibl><author>Aduriz I.</author>, <author>I. Aldezabal</author>,
                        <author>I. Alegria</author>, et al.                        
                        <date>1996</date>. <title level="a">Del analizador morfológico al
                           etiquetador /lematizador: unidades léxicas complejas y
                        desambiguación</title>. <title level="j">Procesamiento del Lenguaje Natural
                           (SEPLN)</title> 19: 90-100, Sevilla.</bibl>
                     <bibl><author>Ahmad, K.</author> y <author>M. Rogers</author>.
                        <date>2001</date>.<title level="a"> Corpus Linguistics and Terminology
                           Extraction</title>. <author>Wright, S.E.</author> y <author>Budin,
                        G.</author> (comp.) <title level="m">Handbook of Terminology
                        Management</title> 2: 725-760.</bibl>
                     <bibl><author>Alegria I.</author>, <author>O. Ansa</author>, <author>X. Artola</author>, et al.
                        <date>2004</date>. <title level="a">Representation and Treatment of
                           Multiword Expressions in Basque</title>. <title level="m">ACL’04 Workshop
                           on MWEs</title>, Barcelona. &lt;<xref url="http://ixa.si.ehu.es/Ixa/Argitalpenak/Artikuluak/1084865372/publikoak/acl2004.pdf">http://ixa.si.ehu.es/Ixa/Argitalpenak/Artikuluak/1084865372/publikoak/acl2004.pdf</xref>&gt;
                        (April 2006)</bibl>
                     <bibl><author>Alonso Ramos, M.</author>
                        <date>1994-1995</date>. <title level="a">Hacia una definición del concepto
                           de colocación: de J. R. Firth a I. Mel’cuk</title>. <title level="j">Revista de Lexicografía</title> 1: 9-28.</bibl>
                     <bibl><author> Bennett, P.</author>
                        <date>1994</date>. <title level="a">Translation units in human and
                        machine</title>. <title level="j">Babel</title> 40:12-20.</bibl>
                     <bibl><author>Canals, R.</author>, <author>A. Garrido</author>,
                        <author>M. Guardiola</author>, et al.
                        <date>2000</date>. <title level="a">Herramientas para la construcción de
                           sistemas de traducción automática: aplicación al par
                        castellano-catalán</title>. <title level="m">IV Congreso de Lingüística
                           General</title>. &lt;<xref url="http://www.internostrum.com/docum/articad.pdf">http://www.internostrum.com/docum/articad.pdf</xref>&gt; (April
                        2006)</bibl>
                     <bibl><author>Corpas Pastor, G.</author>
                        <date>1996</date>. <title level="m">Manual de fraseología española</title>.
                        Madrid: Gredos.</bibl>
                     <bibl><author>Daille, B.</author>
                        <date>1996</date>. <title level="m">Study and implementation of combined techniques
                           for automatic extraction of terminology</title>. &lt;<xref url="http://acl.ldc.upenn.edu/W/W94/W94-0104.pdf">http://acl.ldc.upenn.edu/W/W94/W94-0104.pdf</xref>&gt; (April 2006)</bibl>
                     <bibl><author>Hurtado Albir, A.</author><date> 2001</date>. <title level="m">Traducción y traductología. Introducción a la traductología</title>.
                        Madrid: Cátedra.</bibl>
                     <bibl><title>ESPEUS</title> (Prototipo de traductor automático español-euskara). Eusko
                        Jaurlaritza-Kultura Saila. &lt;<xref url="http://www.kultura.ejgv.euskadi.net/">http://www.kultura.ejgv.euskadi.net/</xref>&gt; (April 2006)</bibl>
                     <bibl><author>Fillmore, C.</author>, <author>R. Grishman</author>,
                        <author>N. Ide</author>, et al.
                        <date>2002</date>. <title level="a">Towards best practice for multiword
                           expressions in computational lexicons</title>. <title level="m">Procedures of the 3rd International Conference on Language Resources and
                           Evaluation (LREC’02)</title>, Las Palmas. &lt;<xref url="http://www.humaniora.sdu.dk/ifki/ontoquery/readings/lenci/Calzolarietal-02.pdf">http://www.humaniora.sdu.dk/ifki/ontoquery/readings/lenci/Calzolarietal-02.pdf</xref>&gt;
                        (April 2006)</bibl>
                     <bibl><author>Melby, A. K.</author>
                        <date>1995</date>. <title level="m">The possibility of language. A
                           discussion of the nature of language with implications for human and
                           machine translation</title>. John Benjamins.</bibl>
                     <bibl><author>Toury, G.</author>
                        <date>1995</date>. <title level="m">Descriptive Translation Studies and
                           beyond</title>. John Benjamins.</bibl>
                     <bibl><author>Vázquez-Ayora, G.</author>
                        <date>1977</date>. <title level="m">Introducción a la traductología</title>.
                        Georgetown: University Press.</bibl>
                     <bibl><author>Villavicencio, A.</author> et al. <date>2004</date>. <title level="a">Lexical encoding of MWEs</title>. <title level="m">Proceedings of the 2<hi rend="super">nd</hi> ACL Workshop on Multiword Expressions: Integrating Processing (MWE-2004)</title>.
                        Barcelona. &lt;<xref url="http://acl.ldc.upenn.edu/acl2004/mwe/pdf/villavicencio.pdf">http://acl.ldc.upenn.edu/acl2004/mwe/pdf/villavicencio.pdf</xref>&gt;
                        (April 2006)</bibl>
                     <bibl><author>Vinay, J.P.</author> y <author>J. Darbelnet</author>.
                        <date>1958</date>. <title level="m">Stylistique comparée du français et
                           l'anglais</title>. Paris: Didier.</bibl>
                  </listBibl>
               </div>
           </back>
   </text>
</TEI.2>

