vai alla sezione precedente

Il frontespizio elettronico

Vai alla sezione successiva

Il frontespizio elettronico dei testi contenuti nel Corpus Parallelo Rushdie è conforme alle normative TEI (TEI header). Si compone di tre sezioni principali: una descrizione bibliografica del testo digitale (file description), una descrizione della codifica effettuata (encoding description) e una descrizione non bibliografica del testo (profile description). La quarta sezione principale che solitamente va a formare un TEI header, e che consiste nella documentazione delle revisioni effettuate (revision description), non è per il momento rilevante e non è stata quindi inclusa. Da ciascun frontespizio elettronico si possono quindi desumere (gli esempi sono tratti dal frontespizio elettronico de I figli della mezzanotte, riportato integralmente di seguito): il titolo (edizione elettronica de I figli della mezzanotte), l'autore (Salman Rushdie), il traduttore (Ettore Capriolo) se presente, l'autore dell'edizione elettronica (Federico Zanettin), l'estensione del testo (224.339 parole), la data di creazione (il 15 febbraio 1999) e l'istituzione di riferimento (Università di Bologna). Seguono indicazioni bibliografiche sul testo a stampa da cui è stata tratta l'edizione elettronica. Nella sezione successiva (encoding description) viene data una breve descrizione del progetto a cui il testo elettronico si riferisce ("parte di un progetto di corpora paralleli allineati dei romanzi di Rushdie e delle loro traduzioni italiane") e vengono indicati sinteticamente i criteri seguiti nella codifica del corpo del testo. Nella terza sezione principale (profile description) viene semplicemente indicata la lingua in cui è scritto il testo (nel caso de I figli della mezzanotte l'italiano).

Nel frontespizio sono inoltre codificate delle caratteristiche del testo in relazione al proprio status di traduzione, codifiche non presenti nei testi in lingua inglese. Si tratta di informazioni relative al traduttore, al processo traduttivo e al testo di partenza, che si è ritenuto opportuno inserire in previsione di future rielaborazioni e riutilizzi del corpus. Nell'elaborare una formulazione sintetica di queste caratteristiche, riconducibile ad un formato omogeneo si è preso spunto dal frontespizio elettronico utilizzato nella componente TEC dell'ECC, inteso a fornire una modalilità strutturata per inserire informazioni utili a chi utilizza corpora di testi tradotti (Laviosa 1997). Il TEC header utilizza la strutturazione gerarchica dettata dal linguaggio SGML, ma non è conforme alle linee guida TEI.[1] Si è quindi optato per una soluzione di compromesso, inserendo in modo strutturato ma provvisorio negli header TEI del Corpus Parallelo Rushdie gli elementi di codifica indicati nello header TEC (ad esclusione degli elementi attinenti alla descrizione bibliografica del testo sorgente perché già contenuti nello header TEI). Gli elementi di interesse traduttivo sono inseriti nella sezione file description del frontespizio come semplice testo, in un formato che riproduce la strutturazione dello header TEC. Trattandosi di caratteristiche per la maggior parte non derivabili dal paratesto del volume stampato e che identificano possibili categorie sulle quali basare la selezione di testi in un corpus di traduzioni, esse dovrebbero essere codificate, analogamente a quanto avviene ad esempio nella classificazione dei testi nel BNC, nella sezione profile description dello header. Si tratta tuttavia di un possibile sviluppo che va oltre l'ambito immediato del progetto, per cui ci si è limitati a una soluzione provvisoria ma funzionale in attesa che si delineino più chiaramente degli standard specifici alla codifica di testi tradotti.

 

Il frontespizio elettronico de I figli della mezzanotte

 

<TEIHEADER>

<FILEDESC>

<TITLESTMT>

<TITLE>I figli della mezzanotte: electronic edition</TITLE>

<AUTHOR>Salman Rushdie</AUTHOR>

<RESPSTMT><RESP>Translated by</RESP><NAME>Ettore Capriolo</NAME></RESPSTMT>

<RESPSTMT><RESP>compiled by</RESP><NAME>Federico Zanettin</NAME>

</RESPSTMT>

</TITLESTMT>

<EXTENT>224.339 words</EXTENT>

<PUBLICATIONSTMT>

<DATE>15 Febraury 1999</DATE>

<AUTHORITY>Universit&agrave; di Bologna</AUTHORITY>

</PUBLICATIONSTMT>

<SOURCEDESC>

<BIBL>

<AUTHOR>Salman Rushdie</AUTHOR>

<TITLE>I figli della mezzanotte</TITLE>

<PUBLISHER>Garzanti</PUBLISHER>

<PUBPLACE>Milano</PUBPLACE>

<DATE>1984</DATE>

<RESPSTMT><RESP>Translated by</RESP><NAME>Ettore Capriolo</NAME></RESPSTMT>

</BIBL>

<P>TranslatorGender=male</P>

<P>TranslatorSexualOrientation=unknown</P>

<P>TranslatorNationality=Italian</P>

<P>TranslatorEmployment=unknown</P>

<P>TranslatorStatus=FullTime</P>

<P>TranslationMode=written</P>

<P>TranslationCopyright=Garzanti Editore s.p.a. 1984, 1987, 1998</P>

<P>TranslationSponsor=unknown</P>

<P>TranslationReviews=no</P>

<P>TranslationComments=no</P>

<P>TranslationProcessDirection=intoMotherTongue</P>

<P>TranslationProcessMode=human</P>

<P>TranslationProcessType=full</P>

<P>SourceTextAuthorGender=male</P>

<P>SourceTextAuthorSexualOrientation=unknown</P>

<P>SourceTextLanguage=English</P>

<P>SourceTextMode=written</P>

<P>SourceTextStatus=original </P>

<P>SourceTextTitle=Midnight's Children</P>

<P>SourceTextPublisher=JonathanCape</P>

<P>SourceTextDate=1980</P>

<P>SourceTextComments=none</P>

</SOURCEDESC>

</FILEDESC>

<ENCODINGDESC><PROJECTDESC><P>Part of parallel aligned corpus of Rushdie's novels with their Italian translations</P></PROJECTDESC>

<EDITORIALDECL><P>Text scanned with Caere Ominpage 8.0 software</P>

<P>All hyphens were maintaned. </P>

<P>All entities converted using a Microsoft Word 8.0 macro</P>

<P>Page numbers retained</P>

<P>Text in italics not retained</P>

<P>Inserted in the body tags for paragraph and sentence</P>

<P>Errors in transcription controlled with Microsoft Word 8.0 spellchecker</P>

<P>All << and >> for introducing direct speech converted to " and " </P>

<P>Notes and explicit signals of translator's overt intervention encoded as notes</P>

</EDITORIALDECL>

</ENCODINGDESC>

<PROFILEDESC><LANGUSAGE><LANGUAGE>Italian</LANGUAGE></LANGUSAGE></PROFILEDESC>

</TEIHEADER>

 

Il file risultato dell'unione di frontespizio e testo è stato salvato in formato ASCII e successivamente importato nel programma Author/Editor per essere sottoposto a controllo e validato.[2] 

 



[1] Mona Baker, coordinatrice del progetto EEC, afferma d'altra parte che la codifica del corpus TEC in accordo agli  standard TEI non rientra tra gli obiettivi a breve termine del progetto (comunicazione personale).

[2] Dal punto di vista tecnico la fase di codifica non ha richiesto tempi eccessivamente prolungati: per l'inserimento della codifica, il controllo e la validazione delle versioni elettroniche dei testi sono state necessarie circa 30 ore di lavoro, venti delle quali dedicate all'approntamento del sistema (scrittura delle macro, predisposizione dei modelli di frontespizio).