La scelta di creare un'edizione elettronica del CPR codificata secondo i criteri generali definiti dalla Text Encoding Initiative e le scelte riguardanti la "profondità" e il tipo di codifica effettuata sono dipese da considerazioni sia teoriche che pratiche. Dal punto di vista teorico vi è innanzitutto una generica adesione ai criteri utilizzati da chi fa uso di testi elettronici, tenendo presenti in primo luogo requisiti quali l'universalità e la portabilità, intesi come la possibilità di trasferire e interpretare il testo elettronico sulla più ampia quantità di sistemi informatici, dotandoli di un formato omogeneo che li renda manipolabili in funzione di scopi anche diversi da quello per cui sono stati originariamente creati. I criteri suggeriti dalla TEI (Guidelines for Electronic Text Encoding and Interchange, Sperberg-McQueen e Burnard 1994) sono utili sia in quanto forniscono una strutturazione generale del testo digitale in grado di essere ulteriormente elaborata (aggiungendo o sottraendo annotazioni) sia in quanto propongono un modello facilmente replicabile per la codifica delle informazioni che si volevano inserire relativamente al progetto in corso. Le versioni elettroniche delle opere narrative di Rushdie sono state utilizzate come due componenti distinte e rapportate a corpora di riferimento monolingui e costituiscono un primo prodotto all'interno del progetto più generale che comprende anche il corpus allineato.
L'operazione di codifica e quella di allineamento hanno rappresentato un modo per effettuare una prima analisi di originali e traduzioni. "Tradurre" in formato elettronico dei testi cartacei significa infatti in primo luogo fornire una particolare interpretazione di quei testi, e in questo senso codifica e allineamento rappresentano di per se stessi una prima metodologia di analisi.