Come convertire un .pdf (fatto di immagini) in testo da tradurre? (Italian)

Non-English forums » Italian »
Come convertire un .pdf (fatto di immagini) in testo da tradurre?
Track this topic

Come convertire un .pdf (fatto di immagini) in testo da tradurre?

Thread poster: traduzionigs

traduzionigs
Italy
Local time: 03:29
English to Italian
+ ...

Mar 19, 2010

Salve a tutti..
spero mi aiuterete perchè sono nel panico più totale.
Ho un documento in pdf evidentemente "scansito"(da scanner). Infatti non riesco a selezionare il testo e quindi non riesco a "sostituire" i termini tradotti visto che si tratta di un certificato con il suo layout particolare e con gli spazi giusti. Non posso tradurre solo il testo e non restituire il documento come mi è stato dato, eppure non trovo un modo per convertire il testo dall'inglese in italiano senza modificare nulla.
Se fosse stato un documento originale, non c'era problema, ci sono tanti programmi per farlo, ma essendo immagini, non so come muovermi.
Ho chiesto alla mia committente, per ora non so come muovermi.
Mandarle testo così, non ha senso. E' un documento con firme, spazi, quadrati con opzioni.. insomma, non so come rendere il tutto in un nuovo documento tradotto.
Potete aiutrmi?
traduzionigs ▲ Collapse

Marcello Cosa
Italy
Local time: 03:29
Italian to Spanish
+ ...

facebook

Mar 19, 2010

Onestamente non conosco il programma, però, qualche giorno fa sul gruppo di "Liberi Professionisti Traduttori" (http://www.facebook.com/LPTraduttori?v=wall&ref=mf#!/group.php?gid=326858399253&ref=mf) è stato postato questo link in cui trovi il software, gratuito, e una piccola guida:
http://www.web-experiments.org/2010/03/17/come-estrarre-il-testo-da-un-documento-pdf-scansionato/

Ciao,
NicaTraduzioni ▲ Collapse

Manuela Dal Castello

Italy
Local time: 03:29
English to Italian
+ ...

è un pdf...

Mar 19, 2010

Forse sono io che mi perdo qualcosa, ma dalla tua descrizione direi che si tratta proprio di un pdf

Cioè un formato che di per sè era nato per non essere modificabile!
Comunque esistono vari programmi che ti permettono di metterci le mani, ad esempio OpenOffice.org (gratuito) e Foxit.

Ciao
Manuela

Riccardo Schiaffino

United States
Local time: 19:29
Member (2003)
English to Italian
+ ...

Mar 19, 2010

[Edited at 2010-03-19 21:25 GMT]

traduzionigs
Italy
Local time: 03:29
English to Italian
+ ...

TOPIC STARTER

Grazie ma..

Mar 19, 2010

@Riccardo.. certo che ho sentito parlare di OCR, ma non mi mantiene lo stesso layout.

@Manuela grazie mille.. Per ora sto traducendo su word, poi domani vedrò come risolvere.
Avevo già letto posts riguardo a questo, il mio problema non è perchè è un pdf, ma perchè non mi riconosce che ci sia del testo, bensì delle immagini.

Michael Brennen
Local time: 20:29
Italian to English

Due tipi di PDF / conversione in openoffice

Mar 20, 2010

Salve,

Da quanto ho letto sembra certo che quel documento che hai è un'immagine scandita che poi è stata avvolta in formato pdf. In un certo senso è un vero documento pdf, in quanto prevede proprio questo, ma significa che il testo non c'è in forma elettronica. Insomma è una fotocopia in formato digitale. Purtroppo l'unico modo di tradurrlo è di crearlo di nuovo da un testo che batti, che devi poi mettere in bella copia con i caratteri giusti, ecc. uffa...

Proprio questa settimana ho dovuto riformattare un intero libro italiano di circa 200 pagine dal pdf originale in formato openoffice, per poter poi importarlo in wordfast. Ecco come l'ho fatto.

La prima cosa da notare è che un pdf che porta il testo stesso ha già perso gli indicatori che segnalano i paragrafi, le note in piè di pagina, l'intestazione, ecc. Sì, si può aprire in openoffice con un plugin della Sun, ma solo in formato draw.

Se si copia il testo intero e si inserisce in un documento openoffice, o se si salva un file del testo dal pdf, è un testo lineare senza formato. Ogni riga diventa un paragrafo perché c'è un return alla fine. Per di più, ho trovato che il codice del testo originale (utf8, latin1, ecc.) può far impazzire se i documenti non sono dello stesso codice.

Ecco come me la sono cavata. Ho copiato il testo intero e l'ho inserito prima in textedit (un software macintosh), poi l'ho copiato da textedit in openoffice. No so perché ma m'ha risolto il problema del codice. boh...

A questo punto avevo un testo lineare che scorreva riga per riga. Sempre con l'originale come riferimento, ho dovuto ricreare i paragrafi originali togliendo i return da tutte le rige interne dei paragrafi, tranne l'ultima. Per fortuna ho trovato un plugin che m'ha aiutato moltissimo durante questa fase.

A questo punto avevo ricreato i paragrafi originali, ma le note a piè di pagina erana sparse qua e la nel testo. Questo libro ha delle note lunghissime che saltano da una pagina all'altra, che significa che il testo si trovava in due pezzi. Per questa fase ho dovuto rimettere insieme la nota intera, tagliarla, poi inserirla come una vera e propria nota a piè di pagina.

Poi ho verificato il mio testo con quello originale, non leggendo ogni parola, ma controllando invece le prime e le ultima parole d'ogni paragrafo ed ogni nota a piè di pagina. A questo punto credo d'avere un testo affidabile che posso tradurre con wordfast. Ci ho messo circa undici ore per fare questa conversione.

Spero che queste mie esperienze siano utili a qualcuno. ▲ Collapse

Roberta Anderson

Italy
Local time: 03:29
Member (2001)
English to Italian
+ ...

Funzione OCR in Acrobat

Mar 20, 2010

traduzionigs wrote:

il mio problema non è perchè è un pdf, ma perchè non mi riconosce che ci sia del testo, bensì delle immagini.

Acrobat (non Reader), ha una funzione OCR (almeno dalla versione 7), per cui converte il testo bitmap in testo-testo mantenendo tutte le altre caratteristiche della pagina.
Dal menu Documento > Riconosci testo mediante OCR > Avvia.

ciao,
Roberta

Dragomir Kovacevic

Italy
Local time: 03:29
Italian to Serbian
+ ...

PDFCreator, un opensource...

Mar 20, 2010

application for Windows, ti permette, tra l'altro, di salvare il pdf esistente nel formato di immagine: tif, jpg, ecc. Io lo uso da anni. Siccome utilizzo un altro software per la conversione ottica che non è abilitato direttamente per il formato pdf, devo fare questo passo attraverso PDFCreator.
Vale a dire, dovresti, dopo il salvataggio con PDFCreator, avere un'altra applicazione per una vera conversione ottica (OCR), dai suddetti formati immagine, se non proprio un software sofisticato, tipo Abbyy FineReader.

Invece, come alternative:
-Per OCR dalle immagini, loro conversione ottica, se possiedi MS Office per Windows, dovrebbe esserci dentro un OCR modesto, ma spesso sufficiente.
-Se il file pdf sia un vero pdf, e non soltanto un'immagine di un foglio scannerizzato e salvato come pdf, potresti usare PlusTools del Wordfast.

Dragomir

traduzionigs wrote:

Salve a tutti..
spero mi aiuterete perchè sono nel panico più totale.
Ho un documento in pdf evidentemente "scansito"(da scanner). Infatti non riesco a selezionare il testo e quindi non riesco a "sostituire" i termini tradotti visto che si tratta di un certificato con il suo layout particolare e con gli spazi giusti. Non posso tradurre solo il testo e non restituire il documento come mi è stato dato, eppure non trovo un modo per convertire il testo dall'inglese in italiano senza modificare nulla.
Se fosse stato un documento originale, non c'era problema, ci sono tanti programmi per farlo, ma essendo immagini, non so come muovermi.
Ho chiesto alla mia committente, per ora non so come muovermi.
Mandarle testo così, non ha senso. E' un documento con firme, spazi, quadrati con opzioni.. insomma, non so come rendere il tutto in un nuovo documento tradotto.
Potete aiutrmi?
traduzionigs

▲ Collapse

Login to reply/comment

To report site rules violations or get help, contact a site moderator:

Moderator(s) of this forum
Eren Kutlu Carnì	[Call to this topic]
Simone Catania	[Call to this topic]

You can also contact site staff by submitting a support request »

Come convertire un .pdf (fatto di immagini) in testo da tradurre?

Forum rules

Help and orientation

CafeTran Espresso
You've never met a CAT tool this clever! Translate faster & easier, using a sophisticated CAT tool built by a translator / developer. Accept jobs from clients who use Trados, MemoQ, Wordfast & major CAT tools. Download and start using CafeTran Espresso -- for free Buy now! »

Trados Studio 2022 Freelance
The leading translation software used by over 270,000 translators. Designed with your feedback in mind, Trados Studio 2022 delivers an unrivalled, powerful desktop and cloud solution, empowering you to work in the most efficient and cost-effective way. More info »

Recent posts | FAQ | Rules | Moderators | Article knowledgebase

Your current localization setting

English

Select a language

More languages...

Come convertire un .pdf (fatto di immagini) in testo da tradurre?

Come convertire un .pdf (fatto di immagini) in testo da tradurre?

You have native languages that can be verified

Your current localization setting

Select a language