Come convertire un .pdf (fatto di immagini) in testo da tradurre? Thread poster: traduzionigs
| traduzionigs Italy Local time: 03:29 English to Italian + ...
Salve a tutti.. spero mi aiuterete perchè sono nel panico più totale. Ho un documento in pdf evidentemente "scansito"(da scanner). Infatti non riesco a selezionare il testo e quindi non riesco a "sostituire" i termini tradotti visto che si tratta di un certificato con il suo layout particolare e con gli spazi giusti. Non posso tradurre solo il testo e non restituire il documento come mi è stato dato, eppure non trovo un modo per convertire il testo dall'inglese in italiano senza m... See more Salve a tutti.. spero mi aiuterete perchè sono nel panico più totale. Ho un documento in pdf evidentemente "scansito"(da scanner). Infatti non riesco a selezionare il testo e quindi non riesco a "sostituire" i termini tradotti visto che si tratta di un certificato con il suo layout particolare e con gli spazi giusti. Non posso tradurre solo il testo e non restituire il documento come mi è stato dato, eppure non trovo un modo per convertire il testo dall'inglese in italiano senza modificare nulla. Se fosse stato un documento originale, non c'era problema, ci sono tanti programmi per farlo, ma essendo immagini, non so come muovermi. Ho chiesto alla mia committente, per ora non so come muovermi. Mandarle testo così, non ha senso. E' un documento con firme, spazi, quadrati con opzioni.. insomma, non so come rendere il tutto in un nuovo documento tradotto. Potete aiutrmi? traduzionigs ▲ Collapse | | | |
Forse sono io che mi perdo qualcosa, ma dalla tua descrizione direi che si tratta proprio di un pdf Cioè un formato che di per sè era nato per non essere modificabile! Comunque esistono vari programmi che ti permettono di metterci le mani, ad esempio OpenOffice.org (gratuito) e Foxit. Ciao Manuela | | |
[Edited at 2010-03-19 21:25 GMT] | |
|
|
traduzionigs Italy Local time: 03:29 English to Italian + ... TOPIC STARTER
@Riccardo.. certo che ho sentito parlare di OCR, ma non mi mantiene lo stesso layout. @Manuela grazie mille.. Per ora sto traducendo su word, poi domani vedrò come risolvere. Avevo già letto posts riguardo a questo, il mio problema non è perchè è un pdf, ma perchè non mi riconosce che ci sia del testo, bensì delle immagini. | | | Due tipi di PDF / conversione in openoffice | Mar 20, 2010 |
Salve, Da quanto ho letto sembra certo che quel documento che hai è un'immagine scandita che poi è stata avvolta in formato pdf. In un certo senso è un vero documento pdf, in quanto prevede proprio questo, ma significa che il testo non c'è in forma elettronica. Insomma è una fotocopia in formato digitale. Purtroppo l'unico modo di tradurrlo è di crearlo di nuovo da un testo che batti, che devi poi mettere in bella copia con i caratteri giusti, ecc. uffa... Pro... See more Salve, Da quanto ho letto sembra certo che quel documento che hai è un'immagine scandita che poi è stata avvolta in formato pdf. In un certo senso è un vero documento pdf, in quanto prevede proprio questo, ma significa che il testo non c'è in forma elettronica. Insomma è una fotocopia in formato digitale. Purtroppo l'unico modo di tradurrlo è di crearlo di nuovo da un testo che batti, che devi poi mettere in bella copia con i caratteri giusti, ecc. uffa... Proprio questa settimana ho dovuto riformattare un intero libro italiano di circa 200 pagine dal pdf originale in formato openoffice, per poter poi importarlo in wordfast. Ecco come l'ho fatto. La prima cosa da notare è che un pdf che porta il testo stesso ha già perso gli indicatori che segnalano i paragrafi, le note in piè di pagina, l'intestazione, ecc. Sì, si può aprire in openoffice con un plugin della Sun, ma solo in formato draw. Se si copia il testo intero e si inserisce in un documento openoffice, o se si salva un file del testo dal pdf, è un testo lineare senza formato. Ogni riga diventa un paragrafo perché c'è un return alla fine. Per di più, ho trovato che il codice del testo originale (utf8, latin1, ecc.) può far impazzire se i documenti non sono dello stesso codice. Ecco come me la sono cavata. Ho copiato il testo intero e l'ho inserito prima in textedit (un software macintosh), poi l'ho copiato da textedit in openoffice. No so perché ma m'ha risolto il problema del codice. boh... A questo punto avevo un testo lineare che scorreva riga per riga. Sempre con l'originale come riferimento, ho dovuto ricreare i paragrafi originali togliendo i return da tutte le rige interne dei paragrafi, tranne l'ultima. Per fortuna ho trovato un plugin che m'ha aiutato moltissimo durante questa fase. A questo punto avevo ricreato i paragrafi originali, ma le note a piè di pagina erana sparse qua e la nel testo. Questo libro ha delle note lunghissime che saltano da una pagina all'altra, che significa che il testo si trovava in due pezzi. Per questa fase ho dovuto rimettere insieme la nota intera, tagliarla, poi inserirla come una vera e propria nota a piè di pagina. Poi ho verificato il mio testo con quello originale, non leggendo ogni parola, ma controllando invece le prime e le ultima parole d'ogni paragrafo ed ogni nota a piè di pagina. A questo punto credo d'avere un testo affidabile che posso tradurre con wordfast. Ci ho messo circa undici ore per fare questa conversione. Spero che queste mie esperienze siano utili a qualcuno. ▲ Collapse | | | Funzione OCR in Acrobat | Mar 20, 2010 |
traduzionigs wrote: il mio problema non è perchè è un pdf, ma perchè non mi riconosce che ci sia del testo, bensì delle immagini. Acrobat (non Reader), ha una funzione OCR (almeno dalla versione 7), per cui converte il testo bitmap in testo-testo mantenendo tutte le altre caratteristiche della pagina. Dal menu Documento > Riconosci testo mediante OCR > Avvia. ciao, Roberta | | | PDFCreator, un opensource... | Mar 20, 2010 |
application for Windows, ti permette, tra l'altro, di salvare il pdf esistente nel formato di immagine: tif, jpg, ecc. Io lo uso da anni. Siccome utilizzo un altro software per la conversione ottica che non è abilitato direttamente per il formato pdf, devo fare questo passo attraverso PDFCreator. Vale a dire, dovresti, dopo il salvataggio con PDFCreator, avere un'altra applicazione per una vera conversione ottica (OCR), dai suddetti formati immagine, se non proprio un software sofisticato... See more application for Windows, ti permette, tra l'altro, di salvare il pdf esistente nel formato di immagine: tif, jpg, ecc. Io lo uso da anni. Siccome utilizzo un altro software per la conversione ottica che non è abilitato direttamente per il formato pdf, devo fare questo passo attraverso PDFCreator. Vale a dire, dovresti, dopo il salvataggio con PDFCreator, avere un'altra applicazione per una vera conversione ottica (OCR), dai suddetti formati immagine, se non proprio un software sofisticato, tipo Abbyy FineReader. Invece, come alternative: -Per OCR dalle immagini, loro conversione ottica, se possiedi MS Office per Windows, dovrebbe esserci dentro un OCR modesto, ma spesso sufficiente. -Se il file pdf sia un vero pdf, e non soltanto un'immagine di un foglio scannerizzato e salvato come pdf, potresti usare PlusTools del Wordfast. Dragomir traduzionigs wrote: Salve a tutti.. spero mi aiuterete perchè sono nel panico più totale. Ho un documento in pdf evidentemente "scansito"(da scanner). Infatti non riesco a selezionare il testo e quindi non riesco a "sostituire" i termini tradotti visto che si tratta di un certificato con il suo layout particolare e con gli spazi giusti. Non posso tradurre solo il testo e non restituire il documento come mi è stato dato, eppure non trovo un modo per convertire il testo dall'inglese in italiano senza modificare nulla. Se fosse stato un documento originale, non c'era problema, ci sono tanti programmi per farlo, ma essendo immagini, non so come muovermi. Ho chiesto alla mia committente, per ora non so come muovermi. Mandarle testo così, non ha senso. E' un documento con firme, spazi, quadrati con opzioni.. insomma, non so come rendere il tutto in un nuovo documento tradotto. Potete aiutrmi? traduzionigs ▲ Collapse | | | To report site rules violations or get help, contact a site moderator: You can also contact site staff by submitting a support request » Come convertire un .pdf (fatto di immagini) in testo da tradurre? CafeTran Espresso | You've never met a CAT tool this clever!
Translate faster & easier, using a sophisticated CAT tool built by a translator / developer.
Accept jobs from clients who use Trados, MemoQ, Wordfast & major CAT tools.
Download and start using CafeTran Espresso -- for free
Buy now! » |
| Trados Studio 2022 Freelance | The leading translation software used by over 270,000 translators.
Designed with your feedback in mind, Trados Studio 2022 delivers an unrivalled, powerful desktop
and cloud solution, empowering you to work in the most efficient and cost-effective way.
More info » |
|
| | | | X Sign in to your ProZ.com account... | | | | | |