Překládání ePUB
Thread poster: Milan Condak
Milan Condak
Milan Condak  Identity Verified
Local time: 19:23
English to Czech
Aug 2, 2022

Text se používá v souborech ke čtení šlověkem, čtení přístrojem a k vytištění.
K vytištění nejčastěji používá formát PDF. Tento formát někdy obsahuje pouhé obrázky na kterých je zobrazen text. Pro převod do textu je nutno použít OCR nebo jinou alternativní metodu.
O formátech souborů pro čtení přístrojem nic psát nebudu.
Zaměřím se na soubory ke čtení člověkem.
Některé formáty vyvinuly společnosti, které prodávají e-kn
... See more
Text se používá v souborech ke čtení šlověkem, čtení přístrojem a k vytištění.
K vytištění nejčastěji používá formát PDF. Tento formát někdy obsahuje pouhé obrázky na kterých je zobrazen text. Pro převod do textu je nutno použít OCR nebo jinou alternativní metodu.
O formátech souborů pro čtení přístrojem nic psát nebudu.
Zaměřím se na soubory ke čtení člověkem.
Některé formáty vyvinuly společnosti, které prodávají e-knihy (Amazon, Google aj.) Když byl vyvinut open-source formát ePUB, vložili překladatelé velké naděje do toho, že konečně budou dostávat k překládání TEXT.

Na ProZ.com je první zmínka o ePUB 6. srpna 2004.

Potom následovaly informace o vydávání a překládání elektronických knih.
https://www.feedbooks.com/

Vznikl web lulu.com s uživatelským rozhraním v jazycích: EN, DE, FR, IT, ES, který nabízí poradenství autorům knih, jak prodávat svoje knihy elektronicky. Web obsahuje také prodejnu knih (shop).

Já jsem napsal příspěvek 30. dubna 2014 po tom, co jsem vytvořil dvojjazyčnou knihu.

https://www.proz.com/forum/czech/268535-čtečky_elektronických_knih.html

Použil jsem dva nástroje Ebookmaker a Calibre. Pro prohlížení jsem musel spustit Calibre jako čtečku.

https://farkastranslations.com/bilingual_books.php

Sbírka klasických knih neobsahuje české překlady. Osm let jsem se na literární zdroje, vytváření a čtení e-knih nepodíval. V březnu 2022 jsem se dozvěděl o knihovně, ve které je více než deset miliónů knih a o možnosti stáhnout si pět knih denně zdarma.

Nyní exitují čtečky ePUB jako software pro různé operační systémy počítačů a mobilů, a pluginy do webových prohlížečů. V PC používám software SumatraPDF. Ve Windows mám nastaveno, že ePUB otevře SumatraPDF. V mobilu Samsung (s Androidem) mám aplikaci Lithium. Z velkého počtu bezplatných aplikací jsem si ji vybral, protože nezobrazuje reklamy.

Protože se věnuji vzdělávací činnosti, vytvářím i učební materiály, které obahují text a obrázky. Budu je vytvářet ve formátu ePUB.

Překládání ePUB: ze zazipovaného souboru vložím do CAT nebo do překladače soubory s přeložitelným textem: HTM, HTML, XHTML. Soubory přeložím. Potom vytvořím kopii zdrojového ePUB a do názvu uvedu jazyk textu. Tento cílový ePUB odzipuji a soubory HTM, HTML, XHTML nahradím soubory s přeloženým textem.
Touto metodou jsem již přeložil více než 50 knih a viděl jsem různou vnitřní strukturu souboru ePUB. Někdy jsou soubory vnořené do složek a podsložek.

Milan
Collapse


 
Milan Condak
Milan Condak  Identity Verified
Local time: 19:23
English to Czech
TOPIC STARTER
Poznatky po přeložení 200 knih Aug 10, 2022

Milan Condak wrote:

Překládání ePUB: ze zazipovaného souboru vložím do CAT nebo do překladače soubory s přeložitelným textem: HTM, HTML, XHTML. Soubory přeložím. Potom vytvořím kopii zdrojového ePUB a do názvu uvedu jazyk textu. Tento cílový ePUB odzipuji a soubory HTM, HTML, XHTML nahradím soubory s přeloženým textem.
Touto metodou jsem již přeložil více než 50 knih a viděl jsem různou vnitřní strukturu souboru ePUB. Někdy jsou soubory vnořené do složek a podsložek.



Zatím nepřekládám soubory s navigací a obsahem knihy a formátováním, tj. *.ncx, *.opf, *.css, *.xpgt.

Překládám pouze texty obsažené v souborech *.xhtml, *.html, htm. Některé knihy mají takových souborů 5 a některé i několik set. Pět až sedm souborů jsou větší oddíly nebo díly. Soubory nejčastěji obsahují kapitoly a je jich dvacet až čtyřicet. Knihy s velkým počtem souborů obsahují buď stránky nebo odstavce.

Pokud ebook vydává vydavatel, bývá text bez překlepů a rozdělovacích znamének slov na konci řádku. Některé jiné texty obsahují naskenovaný a OCR-kovaný neopravený text s chybnými mezerami mezi slovy. Takový text je vhodné opravit v MS-Wordu se správně nastaveným jazykem kontroly.

Narazil jsem na knihy vytvořené v roce 2011, které měly text v *.xml souborech. Pro překlad jsem k souborům přidal koncovku .html, takže jsem překládal *.xml.html. Starý prohlížeč SumatraPDF zobrazuje ePUB s *.xml a nejnovější ne.
Výhodou nojvějších verzí je okénko pro vyhledávání jak je běžné v textových editorech a prohlížečích souborů PDF.

Překladač eTranslation přidává k názvu přeložených souborů podtržítko a kód jazyka velkými písmeny. Například překlad z angličtiny *.html do češtiny vypadá takto *.html_CS. Překlad *.htm (bez "l") do češtiny vypadá takto *.html_CS. Před nahrazením zdrojových souborů v ePUB je nutno souborům s překladem vrátit původní názvy, včetně původních názvů typu souborů.

Z knih v ePUB (z originálu, z lidského i ze strojového překladu) je možno extrahovat zdrojový prostý text v kodování UTF-8. Po smazání předmluv, doslovů a informaci o vydavatelích, které se liší, je možno z odpovídajících dvou souborů vytvořit bi-text, TMX nebo proprieární překladovou paměť využitelnou v CAT nebo soubory pro trénování strojových překladačů.

Milan


 
Milan Condak
Milan Condak  Identity Verified
Local time: 19:23
English to Czech
TOPIC STARTER
Strojový překlad z francouzštiny Jan 22, 2023

Udělal jsem strojový překlad knihy, viz odkazy níže:

https://www.condak.cz/nove/2023-01/21/en/00.html

https://www.condak.cz/nove/2023-01/21/file/24-La
... See more
Udělal jsem strojový překlad knihy, viz odkazy níže:

https://www.condak.cz/nove/2023-01/21/en/00.html

https://www.condak.cz/nove/2023-01/21/file/24-La Sorciere - Jules Michelet_fr.epub

https://www.condak.cz/nove/2023-01/21/file/24-La Sorciere - Jules Michelet_cs.epub

https://www.condak.cz/nove/2023-01/21/file/24-La Sorciere - Jules Michelet_tr.epub
--
AKTUALIZACE ODKAZŮ NA SOUBORY

https://www.condak.cz/nove/2023-01/21/file/24-La_Sorciere-Jules_Michelet_fr.epub

https://www.condak.cz/nove/2023-01/21/file/24-La_Sorciere-Jules_Michelet_cs.epub

https://www.condak.cz/nove/2023-01/21/file/24-La_Sorciere-Jules_Michelet_tr.epub
--

Abyste viděli EPUB v prohlížeči, musíte v něm mít nainstalovaný plugin.

Milan


[Edited at 2023-01-22 08:58 GMT]

[Edited at 2023-01-22 09:37 GMT]

[Edited at 2023-01-22 09:39 GMT]
Collapse


 
Milan Condak
Milan Condak  Identity Verified
Local time: 19:23
English to Czech
TOPIC STARTER
Strojový překlad z češtiny Jan 29, 2023

Protože je po prezidentských volbách, do jsem kterých se aktivisticky nezapojil, a ve svém archivu jsem našel český EPUB z roku 2021, na který se asi nevztahují autorská práva jako na literární dílo, tak jsem jej použil jako demonstrační materiál. Jde o propagační knihu Andreje Babiše. Kromě jedné stránky a obsahu jsem smazal text a ponechal jsem popisky pod fotografiemi. Tyto popisky jsou přeložené.

Služba eTranslation podporuje 32 jazyků a tak jsem p�
... See more
Protože je po prezidentských volbách, do jsem kterých se aktivisticky nezapojil, a ve svém archivu jsem našel český EPUB z roku 2021, na který se asi nevztahují autorská práva jako na literární dílo, tak jsem jej použil jako demonstrační materiál. Jde o propagační knihu Andreje Babiše. Kromě jedné stránky a obsahu jsem smazal text a ponechal jsem popisky pod fotografiemi. Tyto popisky jsou přeložené.

Služba eTranslation podporuje 32 jazyků a tak jsem přeložitelné soubory přeložil z češtiny do 31 jazyků.

https://www.condak.cz/nove/2023-01/28/cs/00.html

Soubory EPUB je možné stáhnout.

(Dodatečně jsem zjistil, že pokud máte v prohlížeči plugin pro zobrazení EPUB (v mém případě v prohlížeči Chrome), tak EPUB stáhnout nelze. V programu SumatraPDF prohlížení stažených souborů funguje. Pokud snad budu někdy v budoucnosti znovu upravovat EPUB, opravím i soubor, který obsahuje seznam souborů.)

Přeji příjemnou zábavu.

Milan
Collapse


 


There is no moderator assigned specifically to this forum.
To report site rules violations or get help, please contact site staff »


Překládání ePUB






Trados Studio 2022 Freelance
The leading translation software used by over 270,000 translators.

Designed with your feedback in mind, Trados Studio 2022 delivers an unrivalled, powerful desktop and cloud solution, empowering you to work in the most efficient and cost-effective way.

More info »
Anycount & Translation Office 3000
Translation Office 3000

Translation Office 3000 is an advanced accounting tool for freelance translators and small agencies. TO3000 easily and seamlessly integrates with the business life of professional freelance translators.

More info »