Igényes e-könyv készítése

Egyre több és több embert látok aki nekiáll e-könyvet gyártani. Vagy lelkesedésből, vagy mert amit olvasni szeretne még nem létezik ilyen formátumban, vagy egyszerűen a közösségért de napról napra nő az elektronikus kötetek száma.
Tetszik, hogy visszatérünk a “nyomtatott” szórakozáshoz a válogatott, intelligens, mélyértelmű tévéadások helyett és most ehhez írnék pár sort, hogy hogyan lehet igényes e-könyvet csinálni (sajnos sokan esnek abba a hibába, hogy a PDF-et beimportálják Calibre-be majd egyszerűen átkonvertálják egy másik formátumra és mint akik jól végezték dolgukat, hátradőlnek. Így aztán se tördelés, se normális oldaltörés, nincsen tartalomjegyzék és esetleg teljesen élvezhetetlen szöveget kapunk).
Először is kell egy OCR program, az Abbey Finereader vagy az Adobe Acrobat X Pro 30 napos próbaverziója tökéletesen megfelel, ezzel szépen átkonvertáljuk a PDF-eket DOC-ra (fontos megjegyezni, hogy szakmai kiadványokat/leírásokat nagyon időigényes elkészíteni mert az összes képet, ábrát, táblázatot egyenként pozicionálni kell, szükség esetén pedig szerkeszteni).
Word-ben nyissuk meg a kapott szöveget és jeleníttessük meg a formázási karaktereket (¶ jel a menüben). A konvertáláskor sajnos a program minden oldalvéget szakasztörésnek vesz és ennek megfelelően a DOC fájl tele lesz Column Break-ekkel. Ezeket nagyon egyszerű törölni: nyomj CTRL+H-t (Replace, avagy Csere), a felső sorba írd be, hogy ^b, alulra pedig egy ^p-t (a kis felfele mutató nyilakkal együtt!) majd cseréljük le az összes egyezést, ezzel sortörésre cserélve a szakasztöréseket; majd felülre ^n, alulra pedig ^p, így az oszloptöréseket is töröljük.
A következő probléma az elválasztások. Nos, ezekre nincs semmilyen nagy titok, nem lehet mindet egyszerre cserélni, maximum kicsit segíteni tudok: CTRL+H, felülre írd be, hogy “^p-“, alulra pedig semmit. A “Következő keresése” gombbal nézzük át a teljes szöveget, mert magyarban léteznek olyan szavak amik közé kötőjelet teszünk és sajnos néha ezek külön sorba kerülnek, így nem kell őket összevonni, viszont egymás mellé kell őket húzni (pl az ipi-pici, ide-oda, stb). Ha tényleg elválasztás van akkor nyomjunk a Csere gombra, ezzel eltűnik a sortörés és a kötőjel, a szó pedig egybe lesz írva. Biztos ami biztos fussuk át ismét a szöveget és nézzük meg, hogy nem hoztunk e létre helytelen szavakat, például ha a “tüsszentés” szó el volt választva lehet, hogy az összevonás után olyat kapunk, hogy “tüszszentés” ami elég ostobán néz ki.
Jöjjenek a felesleges sortörések! Először is az első oldalon található bevezetőt vágjuk ki külön doksiba, hogy ezekhez ne nyúljon a csere (cím, ISBN-szám, ki fordította, mikor, kiadó, stb). Egy egyszerű trükkhöz kell folyamodni, hogy gyorsabban végezzünk: kerestessük meg az írásjelek utáni sortöréseket, ezeket írjuk át valami másra majd az összes többi (mondhatni felesleges) sortörést cseréljük le szóközre. CTRL-H-hoz a következőket írjuk és nyomjuk az Összes cseréje gombot: felülre: .^p, alulra: .@&; felülre: !^p, alulra: !@&; felülre: ?^p, alulra: ?@&; felülre: “^p (előtte nézzük meg, hogy tényleg az összes idézőjeles sortörés után valóban sortörésnek kell lennie, ha nem akkor ezt hagyjuk ki!), alulra: “@&; felülre: :^p, alulra: :@&; felülre: …^p, alulra: …@&; felülre: …^p, alulra: …@&; felülre: @&^p, alulra: @&@& végül felülre: ^p, alulra pedig tegyünk egy szóközt. Cseréljük vissza a @& jeleket ^p-re, így csupán minden írásjel után lesz sortörés, szöveg közben nem (ami azért nagyon jó, mert a könyvolvasón úgyis állítható a betű- és sorméret, így minden olvasón máshogy jelenik meg az olvasnivaló, az imént elkövetett dologgal pedig egy szép, formázott szöveget kapunk amit jó lesz nézni a készüléken és nem lesz a szöveg közepén új sor).
TIPP! Ha nagyon sok különféle formázást tartalmaz a szöveg (betűtípusok, méretek, vastag-vékony, stb) akkor érdemes az egészet kivágni (CTRL+A, CTRL+X), beilleszteni jegyzettömbbe (a jegyzettömb nem tartja meg az előbb említett formázásokat), majd abból újra kivágni és egy új Word munkamenetbe beilleszteni! Ezzel minden betű azonos lesz.
Másoljuk vissza a bevezetőt (könyv címe, ISBN-szám, stb-stb), folytassuk a fejezetekkel! Word-ben készítsünk Fejcím 1-et (Heading 1) az ízlésünknek megfelelően (én favorizálom a 14-es, fekete, vastagon szedett betűtípust) és szükség esetén Fejcím 2-t is (Heading 2), hátha az adott fejezet további részekre van taglalva. Keressük meg az összes fejezetet és formázzuk meg az előbb létrehozott Heading-ekkel (fontos! Ha valahol van egy üres sor akkor oda egy teljesen formázatlan enter-t nyomj, ne legyen se vastagon szedett, de betűnövelt szövegbeállítás! Később megtudod miért!). Ettől létrejön egy tartalomjegyzék is amit Word-ben bal oldalt találunk.
Ha elkészültünk minden fejezet elé nyomjunk egy CTRL+Enter-t, ez oldaltörést csinál és amikor olvasod majd a készüléken a kész könyvet a fejezetek új oldalon fognak kezdődni.
Ezt követően jöhetnek a dőlt betűs szövegek és szerencsére találtam egy egyszerűbb módot arra, hogy hogyan lehet ezt gyorsan letudni (Office 2007 és újabb kell hozzá!). Nyisd meg az átkonvertált Word-dokumentumot és azt amelyiken dolgozol, amelyikből később a könyv lesz (lehetőleg nem egy és ugyanaz a kettő, okokat lásd feljebb). Az eredetben, tehát ami a PDF-ből lett létrehozva nyomj CTRL+F-et, a keresőmező mellett/alatt kattints a kis lefelé mutató nyílra és válaszd az Irányított keresés… (angolul Advanced find…) menüt, aminek egy kis távcső az ikonja. Bökj az Egyebek (More >>) gombra és alul a Formátum (Format) Betűtípusra (Font). A Betűstílusok (Font type) válaszd a Dőltet (Italianic) és nyomj az OK-ra. Az Egyebek (More >>) mellett elérhető lett még egy gomb, a Kiemelés olvasáshoz (Reading Highlight), innét az Összes kiemelése (Highlight all) az amit használni szeretnénk. Ezzel az összes dőlt szöveget sárgával “kihúztuk” (olyan a színe mint amivel papíron szokták a szöveget kiemelni), ezeket kell megkeresni a dokumentumban és az új, amiből majd könyv lesz úgyszintén döltté tenni (legegyszerűbb ha kimásolod a szót/szöveget plusz még az utána következő pár szót és arra keresel rá az új, feldolgozás alatt álló könyvben és ha megvan akkor kijelölöd azt ami az eredetiben is dőlt és azzá teszed az újban is).
Ha kész vagy össze kell hasonlítanunk az eredeti szöveget (PDF-et) és az általunk létrehozottat, hogy milyen egyéb eltérés van még. Például aláhúzott szavak (tipikusan ha a könyvben egy újságra hivatkoznak, vagy ha valamit ki akarnak emelni), számjelzett szavak, egyéb dolgok. Ne kapkodj, szánj erre időt, hogy az általad csinált munka a lehető legjobban hasonlítson az eredetire!
Ezt befejezve nagyjából kész is vagyunk az előkészületekkel, mentsük az eddigieket és indítsunk egy Mobipocket Creator-t és nyissuk meg az előbb mentett fájlt. A “Publication Files” fülön jelöljük ki a dokumentumot és felül nyomjunk az “Edit with HTML editor” szövegre. Egy újabb formázási trükk jön a tagolás érdekében: CTRL+H-hoz felülre írjuk be, hogy <p class=”MsoNormal”></p>, alulra pedig egy <br> és cseréljük az összes egyezést. Mentsük a változásokat majd a Creator-ban lépjünk a Table of contents-re és kattintsunk az “Add a Table of Contents” gombra. Legfelső beviteli mezőbe írjuk, hogy Tartalom, First Level mellé, hogy h1, alatta a Second Level mellé pedig azt, hogy h2 és bükjünk az Update-re. Visszatesz minket a Publication Files fülre, itt jelöljük ki a Table of Contents-et és bal oldalt a Move Down szövegre, ezzel a könyv végére helyezzük a tartalomjegyzéket.
A többi adatot adjuk meg értelemszerűen és végül mehet a Build!
Ha mindent jól csináltál egy szép, formázott és olvasható könyv lesz az eredmény amit már nyugodtan lehet továbbkonvertálni Calibre-vel.

Az átvizsgálást és feldolgozást gyorsítandó csináltam 3 Word makrót amikkel jó pár percet spórolhatunk. A kapcsolódó cikk és letöltőlink ITT található.

Kis tuning a könyvhöz:
A könyvolvasók többsége az első heading-gel (magyarul Címsor, HTML-ben h1, lásd feljebb) jelölt fejezettel kezdi a könyvet, hiába van előtte 3 másik lap ahol a köszönetek, képek, és a többi van felsorolva. Ezt viszont módosíthatjuk anélkül, hogy már az első lapon a címet is fejezetnek jelölnénk (ami nem jelenik meg túl szépen a tartalomjegyzékben). Ehhez a kapott PRC fájlt töltsük be Calibre-be majd konvertáljuk át ePUB-ba. Jobb klikk a könyvre és válasszuk a Könyv finomhangolása lehetőséget és ott a Könyv kicsomagolása gombot. A megnyíló ablakban a content.opf fájlt nyissuk meg (Notepad vagy Notepad++ jó választás lesz hozzá), ennek a legalján található a <guide><reference> rész, görgess oda.
A guide sor alá, a felső reference fölé illeszd be a következőt:
<reference title="Start" type="text" href="en_konyvem_split000.html#startpos"/>
Természetesen az en_konyvem_split000-t cseréld ki arra amelyik oldallal kezdeni szeretnéd a könyvet (ezt megtalálod a content.opf fájl mellett az ablakban amit a kicsomagoláskor a Calibre megnyitott).
Ez után Calibre-ben bökj a Könyv újraépítése gombra és konvertáld arra a formátumra amire csak szeretnéd (vagy épp kezd el az olvasást), az olvasók az általad megjelölt oldallal fogják megnyitni a művet.

Igényes e-könyv készítése” bejegyzéshez 48ozzászólás

  1. A ctrl+c ctrl+v nem jó megoldás Adobe-ból Word-be? Vagy az teljesen más lesz, mintha konvertáló program csinálja? Köszi a választ.

  2. E cikk szerzőjének szeretném nagyon-nagyon megköszönni a részletes leírást a fránya pdf olvashatóvá tételéről. Most vettem egy Kindlét és volt pár PDF állományomám, ami elég gáz minőségű volt.

  3. Igazi gyöngyszem ez így!
    egy kérdés: a végén a mobicreatorban a “, alulra pedig egy és cseréljük az összes egyezést.” ez mit csinál a “jó tagolás érdekében” ? nem nagyon vettem észre különbséget, persze azt se tudom mire kéne jelen esetben figyelnem.

    • A Mobipocket Creator HTML-be konvertálja át a Word dokumentumot és azt dolgozza fel. Annyit tesz, hogy a p class bekezdés helyett (ami amúgy üres, mert egyből le is van zárva) sortörést tesz be (erre van a relációs jelek közt a br), így megtartva a könyv taglalását és az üres sorokat.

  4. Üdv!
    A leírás szép, köszönet érte! A kérdésem az lenne, hogy a kész tartalomjegyzékből hogyan lehetne hivatkozásokat csinálni? (Rákattintva az adott fejezethez ugorjon)

  5. Üdv!
    Nagyon szép és részletes leírást kaphattunk tőled, igaz kicsit megkésve értem ide, de remélem, hogy sikerül a kérdésemre válaszolnod.
    Először is szeretném megköszönni a segítségedet, van pár könyvem, amit nem szeretnék elveszíteni, viszont sok helyet foglal és ha digitálissá alakítom akkor egy igényesen kialakított rendszerben a városi panel lakásban is kényelmesen el lehet tőlük férni.
    Tehát első és legfontosabb kérdésem a következő lenne:
    Mikor world-be átalakítottam ABBYY segítségével a könyvet azon szépen lassanként végigfutva a képeket beillesztem a helyükre. nos itt csak az a kérdésem, hogy a képeket körbefuttatva kell e berakni, vagy a sorral egyvonalban? esetleg kell-e nekik helyet hagyni, vagy mikor a sorba illesztve rakod be a képet az majd a későbbiek során szépen jelenik meg, és csak a world az amelyik az adott sorban kitöltött részt mutatja csak?
    belinkelek azért 2 képet mire gondolok (először egy “könnyebb” könyvet próbálok, ami az internetről pdf-ben megszerezhető):
    körbefuttatva a sorok elé:

    sorok között:

    A második esetben a kép valós méretét ugye a szürke négyzetek mutatják.
    Előre is köszönöm a segítségedet.

    • Szervusz!

      Semmiképp nem venném körbe a szöveggel a képet. Nem minden eszköz tudja szépen megjeleníteni azt, egyszerűbb, ha a sor vége után a következő sorba teszed. Az tuti hibátlan lesz.

      • Üdv!
        Tehát azt mondod, hogy a 2. képen lévő megoldás a helyes (ha a world szarul is jeleníti meg.)
        Ugyanis mint látható (a mindent mutat gombbal), hogy új sorba tettem, csak mivel 1 sor woldben 1 sor így azt az egy sort mutatja a képből is, pedig az lényegesen ,,magasabb”.
        az e könyv pedig talán a kép méretéhez viszonyítva a sor szélességét autómatikusan széthúzza? (vagy nem 😀 )
        Esetleg lenne még egy kérdésem. A makróddal kapcsolatban, ha jól láttam a posztot kb februárban tetted fel, azóta lett módosítva? Esetleg megosztanád ezt velünk is? Nagyon megköszönném.
        További kellemes időtöltést.

      • Nekem nem “egy sor az egy sor” a Word-ben, mutatja a teljes képet. Valamit akkor jól elállítottál, nézd meg szerintem a beállításokat.
        Nem, február óta nem nyúltam a makrókhoz, igaz kb 4 hónapja gyártottam az utolsó e-könyvemet. Majd most újra neki akarok állni.

      • Üdv,
        Sikerült újra nekiállni? 🙂 gondoltam ismét felnézek ide (azóta elkészítettem a könyvet, de nem lett olyan jó, mint szerettem volna. Totál újraolvasást/helyesírás ellenőrzést és a képek formázását igényelné…

  6. Viszonylag jól sikerült az átalakítás, de minden “Ő”, “ő”, “Ű” és “ű” betű helyére “Q” “q”, esetleg “p” betűt szúrt be… 🙂
    Mit lehet tenni?

      • Gyanús, hogy a mobipocket creator-ban a settingsnél hiába van alapértelmezett nyelvnek magyar beállítva, a karakterkódolásnál csak UTF8 és windows1252 választható és ahogy én néztem ezekben egyikben sincs “ő” és “ű” betű. A publikáció készítése közben létrejövő html fileban karakteresek a betűk, de a prc file-t beolvasva Calibre-be, mindenhol lecserélődnek az említett karakterek. (A mobipocket creatorban nem működik a preview funkció…)

  7. Hali.
    Jó kis leírás. Egy pár hozzá fűznivaló azért szükséges:
    Mobipocket Creator és helyett ajánlom konvertálás doc-ról alternatívának, hogy egyszerűen MS Officeban mentsük le a könyvet rtf formátumba, calibre azt már tökéletesen kezeli.
    Csupán annyi a probléma, hogy sok a felesleges HTML-tag a forrásban, van hogy oldalakon keresztül csak tartalom nélküli stílusmeghatározások vannak… jelentősen megnővelve a kimeneti adat mennyiségét. Tesztből egy 800 kb. os epub-ból felesleges részek kivagdósásával (és a css stilusok minimális javításával) sikerült 359kb.ra összehoznom egy könyvet. Több mint 50% a felesleg, bár ez nem látszik a megjelenítésben. Ami sokat számít az a bekezdések utáni távolság a tegek cserélje helyett egyszerűbben megoldható ha a stylesheet.css be beírjuk hogy
    p{
    margin-bottom: 0;
    margin-top: 0;
    }

  8. Üdv, egy ideje használom már ezeket a nagyon hasznos tanácsokat, de most meggyűlt a bajom egy könyvecskével.
    Pdf-ből szépen átalakítom, mindent rendbe teszek, de a könyv végén van egy teljes oldalas kép. Hogyan állítsam be a méreteit, hogy átkonvertálás után jól mutasson ebook olvasón? Tehát lehetőleg ott is teljes oldalas legyen? Egy családfa van rajta, a könyvben is fotóként eredetileg, így kis mérteben nem látható a lényeg.
    Worben általában A5-ös papírméreten dolgozom, nem tudom ez lényeges e hozzá.

    • Szia!

      Nos, ez tesztelés kérdése. Az egész Kindle olvasó akkora mint egy A5-ös lap, talán kicsit nagyobb, a többi olvasó is ekkora méretű kb, tehát érdemesebb kisebbre tervezni a képet, mint A5. A pontos méreteket én sem tudom, nekem is mindig sok időm megy el a méretezésükkel.

  9. Sziasztok!
    Ti a Word szerkesztés közben milyen igazítást használtok? Balra zártat vagy sorkizártat? Annyira eltérő véleményeket hallok, és még nincs meg az ebook olvasóm, hogy megnézzem, hogyan jobb.

  10. Sziasztok,
    Nagyon jó a leírás, köszönöm. 🙂
    Viszont nem boldogulok egy jellel, az eredeti word dokumentációmban egy ilyen jel van: ¬ a szavak között. A cserével nem tudom kiiktatni. Van valami ötlet, hogy mit tehetnék ellene?

  11. Van megoldás erre? A problémám az, hogy van egy szépen megszerkesztett word doksim, amiben sehol nincs üres oldal. Fejezetek között oldaltörés, hogy a fejezetek új oldalon kezdődjenek az ebook olvasón, behúzások beállítva, fölös oldalak kiszedve stb.stb.stb….
    Na ha én ezt a word dokumentumot átalakítom epubbá, akkor előfordul, hogy a fejezet végén az új fejezet előtt van egy üres lapom. Hogyan tudnám én ezeket az üres oldalakat eltávolítani.? Egyáltalán miért jelenik meg? Köszi előre is a jó tanácsot!

      • én ugy oldottam meg , hogy egyből az utolsó karakter után teszem az oldaltörést és nem enter után. továbbá nem docba hanem rtf-be mentem és onnan konvertálom calibreval.

  12. Hello,
    Kiváló a leírás, de lenne egy problémám:
    Amikor a Table of Contents Wizardban az update-re megyek, kidobja ezt a hibaüzenetet:

    An unexpected javscript error occured in application.
    Please contact the Mobipocket support and copy and paste the following information:
    Mobipocket Creator Publisher v 4.2 build 41

    Microsoft Internet Explorer
    4.0 (compatible; MSIE 7.0; Windows NT 6.1; WOW64; Trident/6.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; Media Center PC 6.0; InfoPath.2; .NET4.0C)0

    Line: 94
    Character: 3
    Code: 0
    Message: Az objektum nem támogatja a műveletet.
    Url: file:///C:/Program%20Files%20(x86)/Mobipocket.com/Mobipocket%20Creator/rsrc/html/table_of_contents.html

    Előre is köszönöm!

  13. Am, nállam nagyon gyakran előfordulnak hasonló kis hibák, ha másképpen nem megy akkor HTML editorral b*zizom a mobit, vagy a prc-t… sajnos másképpen nem lehet. Volt olyan könyv amit alapból dreamweaverben kezdtem szerkeszteni nem docban… sajnos a minőségnek ára van. (viszont a docos konvertálos módon létrejött 15Mb-t így sikeressen lecsökkentettem 580kb-ra… :D)

  14. Most vettunk egy amazon kindle paperwhite 2 olvasot, sajnos még nagyon gyerekcipoben járunk a kezelésénél, ha regisztráljuk a készüléket wifin keresztül akkor át fogjuk tudni állitani magyar nyelvre. Csak megsugom még egyenlőre a dobozban van 🙂

  15. Hello!
    Lenne egy problémám: a karakterfelismerő a párbeszédeket felsorolásként értelmezi. Ha kikapcsolom Wordben a felsorolást, akkor elvesztem a gondolatjeleket, így viszont elég randa az összkép.
    Tudnál rajtam segíteni?

      • Hello, én ABBYY-t használok, ott be lehet állítani, hogy a beolvasott szöveg mennyire hasonlítson az eredetire. Ilyen lehetőségek vannak, hogy formatted text, plain text, stb, Ha plain textet állítasz be, és úgy mented el, akkor megmaradnak a gondolatjelek. Viszont sajnos elveszik az összes formázás.

  16. Üdvözlet mindenkinek!
    Következő kérdésem lenne (hasonló probléma felmerült már fentebb is): már kész epub-ból szeretném valahogy eltávolítani azokat az üres részeket, ami a szöveg nagyításakor keletkeznek. Lehetséges-e valahogy, hogy nagyításkor se jelenjen meg (gyakran egy sor híján egész oldalnyi) üres hely?

  17. Sziasztok! Remélem működik még ez segítségnyújtó oldal.
    Nagyon amatőr vagyon “minőségi” epub létrehozásában, és egyáltalán az informatika terén.
    Tegnap 2 óra próbálkozás után a fenti instrukciók alapján sikerült pdf-ből docxban elég elfogadhatóan javítani az e-könyvnek valót (Wordben viszont “otthon” vagyok, elég jól ismerem).
    Viszont nem tudom sehogy kivenni a pdf-ben szavak közötti szereplő elválasztásokat, mert automatikusan kiveszi a párbeszéd jeleket is, és ömlesztve szerepel a bekezdésben. Tudtok erre valami segítséget nyújtani?
    Illetve előzőleg pdfből közvetlenül Mobipocket Creatorral prc-re alakítva lényegesebben kisebb kiterjesztésű a könyv, a Calibre gond nélkül átalakította epubra, de benne vannak a sortörések (nagyon zavaró).
    Próbáltam a docxot a Mobipocket Creatorral átalakítani prc-re, beemeltem a Calibrebe, több mint a duplája lett a mérete, és a Calibre tekert-tekert-tekert, és tekert, de nem tudta konvertálni.
    Én vagyok az a típusú ember, akinek nagyon fontos lenne, hogy valóban élvezhetőre alakíthassa át a pdf-et.
    Nagyon hálás lennék a segítségetekért!
    Szép napot!
    Kati

    • Szia!
      Az elsőre kérdésre sajnos nincsen gyors és hatékony megoldás. Ha minden elválasztójel után van egy enter vagy szóköz akkor még lehet vele ügyeskedni, de még akkor sem garantált a 100%-os siker.
      A Mobipocket Creator nagyon régi, nem kezeli a docx-et, csak a doc kiterjesztést. Valószínűleg ezzel van a gond.

      • Szia! Köszi a választ, azóta elég jól feljődök, egész türhetően “megszépítem” a könyveket. Szép napot! Kati

  18. Hello! Van ettől egyszerűbb megoldás is. A Caliber-ben konvertálásnál sokmindent be lehet állítani és van egy olyan fül, felülről a 3., hogy “Heurisztikus feldolgozás”, amit engedélyezni kell és ugyanezt csinálja meg 🙂

  19. Sziasztok, nagyon lelkesen elolvastam es neki alltam az elso konyv szerkesztesnek de elakadtam. Nem lehet egy tanito vidit kesziteni? pl sortoresek es oszlop toresek torlese.

Hozzászólás a(z) Csutak Jozsef bejegyzéshez Kilépés a válaszból