Könyvgyártó makrók Word-höz (1-es verzió)

Próbálom keresni azokat a lehetőségeket amikkel egyre gyorsabban lehet javítani a PDF-ből DOC-ba konvertáláskor előjövő hibákat. Ilyenek például a felesleges sortörések, a rövid kötőjelek cseréje a hosszabb, párbeszédet jelölő kötőjelekre. Ezért is született az előző bejegyzés ahol leírtam, hogy mikre jók a Word-ben a makrók; most pedig megosztom azokat amiket én csináltam és amiket az elmúlt 2-3 könyvnél használtam a műveletek gyorsabb elvégzésére.
Az első (kötőjelek) a rövid kötőjeleket cseréli le és a sorkezdő szóközöket tünteti el előlük.
A második (laptörések) a lap-, szakasz- és hasábtöréseket cseréli le normál sortörésre.
A harmadik (sortörésjavítás) azokat a hibákat javítja ki ahol az adott sor végén nincs írásjel viszont a konvertálás miatt egy sortörésjel került a végére, így gyakorlatilag feleslegesen ketté szedve az adott mondatot.
Fontos megjegyezni, hogy miután mind a három lefutott át kell nézni a szöveget mert például nem tudja eldönteni, hogy egy sor végén direkt nincs sortörés vagy véletlen, így például a fejezetcímeket összevonja a szöveg többi részével! Ezeket neked kell javítani (de még így is sok időt tud megspórolni)!
Letölteni innét lehet:

LETÖLTÉS

A Word-be való betöltéshez a Makrók->Makrók megtekintése->Szerkesztés->Fájl->Makrók importálása opció használandó.
Valószínűleg majd csiszolom és fejlesztem még őket, ez csak az első verzió.

Reklámok

Igényes e-könyv készítése

Egyre több és több embert látok aki nekiáll e-könyvet gyártani. Vagy lelkesedésből, vagy mert amit olvasni szeretne még nem létezik ilyen formátumban, vagy egyszerűen a közösségért de napról napra nő az elektronikus kötetek száma.
Tetszik, hogy visszatérünk a “nyomtatott” szórakozáshoz a válogatott, intelligens, mélyértelmű tévéadások helyett és most ehhez írnék pár sort, hogy hogyan lehet igényes e-könyvet csinálni (sajnos sokan esnek abba a hibába, hogy a PDF-et beimportálják Calibre-be majd egyszerűen átkonvertálják egy másik formátumra és mint akik jól végezték dolgukat, hátradőlnek. Így aztán se tördelés, se normális oldaltörés, nincsen tartalomjegyzék és esetleg teljesen élvezhetetlen szöveget kapunk).
Először is kell egy OCR program, az Abbey Finereader vagy az Adobe Acrobat X Pro 30 napos próbaverziója tökéletesen megfelel, ezzel szépen átkonvertáljuk a PDF-eket DOC-ra (fontos megjegyezni, hogy szakmai kiadványokat/leírásokat nagyon időigényes elkészíteni mert az összes képet, ábrát, táblázatot egyenként pozicionálni kell, szükség esetén pedig szerkeszteni).
Word-ben nyissuk meg a kapott szöveget és jeleníttessük meg a formázási karaktereket (¶ jel a menüben). A konvertáláskor sajnos a program minden oldalvéget szakasztörésnek vesz és ennek megfelelően a DOC fájl tele lesz Column Break-ekkel. Ezeket nagyon egyszerű törölni: nyomj CTRL+H-t (Replace, avagy Csere), a felső sorba írd be, hogy ^b, alulra pedig egy ^p-t (a kis felfele mutató nyilakkal együtt!) majd cseréljük le az összes egyezést, ezzel sortörésre cserélve a szakasztöréseket; majd felülre ^n, alulra pedig ^p, így az oszloptöréseket is töröljük.
A következő probléma az elválasztások. Nos, ezekre nincs semmilyen nagy titok, nem lehet mindet egyszerre cserélni, maximum kicsit segíteni tudok: CTRL+H, felülre írd be, hogy “^p-“, alulra pedig semmit. A “Következő keresése” gombbal nézzük át a teljes szöveget, mert magyarban léteznek olyan szavak amik közé kötőjelet teszünk és sajnos néha ezek külön sorba kerülnek, így nem kell őket összevonni, viszont egymás mellé kell őket húzni (pl az ipi-pici, ide-oda, stb). Ha tényleg elválasztás van akkor nyomjunk a Csere gombra, ezzel eltűnik a sortörés és a kötőjel, a szó pedig egybe lesz írva. Biztos ami biztos fussuk át ismét a szöveget és nézzük meg, hogy nem hoztunk e létre helytelen szavakat, például ha a “tüsszentés” szó el volt választva lehet, hogy az összevonás után olyat kapunk, hogy “tüszszentés” ami elég ostobán néz ki.
Jöjjenek a felesleges sortörések! Először is az első oldalon található bevezetőt vágjuk ki külön doksiba, hogy ezekhez ne nyúljon a csere (cím, ISBN-szám, ki fordította, mikor, kiadó, stb). Egy egyszerű trükkhöz kell folyamodni, hogy gyorsabban végezzünk: kerestessük meg az írásjelek utáni sortöréseket, ezeket írjuk át valami másra majd az összes többi (mondhatni felesleges) sortörést cseréljük le szóközre. CTRL-H-hoz a következőket írjuk és nyomjuk az Összes cseréje gombot: felülre: .^p, alulra: .@&; felülre: !^p, alulra: !@&; felülre: ?^p, alulra: ?@&; felülre: “^p (előtte nézzük meg, hogy tényleg az összes idézőjeles sortörés után valóban sortörésnek kell lennie, ha nem akkor ezt hagyjuk ki!), alulra: “@&; felülre: :^p, alulra: :@&; felülre: …^p, alulra: …@&; felülre: …^p, alulra: …@&; felülre: @&^p, alulra: @&@& végül felülre: ^p, alulra pedig tegyünk egy szóközt. Cseréljük vissza a @& jeleket ^p-re, így csupán minden írásjel után lesz sortörés, szöveg közben nem (ami azért nagyon jó, mert a könyvolvasón úgyis állítható a betű- és sorméret, így minden olvasón máshogy jelenik meg az olvasnivaló, az imént elkövetett dologgal pedig egy szép, formázott szöveget kapunk amit jó lesz nézni a készüléken és nem lesz a szöveg közepén új sor).
TIPP! Ha nagyon sok különféle formázást tartalmaz a szöveg (betűtípusok, méretek, vastag-vékony, stb) akkor érdemes az egészet kivágni (CTRL+A, CTRL+X), beilleszteni jegyzettömbbe (a jegyzettömb nem tartja meg az előbb említett formázásokat), majd abból újra kivágni és egy új Word munkamenetbe beilleszteni! Ezzel minden betű azonos lesz.
Másoljuk vissza a bevezetőt (könyv címe, ISBN-szám, stb-stb), folytassuk a fejezetekkel! Word-ben készítsünk Fejcím 1-et (Heading 1) az ízlésünknek megfelelően (én favorizálom a 14-es, fekete, vastagon szedett betűtípust) és szükség esetén Fejcím 2-t is (Heading 2), hátha az adott fejezet további részekre van taglalva. Keressük meg az összes fejezetet és formázzuk meg az előbb létrehozott Heading-ekkel (fontos! Ha valahol van egy üres sor akkor oda egy teljesen formázatlan enter-t nyomj, ne legyen se vastagon szedett, de betűnövelt szövegbeállítás! Később megtudod miért!). Ettől létrejön egy tartalomjegyzék is amit Word-ben bal oldalt találunk.
Ha elkészültünk minden fejezet elé nyomjunk egy CTRL+Enter-t, ez oldaltörést csinál és amikor olvasod majd a készüléken a kész könyvet a fejezetek új oldalon fognak kezdődni.
Ezt követően jöhetnek a dőlt betűs szövegek és szerencsére találtam egy egyszerűbb módot arra, hogy hogyan lehet ezt gyorsan letudni (Office 2007 és újabb kell hozzá!). Nyisd meg az átkonvertált Word-dokumentumot és azt amelyiken dolgozol, amelyikből később a könyv lesz (lehetőleg nem egy és ugyanaz a kettő, okokat lásd feljebb). Az eredetben, tehát ami a PDF-ből lett létrehozva nyomj CTRL+F-et, a keresőmező mellett/alatt kattints a kis lefelé mutató nyílra és válaszd az Irányított keresés… (angolul Advanced find…) menüt, aminek egy kis távcső az ikonja. Bökj az Egyebek (More >>) gombra és alul a Formátum (Format) Betűtípusra (Font). A Betűstílusok (Font type) válaszd a Dőltet (Italianic) és nyomj az OK-ra. Az Egyebek (More >>) mellett elérhető lett még egy gomb, a Kiemelés olvasáshoz (Reading Highlight), innét az Összes kiemelése (Highlight all) az amit használni szeretnénk. Ezzel az összes dőlt szöveget sárgával “kihúztuk” (olyan a színe mint amivel papíron szokták a szöveget kiemelni), ezeket kell megkeresni a dokumentumban és az új, amiből majd könyv lesz úgyszintén döltté tenni (legegyszerűbb ha kimásolod a szót/szöveget plusz még az utána következő pár szót és arra keresel rá az új, feldolgozás alatt álló könyvben és ha megvan akkor kijelölöd azt ami az eredetiben is dőlt és azzá teszed az újban is).
Ha kész vagy össze kell hasonlítanunk az eredeti szöveget (PDF-et) és az általunk létrehozottat, hogy milyen egyéb eltérés van még. Például aláhúzott szavak (tipikusan ha a könyvben egy újságra hivatkoznak, vagy ha valamit ki akarnak emelni), számjelzett szavak, egyéb dolgok. Ne kapkodj, szánj erre időt, hogy az általad csinált munka a lehető legjobban hasonlítson az eredetire!
Ezt befejezve nagyjából kész is vagyunk az előkészületekkel, mentsük az eddigieket és indítsunk egy Mobipocket Creator-t és nyissuk meg az előbb mentett fájlt. A “Publication Files” fülön jelöljük ki a dokumentumot és felül nyomjunk az “Edit with HTML editor” szövegre. Egy újabb formázási trükk jön a tagolás érdekében: CTRL+H-hoz felülre írjuk be, hogy <p class=”MsoNormal”></p>, alulra pedig egy <br> és cseréljük az összes egyezést. Mentsük a változásokat majd a Creator-ban lépjünk a Table of contents-re és kattintsunk az “Add a Table of Contents” gombra. Legfelső beviteli mezőbe írjuk, hogy Tartalom, First Level mellé, hogy h1, alatta a Second Level mellé pedig azt, hogy h2 és bükjünk az Update-re. Visszatesz minket a Publication Files fülre, itt jelöljük ki a Table of Contents-et és bal oldalt a Move Down szövegre, ezzel a könyv végére helyezzük a tartalomjegyzéket.
A többi adatot adjuk meg értelemszerűen és végül mehet a Build!
Ha mindent jól csináltál egy szép, formázott és olvasható könyv lesz az eredmény amit már nyugodtan lehet továbbkonvertálni Calibre-vel.

Az átvizsgálást és feldolgozást gyorsítandó csináltam 3 Word makrót amikkel jó pár percet spórolhatunk. A kapcsolódó cikk és letöltőlink ITT található.

Kis tuning a könyvhöz:
A könyvolvasók többsége az első heading-gel (magyarul Címsor, HTML-ben h1, lásd feljebb) jelölt fejezettel kezdi a könyvet, hiába van előtte 3 másik lap ahol a köszönetek, képek, és a többi van felsorolva. Ezt viszont módosíthatjuk anélkül, hogy már az első lapon a címet is fejezetnek jelölnénk (ami nem jelenik meg túl szépen a tartalomjegyzékben). Ehhez a kapott PRC fájlt töltsük be Calibre-be majd konvertáljuk át ePUB-ba. Jobb klikk a könyvre és válasszuk a Könyv finomhangolása lehetőséget és ott a Könyv kicsomagolása gombot. A megnyíló ablakban a content.opf fájlt nyissuk meg (Notepad vagy Notepad++ jó választás lesz hozzá), ennek a legalján található a <guide><reference> rész, görgess oda.
A guide sor alá, a felső reference fölé illeszd be a következőt:
<reference title="Start" type="text" href="en_konyvem_split000.html#startpos"/>
Természetesen az en_konyvem_split000-t cseréld ki arra amelyik oldallal kezdeni szeretnéd a könyvet (ezt megtalálod a content.opf fájl mellett az ablakban amit a kicsomagoláskor a Calibre megnyitott).
Ez után Calibre-ben bökj a Könyv újraépítése gombra és konvertáld arra a formátumra amire csak szeretnéd (vagy épp kezd el az olvasást), az olvasók az általad megjelölt oldallal fogják megnyitni a művet.