Menu

Show posts

This section allows you to view all posts made by this member. Note that you can only see posts made in areas you currently have access to.

Show posts Menu

Messages - pepak

#946
E-books / Jak upravit HTML k obrazu (ctecky) svemu?
April 15, 2009, 09:09:57 PM
No tak první rada je, že z PDF skoro určitě nic použitelného nevyleze a tudíž nemá cenu s tím ztrácet čas.

Na převod PDF na HTML existují nástroje, jejich úspěšnost je různá (často taky hrůzná, ale za to ty nástroje nemohou). Pokud jde o editování, záleží na tom, co v tom HTML máš a co z toho chceš mít
- pokud jsou jak zdroj tak cíl jenom trochu rozumné, tak se vesměs dá z jednoho do druhého dostat sekvencí vhodných regulárních výrazů (pokud se v regulárních výrazech vyznáš).

Bez ohledu na to, co vlastně chceš a jaký nástroj k tomu zvolíš, ale dost pochybuju o tom, že to půjde nějak automaticky. Skoro jistě budeš muset značnou část udělat ručně a jde jen o to, jestli to "ručně" má znamenat "ručně oeditovat", "ručně si sestavit vhodné regexpy" nebo "rně naprosgramovat vhodný skript/makro".
#947
E-books / Časopisy v PDF
April 10, 2009, 11:07:42 AM
Záleží na tom, jaké časopisy. V zásadě platí to, co jsem psal v popisu PDF - máš na výběr mezi zobrazením celé stránky (pak to vidíš přesně tak, jako na počítači, akorát zmenšené na velikost displeje) a mezi textovým zobrazením s reflow (pak zůstane jen text).
#948
E-books / Zkušenosti se Sony Reader PRS-505
April 09, 2009, 07:38:15 PM
Quote from: "Emil Vlasák"V prvních okamžicích jsem si chtěl počíst a neriskovat zničení systému experimenty s firmwarem třetích stran. Proto hned první experimenty se týkaly UTF-8, který však bohužel kvůli fontům správnou češtinu nezobrazuje.
Na tohle jsem ze začátku nenarazil, protože jsem původně vůbec neuvažoval o tom, že bych četl knihy v češtině - zajímám se hlavně o fantasy, které jsou ve velké většině psané anglicky, kterou ovládám myslím velmi dobře. Je proto pro mě příjemnější číst v originále než se trápit s překlady, o jejichž úrovni si myslím nedobré věci. K českým knihám jsem se dostal vlastně až následně, když jsem chtěl vyzkoušet, jestli ten dočasný hack vůbec funguje. No a když už jsem měl ve čtečce češtinu, proč se jí vyhýbat, že - ovšem stále platí, že pokud je originál anglicky, dám přednost jemu před překladem.

Zato jsem si narazil na jiné věci - například mi na začátku vůbec nedošlo, že čtečka si projde paměťovou kartu a vytvoří si seznam knih sama, takže jsem strávil spoustu času tím, že jsem příslušné záznamy v cache.xml vytvářel ručně... No jo, chybami se člověk učí.

QuoteProto jsem začal používat PDF - asi půl roku bez jakýchkoli problémů. Rychlost je přijatelná, žádné ztuhnutí jsem dosud nezažil.
Na PDF se mi čtečka ještě nekousla, to je fakt. Ale taky je fakt, že v PDF mám přečteno mnohem méně než v LRF, takže to může být prostě jen nedostatečným vzorkem dat. Ale každopádně jsem si všiml, že složitější knihy se zobrazují v PDF výrazně pomaleji.

QuoteKnihy si ovšem musíte přesázet, což dá řádově pro titul 2-3 minuty práce.
Pěkný návod a jsem si jistý, že bude pro někoho užitečný - je to zřejmě jediný způsob, jak si přečíst české knihy na neupravené čtečce. Nicméně jsem přesvědčen, že dnešní možnosti dostat češtinu do čtečky už jsou natolik bohaté, že je výhodnější převést knihu do EPUBu nebo LRF a číst v nich.

QuoteDobrý zdroj české beletrie (3500 titulů) sdělím na požádání.
Jak jste spokojen s kvalitou těch knih? Já jsem pár nejznámějších českých e-bookových webů procházel, ale kvalita knížek mi přišla naprosto otřesná - jako kdyby to někdo naskenoval, zOCRkoval a pak to vypustil na internet jako hotové. Vesměs mi přišlo jako jednodušší je naskenovat, zOCRkovat a zkorekturovat ještě jednou než se snažit dokopat je do použitelné podoby.

Ale přece jenom to seznamování s českými e-booky mělo jeden pozitivní efekt - byl jsem nucen napsat si dávkovou konverzní utilitu, kterou tu také dříve nebo později popíšu a umístím ke stažení...

QuotePoužil jsem PRSCustomizer.
Přes jeho vychvalování první pokus skončil chybovým hlášením, druhý sice proběhl, ale slibovaná lokalizace do češtiny neproběhla. Zato začalo fungovat UTF-8, což jsem chtěl hlavně a čož mne zatím plně uspokojilo.
To se stává, žádný program není bez chyby. Za sebe říkám, že jsem problémy neměl ani jednou ze tří případů, kdy jsem PRS Customizer použil k integraci fontů.

QuotePak ho napustím do Readeru (samožejmě kopírováním, žádné nadstavby mne nezajímají).
Tak to vás možná zaujmou některé moje utility, protože já také nemám rád nadstavby, ale zato mám rád, když počítač všechnu práci oddře za mě :-)

Quoteněkteré znaky (ď) nevypadají moc dobře.
Tohle je Výborně zvládnuté v EPUBu, pokud použijete ty čtyři varianty jednoho fontu, jak jsem to popsal v článku o češtině.

QuotePo dvou knihách jsem tyto detaily přestal vnímat.
Tak to já ne. Naopak, čím víc čtu, tím víc trvám na dokonalém provedení a opravuji i takové prkotiny jako mezery před interpunkčními znaménky.

QuoteCelkově jsem velmi spokojen a jedinou mou touhou v tomto směru je nějaký budoucí Reader ve formátu aspoň A5 nebo ještě větší, aby se tam daly napustit hotové PDF v A4.
iRex Illiad? :-)
To já mám přání přesně opačné - chtěl bych něco, co bude mírně menší než PRS-505. Stačilo by mě, kdyby se šířka zmenšíla o půl centimetru, aby se mi čtečka vešla do kapsy...

QuoteMimochodem, existuje program (mysím jap), který stávající PDF stránky dokáže rozděli na dvě vodorovným řezem a výsledek zobrazit na šířku. Nouzově jsem tak přečetl jednu knihu.
To už mi přijde lepší podržet zoomovací tlačítko a mít to zobrazení i bez extra programu.
#949
E-books / Zkušenosti se Sony Reader PRS-505
April 09, 2009, 07:19:00 PM
Quote from: "Emil Vlasák"Zdravím!

Díky za zajímavý web o Sony Readeru, na který jsem se dostal až teď přes diskusi na Technetu.
Zařízení používám zhruba od léta a přečetl jsem na něm desítky knih.

V prvních okamžicích jsem si chtěl počíst a neriskovat zničení systému experimenty s firmwarem třetích stran. Proto hned první experimenty se týkaly UTF-8, který však bohužel kvůli fontům správnou češtinu nezobrazuje.

Proto jsem začal používat PDF - asi půl roku bez jakýchkoli problémů. Rychlost je přijatelná, žádné ztuhnutí jsem dosud nezažil.

Knihy si ovšem musíte přesázet, což dá řádově pro titul 2-3 minuty práce.

1. Ve Wordu nastavit (lépe vytvořit šablonu) parametry stránky - 90×120mm, okraje 3mm, písmo Times 12,

2. Do této šablony napustit text. Pokud ho náhodou získáte v PDB (populární formát pro Palmíky), tak text získáte z volného programu DocReader přes klipboard.

Dobrý zdroj české beletrie (3500 titulů) sdělím na požádání.

3. Vytisknout do PDF.
Různé volné programy (PDFCreator) nereagují správě na nastavení malé stránky. Častý výsledek je, že se malé stránky vytisknou doprostřed A4, což nechceme.
Problémem jsem se netrápil (možná jsem jen dělal něco špatně), protože klasická Adobe PDF "tiskárna" to zvládá bez problémů.

Nedávno jsem se přece jen rozhoupal k updatu.
Použil jsem PRSCustomizer.
Přes jeho vychvalování první pokus skončil chybovým hlášením, druhý sice proběhl, ale slibovaná lokalizace do češtiny neproběhla. Zato začalo fungovat UTF-8, což jsem chtěl hlavně a čož mne zatím plně uspokojilo.

Čistý text nyní už nemusí běžet přes Word-PDF, ale jen přes konvertor do UTF-8.
Pak ho napustím do Readeru (samožejmě kopírováním, žádné nadstavby mne nezajímají).
Drobné nevýhody proti PDF jsou - první otevření je pomalé (jak se píše někde nahoře), protože Reader si TXT jakoby musí "vysázet" sám. "Tiskne" až do okrajů (žádné 3mm jako u mých PDF) a některé znaky (ď) nevypadají moc dobře. Po dvou knihách jsem tyto detaily přestal vnímat.

Celkově jsem velmi spokojen a jedinou mou touhou v tomto směru je nějaký budoucí Reader ve formátu aspoň A5 nebo ještě větší, aby se tam daly napustit hotové PDF v A4.
Mimochodem, existuje program (mysím jap), který stávající PDF stránky dokáže rozděli na dvě vodorovným řezem a výsledek zobrazit na šířku. Nouzově jsem tak přečetl jednu knihu.

Těším se na vaše zkušenosti.

Emil Vlasák