Jak píšu česky pro web

ZápisKonverze

Odpovídám takto na dotazy o tom jak tady v prostředí, kde počítače neumí česky, píšu česky. Má to své kořeny v dobách dávno před existencí WWW. Jelikož jsem zatím nenašel velké zalíbení v programech jako je MS Word, pokračuji tak více méně po staru dodnes (červen 1998). Pokud by se to snad mohlo hodit i někomu jinému, vypadá to takto:

1. Zápis textu

Pracuji pouze s ASCII soubory. Mám svůj "spřežkový" formát (kód), který označuji MK (tak ho zná můj konverzní program konvCS, který bude popsán níže), v němž se diakritika označuje znaky ^, ' a ` (circumflex (stříška), apostrof a převrácený apostrof) za příslušným písmenem. K vytvoření souboru ve formátu MK lze tak použít jakéhokoliv textového editoru a takový soubor je naprosto nezávislý na typu počítače a jeho operačním systému.

Stříška reprezentuje háček (měkkost) nebo kroužek nebo stříšku, apostrof čárku, a obrácený apostrof přehlásku.

Podrobný popis formátu MK: Tabulka všech českých a slovenských písmen s diakritikou

2. Konverze různých kódování

K tomu používám program konvCS. Jedná se o verzi V1.3 z 25. října 2004, která umí konvertovat i MS UNICODE a <META http-equiv .. charset=...> HTML "přivěsky", pokud se ve vstupním souboru vyskytují.

Používá se takto: konvCS   kod1   kod2   vstupní_soubor   výstupní_soubor

kod1 je kodóvaní ('abeceda') vstupního_souboru a podobně kod2 je kodóvaní výstupního_souboru. kod1 může být jeden z: MK, 1250, 852, iso1, iso2, kam, koi a mac. MK je můj výše popsaný "spřežkový" kód a ty ostatní jsou snad jasné. Jedná se popořadě o kodování MS Windows, MS DOS, UNIX Latin-1 (s mým rozšířením), UNIX Latin-2, Kamenických, prastaré KOI-8, Macintosh a MS UNICODE. kod2 výstupního souboru může kromě hodnot povolených pro kod1 ještě mít tyto hodnoty: asc, latex a latexR. 'asc' je výstup bez diakritiky a 'latex' a 'latexR' vytvoří polotovary pro formátovací program Latex. Velká a malá písmena ve jménech kódování je třeba dodržovat.
(Kromě 'MK' a 'latex' byl v předchozích verzích konvCS ještě další historický formát z doby před existencí webu - 'priPS', který sloužil jako vstup pro můj formátovací program printPS pro PostScriptové tiskárny. Ten byl nahražen mnohem lepším řešením: printPS umí nyní přímo tisknout kódování 'iso2' - ISOLatin2.)

Takže po napsání textu ve formátu MK, prostě vydám příkaz konvCS MK 1250 ... ... a dostanu text ve formátu MS Windows, který pak mohu přímo vystavit na webu. Protože většinou provádím konverzi mezi MK a 1250 a naopak, mám v DOSKEY nadefinované dvě zkratky takto:

DOSKEY ms=konvCS MK 1250 $1 $2
DOSKEY ims=konvCS 1250 MK $1 $2
(Totéž je možno provést v Unixu pomocí aliasů).

Když odněkud dostanu text v libovolném z výše zmíněných kódovaní, mohu si ho nejprve převést do MK např. takto: konvCS iso2 MK vstup vystup, pak upravit v jakémkoliv editoru a nakonec převést do CP1250 takto: konvCS MK 1250 ... (nebo použitím výše definované zkratky ms takto: ms ... ...), kde '...' ve všech případech reprezentují jména příslušných vstupních a výstupních souborů.

printPS i Latex vyžadují postscriptové tiskárny. printPS je velice rychlý, např. soubor v MK formátu je možno rychle vytisknout takto: pomocí konvCS ho převést do 'iso2' a pak vytisknout pomocí printPS -encLatin2 ... > lpt2: za předpokladu, že k portu lpt2: je připojena (nebo na něj mapována) postscriptová tiskárna (na Unixu by místo '> lpt2:' bylo třeba napsat '| lpr -pJméno_tiskárny'). Latex dá lepší výsledky co se týče vzhledu, ale většinou navíc vyžaduje manuální editování mezi aplikací konvCS a programu Latex (to může nyní do značné míry eliminovat nový výstupní formát 'latexR').

Pokud potřebujete český text na papíře, lze ho dnes na libovolném počítači také tisknout přímo z Mozilly, Netscape nebo MSIE, k čemuž navíc stačí jakákoliv tiskárna.

M. Kolář, 21. června 1998
(Poslední verze konvCS: 25. října 2004)