Program konvCS, Ver. 1.3 (UNIX, DOS, Windows)

25. října 2004

Učel:   Konverze znaků s diakritikou mezi různými kódováními češtiny a slovenčtiny.
konvCS také konvertuje HTML tag META charset, pokud je ve vstupu obsažen a jeho konverze není vypnuta.

Program používá tyto zkratky jmen kódování:

ZkratkacharsetPopis
MK-Spřežkový pomocný vstupní formát používající ^, ', `
1250windows-1250MS Latin 2 - obvyklé v prostředí MS-Windows
iso2ISO-8859-2ISO Latin 2 - obvyklé v prostředí UNIX
UNIUTF-16MS UNICODE (UCS-2: fixní 2 bajty pro všechny znaky)
852CP852IBM-852 neboli PC Latin 2 (MS-DOS)
macx-mac-ceMacintosh CE s aproximací pro samostatně stojící čárku ´
iso1ISO-8859-1ISO Latin 1 s aproximacemi pro Č,Ď,Ě,Ň,Ů,č,ě,ň,ů
kamx-kam-csKód bratří Kamenických (MS-DOS) s aproximacemi pro samostatně stojící čárku ´ a háček ˇ
koiKOI-8_CS2Kód KOI 8 CS
ascUS-ASCII7-bitový ASCII bez diakritiky
latex-Výstup je vstupem pro LaTeX
latexR-Výstup je vstupem pro LaTeX, který zachovává řádky původního vstupního souboru (přechod na nový řádek a počet mezer a prázdných řádků)


Spouštění z příkazové řádky:
	 konvCS KOD1 KOD2 Vstup Výstup [-notag]

 KOD1 a KOD2 může být: 1250, 852, iso1, iso2, kam, koi, mac, UNI a MK
 KOD2 může být též: asc, latex a latexR

 Vstup a Výstup jsou jména vstupního a výstupního souboru

 -notag je nepovinný parametr, musí být uveden doslovně.
 Jeho uvedení právě vypíná detekci a konverzi HTML META charset tagu.

 Pokud KOD1 = KOD2 a -notag není uveden, konvCS jen zkontroluje
 případný tag
 <META http-equiv="Content-Type" content="text/html; charset=...">.

Pod Linuxem/Unixem je možno jména souborů zaměnit standardním vstupem nebo výstupem, označenými '-'. Je tak možný např. přímý tisk souboru v MK formátu na postscriptové tiskárně:

	konvCS MK iso2 text.MK - | printPS -encLatin2 -... - | lpr -P...
(s poslední verzí printPS z října 2004).

 

Copyright 1998-2004, Miroslav Kolář