Program konvCS, Ver. 1.3 (UNIX, DOS, Windows)
25. října 2004
Učel: |
Konverze znaků s diakritikou mezi různými kódováními češtiny a slovenčtiny.
konvCS také konvertuje HTML tag META charset, pokud je ve vstupu obsažen a jeho konverze není vypnuta. |
Program používá tyto zkratky jmen kódování:
Zkratka | charset | Popis |
MK | - | Spřežkový pomocný vstupní formát používající ^, ', ` |
1250 | windows-1250 | MS Latin 2 - obvyklé v prostředí MS-Windows |
iso2 | ISO-8859-2 | ISO Latin 2 - obvyklé v prostředí UNIX |
UNI | UTF-16 | MS UNICODE (UCS-2: fixní 2 bajty pro všechny znaky) |
852 | CP852 | IBM-852 neboli PC Latin 2 (MS-DOS) |
mac | x-mac-ce | Macintosh CE s aproximací pro samostatně stojící čárku ´ |
iso1 | ISO-8859-1 | ISO Latin 1 s aproximacemi pro Č,Ď,Ě,Ň,Ů,č,ě,ň,ů |
kam | x-kam-cs | Kód bratří Kamenických (MS-DOS) s aproximacemi pro samostatně stojící čárku ´ a háček ˇ |
koi | KOI-8_CS2 | Kód KOI 8 CS |
asc | US-ASCII | 7-bitový ASCII bez diakritiky |
latex | - | Výstup je vstupem pro LaTeX |
latexR | - | Výstup je vstupem pro LaTeX, který zachovává
řádky původního vstupního souboru (přechod na nový řádek a počet mezer a prázdných řádků) |
Spouštění z příkazové řádky:
konvCS KOD1 KOD2 Vstup Výstup [-notag]
KOD1 a KOD2 může být: 1250, 852, iso1, iso2, kam, koi, mac, UNI a MK
KOD2 může být též: asc, latex a latexR
Vstup a Výstup jsou jména vstupního a výstupního souboru
-notag je nepovinný parametr, musí být uveden doslovně.
Jeho uvedení právě vypíná detekci a konverzi HTML META charset tagu.
Pokud KOD1 = KOD2 a -notag není uveden, konvCS jen zkontroluje
případný tag
<META http-equiv="Content-Type" content="text/html; charset=...">.
Pod Linuxem/Unixem je možno jména souborů zaměnit standardním vstupem
nebo výstupem, označenými '-'. Je tak možný např. přímý tisk souboru
v MK formátu na postscriptové tiskárně:
konvCS MK iso2 text.MK - | printPS -encLatin2 -... - | lpr -P...
(s poslední verzí printPS z října 2004).
Copyright 1998-2004, Miroslav Kolář
|