Полные и неполные преобразования             содержание     указатель     «     »

Насколько можно судить, существует три типа перекодирований:

1.   Полные
2.   Неполные (Частичные)
3.   Искусственные (в программе они называются странными).

Можно также определить такие понятия, как разрушающее и неразрушающее преобразование.

Полными преобразованиями в программе Штирлиц называются такие, при которых все символы, присутствующие в обеих - начальной и конечной кодировках, переходят друг в друга.

Неполные преобразования - это когда перекодируются только символы, соответствующие русским буквам в начальной кодировке.

При этом, в зависимости от того, что делается с остальными символами, которые могут встретиться в тексте, преобразования разделяются на неразрушающие (эти символы остаются такими, какими были) и разрушающие - они заменяются на вопросительные знаки или пробелы, или на какой-то другой символ.

Поскольку в реальной жизни имеют место и полные, и неполные, Штирлиц проверяет оба варианта, если не указано обратное (см. стиль декодирования).

Что касается странных схем, то это схемы, используемые в таких программах, как Mail Reader и Tot Recode (только русские буквы, а остальные символы - в порядке заполнения «пробелов»). В принципе, получаются взаимооднозначные схемы, то есть, например, Dos->Koi Koi->Dos приводит к первоначальному результату, другое дело, что псевдографические символы в Koi заменяются на непонятно что. Вторая версия Штирлица тоже работала примерно на таких схемах, но от этого пришлось отказаться, так как такие преобразования не только полезны, но и вредны.

Но, с одной стороны, в жизни могут встретиться тексты, закодированные этими программами, например, для того, чтобы сделать примеры, «не раскодируемые другими программами», с другой стороны, эти схемы совершенно одинаковы у этих двух широко распространенных программ (с чего бы это? :), а с третьей, в них имеются преобразования типа 1252->437, которых я нигде не встречал (а они могут где-нибудь помочь).

Поэтому в Штирлице добавлена возможность подключать такие схемы при распознавании.