Смешанная кодировка             содержание     указатель     «     »

См. Полные и неполные преобразования

См. Принятые обозначения преобразований

Под смешанной кодировкой понимается неоднократное перекодирование текста с помощью стандартных преобразований из одной кодовой страницы в другую.

Поскольку искаженные тексты получаются, в основном, от прохождения текстов электрописем через разные почтовые серверы, которые могут перекодировать их из одной конкретной кодовой страницы в другую конкретную кодовую страницу, не сильно озадачивая себя тем, в какой именно кодировке поступил текст, в таких случаях и получаются смешанные кодировки. Например, если текст был набран в программе под DOS, в кодировке 866, потупил в ней на сервер, а сервер имеет привычку перекодировать тексты из 866 в KOI-8, то проблемы не возникнет - просто текст пойдет дальше в кодировке KOI-8. Но если текст был написан в кодировке Windows 1251, был перекодирован самой почтовой программой в кодировку KOI-8, то на сервер поступит текст не в 866 кодовой странице, но если сервер все так же будет пытаться перекодировать его из 866 в KOI-8, то текст отправится дальше уже в смешанной кодировке, т.е. WIN->KOI DOS->KOI. А может случиться, что текст набран был не в Windows-кодировке, а в ISO-8859-5. Тогда почтовая программа перекодирует его, как из Win кодировки в KOI, таким образом, текст уже на сервер поступает в смешанной кодировке, и т.д.

В предыдущей версии Штирлица все преобразования, которые проводились в программе, были взаимооднозначными, что было несколько искусственным. Но так как таким образом ни одна другая программа текст не преобразует, для того, чтобы повысить распознавательные способности, в Штирлице введены полные и неполные преобразования в новом их толковании. К сожалению, пришлось отказаться от совместимости с предыдущей версией, чтобы Штирлиц был ближе к реальным ситуациям, и если имеются файлы, закодированные с помощью старой версии, они не обязательно будут раскодироваться новой версией. Новая же версия нацелена на реальные случаи, получающиеся при преобразовании текста другими программами.

См. также пример смешанной кодировки.