Vica3,
1) в «модной» кодировке UTF-8 один знак может занимать от одного до шести байт, поэтому «сколько байт — столько и знаков» не работает;
2) в тексте есть еще и картинки — картинки в а.л. переводтся исходя из площади, не количества байт;
3) есть еще служебная информация самого файла для «читалок»;
4) файл может быть загзиплен, что в разы уменьшает его объем.
|