Сравниваем две строки побайтово и смотрим разницу.
Национальные символы из UTF разбиваются на байты, это может пугать без подготовки, но это нормально.
Непечатные символы могут не отображаться. И это нормально, поскольку в национальных кодировках символы представлены несколькими байтами и при побайтовом проходе дербаняться на непонятную чухню.
Несовпадающие байты можно определить по единичке в колонке miss.