Destiny
|
Posted: Sun Mar 17, 2024 13:36 Post subject: |
|
|
little-brother wrote: | https://github.com/little-brother/csvtab-wlx/blob/main/main.c#L1724
По сути в качестве образца достаточно одной строки, где все буквы можно забить одной.
|
к сожалению, всё как-то страннее.... полный файл открывается и UTF-8 без BOM вдруг НЕ определяется....
Обрезаешь файл до первых 10 строк - и при открытии тут же уже видится корректно как UTF-8 без BOM....
Берешь полный файл - и заменяешь ВСЕ буквы одной - и файл тут же при просмотре видится корректно
как UTF-8 без BOM....
P.S. хоспади.... кажись нашел причину... НО! вы походу не неким буфером пытаетесь проверить конвертацию
текста в UTF-8, а всем его объемом? Ошибка просто нашлась на 101 строке. Приблизительно на 9575 байтах.
Стал обрезать постепенно файл и дошел до этой строки. Там было это:
Т.е. буквы `О` не оказалось на своем месте.
Как бы с одной стороны - это реально ошибка входных данных.... Но ведь редакторы-то отрывали этот файл и
этот кусок БЕЗ проблем как верный UTF-8 без BOM. Может все же плагин можно будет обучить этому же трюку? |
|