Неочевидные ловушки File I/O в старых системах

История о том, как казалось бы простая операция записи в файл может привести к неожиданным результатам, уходит корнями в ранние реализации C и UNIX. Проблема заключается в поведении стандартной библиотеки C при переключении между чтением и записью в одном и том же файловом потоке. Исторически, в ранних версиях UNIX и C смешивание операций чтения и записи в одном файловом потоке было не предусмотрено, что и привело к неоднозначному поведению, зафиксированному в стандартах.
Неочевидные ловушки File I/O в старых системах
Изображение носит иллюстративный характер

Ранние реализации библиотек C не предоставляли прямого способа обновления файла ("r+"). Вместо этого, для добавления новых данных в конец файла происходило открытие, запись, закрытие файла. Когда нужно было перезаписать данные, то приходилось открывать файл заново, что приводило к неконсистентности поведения, особенно при работе с файлами, содержащими управляющие символы, такие как Ctrl-Z, которые интерпретировались как конец файла.

Проблема, которая проявилась при записи в файл посредством команд DOS, обнаружила, что файловые операции могут завершаться без ошибок, но при этом не записывать данные. Странное поведение с fwrite(), когда она «сообщала», что записала ноль байтов при попытке добавления в файл, особенно характерно для более старых реализаций C, вроде Microsoft Visual C++ 6.0 и IBM C/C++ 3.6, которые следовали консервативным подходам стандартов C.

Современные системы (например, Linux и FreeBSD) допускают свободное смешивание чтения и записи, но для обеспечения переносимости, программистам, работающим со стандартом ISO C, необходимо явным образом указывать намерение переключаться между чтением и записью, используя такие механизмы, как fseek или fflush, чтобы гарантировать консистентность данных и поведение программы в разных операционных системах и компиляторах. Подобные «странности» являются напоминанием о том, что при работе с низкоуровневыми операциями ввода-вывода, необходимо учитывать исторический контекст и стандарты, которые, при кажущейся простоте, могут содержать неочевидные ловушки.


Новое на сайте