Чтение и запись в файл

Содержание

Вступление
std::shared_mutex
std::shared_timed_mutex
std::shared_lock
Теги
Открытие файла
Чтение/запись файла
Чтение/запись сложных объектов за один системный вызов
Закрытие файла
Установка смещения в файле
Манипулирование файловыми дескрипторами
Файловый указатель
Произвольный доступ к файлам с помощью seekg() и seekp()
Одновременные чтение и запись файла с помощью fstream
Другие полезные функции работы с файлами
Предупреждение о записи указателей на диск
Теги
Чтение файла в контейнер
Запись информации в файл
Чтение и запись в бинарном режиме доступа
Копирование файла
Задания для самоподготовки
Видео по теме
Чтение `struct` из форматированного текстового файла.
Чтение из файла
Запись в файл
Промывка потока
Чтение информации из файла
Чтение файла ASCII в строку std
Проверка конца файла внутри условия цикла, неправильная практика?
Открытие файла
Закрытие файла
Запись файлов с нестандартными языковыми настройками
Режимы открытия

Вступление

C ++-файл ввода-вывода выполняется через потоки . Ключевыми абстракциями являются:

std::istream для чтения текста.

std::ostream для std::ostream текста.

std::streambuf для чтения или записи символов.

В форматированном вводе используется operator>> .

Форматированный вывод использует operator<< .

В потоках используется std::locale , например, для подробностей форматирования и для перевода между внешними кодировками и внутренней кодировкой.

Подробнее о потоках: <iostream> Library

На этом занятии
мы поговорим, как в Python можно считывать информацию из файлов и
записывать ее в файлы. Что такое файлы и зачем они нужны, думаю объяснять не
надо, т.к. если вы дошли до этого занятия, значит, проблем с пониманием таких
базовых вещей у вас нет. Поэтому сразу перейдем к функции

через которую и
осуществляется работа с файлами. Здесь

file – это путь к
файлу вместе с его именем;
mode – режим доступа
к файлу;
encoding
– кодировка
файла.

Для начала определимся с понятием «путь
к файлу». Представим, что наш файл ex1.py находится в
каталоге app:

Тогда, чтобы
обратиться к файлу my_file.txt путь можно
записать так:

Последние два
варианта представляют собой абсолютный путь к файлу, то есть, полный путь,
начиная с указания диска. Причем, обычно используют обратный слеш в качестве
разделителя: так короче писать и такой путь будет корректно восприниматься как
под ОС Windows, так и Linux. Первый же
вариант – это относительный путь, относительно рабочего каталога.

Теперь,
предположим, мы хотим обратиться к файлу img.txt. Это можно
сделать так:

Для доступа к out.txt пути будут
записаны так:

Обратите
внимание, здесь две точки означают переход к родительскому каталогу, то есть,
выход из каталога app на один уровень вверх.

И, наконец, для
доступа к файлу prt.dat пути запишутся так:

Вот так следует
прописывать пути к файлам. В нашем случае мы имеем текстовый файл «myfile.txt», который
находится в том же каталоге, что и программа ex1.py, поэтому путь
можно записать просто указав имя файла:

В результате
переменная file будет ссылаться
на файловый объект, через который и происходит работа с файлами. Если указать
неверный путь, например, так:

то возникнет
ошибка FileNotFoundError. Это
стандартное исключение и как их обрабатывать мы с вами говорили на предыдущем
занятии. Поэтому, запишем этот критический код в блоке try:

:
    FileNotFoundError:
    "Невозможно открыть файл"

Изменим имя
файла на верное и посмотрим, как далее можно с ним работать. По умолчанию
функция open открывает файл в
текстовом режиме на чтение. Это режим

mode = “r”

Если нам нужно
поменять режим доступа к файлу, например, открыть его на запись, то это явно
указывается вторым параметром функции open:

В Python имеются
следующие режимы доступа:

Здесь мы имеем
три основных режима доступа: на чтение, запись и добавление. И еще три
возможных расширения этих режимов, например,

‘rt’ – чтение в
текстовом режиме;
‘wb’ – запись в
бинарном режиме;
‘a+’ – дозапись
или чтение данных из файла.

Добавлено 22 декабря 2021 в 01:39

`std::shared_mutex`

общий доступ – несколько потоков могут совместно владеть одним и тем же мьютексом;
эксклюзивный доступ (исключительная блокировка) – только один поток может владеть мьютексом.

Если один поток получил эксклюзивный доступ (через lock, try_lock), то никакие другие потоки не могут получить блокировку (включая общую).

Только если исключительная блокировка не была получена ни одним потоком, общая блокировка может быть получена несколькими потоками.

В пределах одного потока одновременно может быть получена только одна блокировка (общая или эксклюзивная).

#include <iostream>
#include <mutex> // для std::unique_lock
#include <shared_mutex>
#include <thread>
class ThreadSafeCounter { public: ThreadSafeCounter() = default; // Значение счетчика могут считывать несколько читающих потоков одновременно. unsigned int get() const { std::shared_lock lock(mutex_); return value_; } // Увеличивать/записывать может только один записывающий поток. void increment() { std::unique_lock lock(mutex_); value_++; } // Сбрасывать/записывать может только один записывающий поток. void reset() { std::unique_lock lock(mutex_); value_ = 0; } private: mutable std::shared_mutex mutex_; unsigned int value_ = 0;
};
int main() { ThreadSafeCounter counter; auto increment_and_print = [&counter]() { for (int i = 0; i < 3; i++) { counter.increment(); std::cout << std::this_thread::get_id() << ' ' << counter.get() << '\n'; // Примечание. Запись в std::cout на самом деле также должна быть синхронизирована // другим std::mutex. Это было опущено, чтобы не сохранить пример небольшим. } }; std::thread thread1(increment_and_print); std::thread thread2(increment_and_print); thread1.join(); thread2.join();
}

`std::shared_timed_mutex`

`std::shared_lock`

Для работы с условными переменными можно использовать std::condition_variable_any (std::condition_variable требует std::unique_lock и поэтому поддерживает только исключительное владение).

Работа с содержимым файла происходит через целочисленный файловый дескриптор, который представляет из себя номер строки в таблице ссылок на открытые файлы процесса.

При открытии файла в вызове ядра open() проверяются соответствие флагов и прав доступа к файлу.

//почти псевдокод
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
int fd;
int flags;
mode_t mode;
// открытие (+создание) файла
fd=open("pathname", flags, mode);
//или
fd=creat("pathname", mode);
// при открытии существующего файла можно опустить параметр mode
fd=open("pathname", flags);

mode – права доступа к файлу, назначаемые в момент его создания. Чтобы нельзя было случайно создать файл со слишком свободным доступом, при создании файла производится побитовое умножение mode на битовую маску umask (mode & ~umask). mode и _umask__ удобно задавать в восьмеричном виде считая, что классические права доступа rwx соответствуют одной восьмеричной цифре. Например, права доступа rwxr-xr– запишутся в восьмеричном виде как 0754. Типичная маска выглядит так —w–w- или 022в восьмеричной записи. Такая маска отбирает права на запись у группы и остальных.

Системный вызов umask(mask) устанавливает новую маску и возвращает старую.

#include <sys/types.h>
#include <sys/stat.h>
mode_t old_mask=umask(new_mask);

Для удобства записи прав доступа существуют мнемонические макросы:

flags – флаги уточняющие режим открытия файла. Флаги делятся на несколько групп:

режим доступа: O_RDONLY, O_WRONLY, O_RDWR, O_WRONLY+O_APPEND(чтение,запись, чтение+запись, запись всегда в конец файла);
режим создания – O_CREAT, O_CREAT+O_EXCL, O_TRUNC (создавать файл, создавать только если не существует, обрезать существующий до нулевой длины);
прочие O_NOFOLLOW, O_CLOEXEC, O_NOCTTY (не открывать символические ссылки, закрывать при вызове exec, не рассматривать открытый файл как управляющий терминал CTTY=Control TeleTYpe).

При ошибке открытия файла возвращается -1 и в переменную errno заносится код ошибки. Возможные значения ошибки (не все):

EACCES – нет прав на сам файл или на поиск в каталоге в котором он находится;
ENOENT – файл не существует и не указан флаг O_CREAT;
EEXIST – файл существует и указаны флаги O_CREAT+O_EXCL;
EFAULT – плохой указатель на имя файла (например NULL);
EISDIR – попытка открыть каталог;
ELOOP – символические ссылки создали кольцо в структуре каталогов.

Чтение/запись файла

#include <unistd.h>
// чтение/запись определенного числа байт
int fd
char buf[SIZE];
size_t count=SIZE;
ssize_t res;
res=read (fd, buf, count);
res=write(fd, buf, count);

Чтение и запись возвращают количество прочитанных/записанных байтов или -1. -1 не всегда означает ошибку.

Возможные варианты ответа при записи:

число от 0 до count – число реально записанных байтов;
-1 – ошибка. Если errno при ошибке выставлено в EAGAIN, EWOULDBLOCK или EINTR , то операцию можно повторить см. ниже.

Возможные варианты ответа при чтении:

число от 1 до count – число реально записанных байтов;
0 – признак конца файла
-1 – ошибка. Если errno при ошибке выставлено в EAGAIN, EWOULDBLOCK или EINTR , то операцию можно повторить см. ниже.

EAGAIN или EWOULDBLOCK (только для сокетов) – не удалось провести неблокирующее чтение/запись для файла (сокета),
открытого в режиме O_NONBLOCK;
EINTR – операция чтения/записи была прервана доставкой сигнала до того, как удалось прочитать/записать хотя бы один байт;
EBADF – плохой дескриптор файла (файл закрыт);
EINVAL – неверный режим доступа к файлу (чтение вместо записи или наоборот);
EFAULT – неверный указатель на буфер (например NULL).

Чтение/запись сложных объектов за один системный вызов

Чтение/запись из/в фрагментированной памяти

struct iovec { void *iov_base; /* Starting address */ size_t iov_len; /* Number of bytes to transfer */
} iov[SIZE];
res=readv (fd, iov, SIZE);
res=writev(fd, iov, SIZE);

Чтение/запись в определенную позицию. offset – смещение в байтах относительно начала файла.

res=pread (fd, buf, count, offset);
res=pwrite(fd, buf, count, offset);
res=preadv (fd, iov, int iovcnt, offset);
res=pwritev(fd, iov, int iovcnt, offset);

Закрытие файла

// закрытие файла
int retval=close(fd);

Ошибки при закрытии файла встречаются редко, но встречаются.

EBADF – попытка закрыть файловый дескриптор, не связанный с открытым файлом;
EINTR – операция прервана доставкой сигнала. Может встретиться на медленных (например сетевых) ФС;
EIO – ошибка нижележащей системы ввода/вывода. Например обрыв соединения с файловым сервером.

Установка смещения в файле

Для установки позиции/чтения записи в файле используются два параметра offset – смещение в байтах и whence – место от которого отсчитывается смещение. Возможные значения whence:

SEEK_SET – от начала файла;
SEEK_CUR – от текущей позиции;
SEEK_END – от конца файла.

#include <sys/types.h>
#include <unistd.h>
// установка позиции чтения/записи
off_t offset=100;
int whence=SEEK_END;
off_t pos=lseek(fd, offset, whence);

Возвращается установленная позиция или -1 в случае ошибки.

Сочетание offset=0 и whence=SEEK_CUR позволяет узнать текущую позицию чтения/записи.

С помощью lseek возможно перемещение указателя записи за конец файла. Многие ФС в такой ситуации не выделяют блоки хранения под пропущенные байты и создают “дырявые” файлы, занимающие на диске пространство меньше своей длины.

int fd=open("/tmp/sparse-file", O_WRONLY|O_CREAT|O_TRUNC, 0700);
off_t pos=lseek(fd, 1000000000, SEEK_SET);
int res=write(fd,"c",1);

В данном примере создаётся файл длиной примерно 1 ГБ, занимающий на диске один блок данных (например 512 Б).

В 32-х разрядных системах могут быть проблемы с большими файлами. В этом случае надо использовать вызов lseek64 и некоторые дополнительные трюки.

Манипулирование файловыми дескрипторами

Возможно создание ссылки на файловый дескриптор.

#include <unistd.h>
int fd1=dup(oldfd);
int fd2=dup2(oldfd, newfd);

dup() – выбирает в таблице открытых файлов первую свободную строку и записывает ссылку на oldfd в неё, dup2() – закрывает файл, связанный с дескриптором newfd (если он был открыт) и записывает ссылку oldfd в newfd. В случае успеха возвращается файловый дескриптор, в случае ошибки -1.

В связи с тем, что в таблицу открытых файлов вписывается именно ссылка, у файловых дескрипторов oldfd и newfd всегда будет одна и та же позиция головки чтения/записи.

Типичное применение dup2() – это подмена стандартных дескрипторов 0,1,2 (stdin,stdout,stderr). oldfd в этом случае закрывается после создания ссылки. dup2() предпочтительнее чем dup(), т.к. выполняется атомарно, что может быть важно в многопоточной среде.

int newfd=open("file",O_RDONLY);
dup2(newfd,0);
close(newfd);

вариант с dup()

int newfd=open("file",O_RDONLY);
close(0);
dup(newfd);
close(newfd);

Добавлено 12 октября 2021 в 23:17

Файловый указатель

Каждый класс файлового потока содержит файловый указатель, который используется для отслеживания текущей позиции чтения/записи в файле. Когда что-то читается или записывается в файл, чтение/запись происходит в текущем местоположении этого файлового указателя. По умолчанию при открытии файла для чтения или записи файловый указатель устанавливается на начало файла. Однако если файл открывается в режиме добавления, файловый указатель перемещается в конец файла, и поэтому какое-либо текущее содержимое файла не перезаписывается.

Произвольный доступ к файлам с помощью `seekg()` и `seekp()`

Произвольный доступ к файлу осуществляется путем манипулирования файловым указателем с помощью функции seekg() (для ввода) и функции seekp() (для вывода). Если вам интересно, g означает «get» (получить), а p – «put» (положить). Для некоторых типов потоков seekg() (изменение позиции чтения) и seekp() (изменение позиции записи) работают независимо, однако с файловыми потоками позиции чтения и записи всегда идентичны, поэтому seekg и seekp могут использоваться взаимозаменяемо.

Функции seekg() и seekp() принимают два параметра. Первый параметр – это смещение, определяющее, на сколько байтов переместить файловый указатель. Второй параметр – это флаг ios, который указывает, от чего должен быть смещен параметр смещения.

Положительное смещение означает перемещение файлового указателя к концу файла, тогда как отрицательное смещение означает перемещение файлового указателя к началу файла.

Вот несколько примеров:

inf.seekg(14, ios::cur); // перейти вперед на 14 байтов
inf.seekg(-18, ios::cur); // перейти назад на 18 байтов
inf.seekg(22, ios::beg); // перейти к 22-му байту в файле
inf.seekg(24); // перейти к 24-му байту в файле
inf.seekg(-28, ios::end); // перейти к 28-му байту с конца файла

inf.seekg(0, ios::beg); // перейти к началу файла
inf.seekg(0, ios::end); // перейти в конец файла

Давайте рассмотрим пример, используя seekg() и входной файл, который мы создали в прошлом уроке. Этот входной файл выглядит так:

This is line 1
This is line 2
This is line 3
This is line 4

А вот сам пример:

int main()
{ std::ifstream inf{ "Sample.dat" }; // Если мы не смогли открыть входной файловый поток для чтения if (!inf) { // Распечатываем ошибку и выходим std::cerr << "Uh oh, Sample.dat could not be opened for reading!\n"; return 1; } std::string strData; inf.seekg(5); // переход к 5-му символу // Получаем оставшуюся часть строки и распечатываем ее getline(inf, strData); std::cout << strData << '\n'; inf.seekg(8, ios::cur); // перемещаемся вперед еще на 8 байтов // Получаем оставшуюся часть строки и распечатываем ее std::getline(inf, strData); std::cout << strData << '\n'; inf.seekg(-15, ios::end); // перемещаемся на 15 байт от конца файла // Получаем оставшуюся часть строки и распечатываем ее std::getline(inf, strData); std::cout << strData << '\n'; return 0;
}

Этот код дает следующий результат:

is line 1
line 2
his is line 4

Примечание. Некоторые компиляторы содержат ошибки в реализации seekg() и seekp() при использовании вместе с текстовыми файлами (из-за буферизации). Если ваш компилятор является одним из них (о чем вы узнаете, если ваш вывод будет отличаться от приведенного выше), вы можете вместо этого попробовать открыть файл в двоичном режиме:

ifstream inf("Sample.dat", ifstream::binary);

Еще две полезные функции – это tellg() и tellp(), которые возвращают абсолютную позицию файлового указателя. Их можно использовать для определения размера файла:

std::ifstream inf("Sample.dat");
inf.seekg(0, std::ios::end); // перейти в конец файла
std::cout << inf.tellg();

Этот код печатает:

Это длина файла sample.dat в байтах (при условии возврата каретки после последней строки).

Одновременные чтение и запись файла с помощью `fstream`

// предполагаем, что iofile - это объект типа fstream
iofile.seekg(iofile.tellg(), ios::beg); // переходим к текущей позиции в файле

Если вы этого не сделаете, может произойти множество странных и причудливых вещей.

Примечание: хотя может показаться, что iofile.seekg(0, ios::cur) также будет работать, похоже, что некоторые компиляторы могут оптимизировать этот вызов.

Еще одна хитрость: в отличие от ifstream, где мы могли бы сказать while(inf), чтобы определить, есть ли что-то еще для чтения, с fstream это работать не будет.

Давайте напишем пример файлового ввода/вывода с помощью fstream. Мы собираемся написать программу, которая открывает файл, читает его содержимое и заменяет любые найденные гласные на символ ‘#‘.

int main()
{ // Обратите внимание, что мы должны указать как in, // так и out, потому что мы используем fstream std::fstream iofile{ "Sample.dat", ios::in | ios::out }; // Если не удалось открыть iofile, выводим ошибку if (!iofile) { // Распечатываем ошибку и выходим std::cerr << "Uh oh, Sample.dat could not be opened!\n"; return 1; } char chChar{}; // мы собираемся выполнить задачу посимвольно // Пока есть данные для обработки while (iofile.get(chChar)) { switch (chChar) { // Если найдем гласную case 'a': case 'e': case 'i': case 'o': case 'u': case 'A': case 'E': case 'I': case 'O': case 'U': // Возвращаемся на один символ iofile.seekg(-1, std::ios::cur); // Поскольку мы выполнили переход, // теперь мы можем безопасно выполнить запись, // поэтому давайте перезапишем гласную символом # iofile << '#'; // Теперь мы хотим вернуться в режим чтения, // чтобы следующий вызов get() сработал правильно. // Мы вызовем seekg() для текущего местоположения, // потому что не хотим перемещать файловый указатель. iofile.seekg(iofile.tellg(), std::ios::beg); break; } } return 0;
}

Другие полезные функции работы с файлами

Чтобы удалить файл, просто используйте функцию remove().

Функция is_open() вернет true, если поток в данный момент открыт, и false в противном случае.

Предупреждение о записи указателей на диск

Хотя потоковая передача переменных в файл довольно проста, всё становится сложнее, когда вы имеете дело с указателями. Помните, что указатель просто содержит адрес переменной, на которую он указывает. Хотя адреса можно читать и записывать на диск, это чрезвычайно опасно. Это связано с тем, что адрес переменной при каждом выполнении может различаться. Следовательно, хотя переменная могла существовать по адресу 0x0012FF7C, когда вы записывали этот адрес на диск, она может больше не находиться там, когда вы читаете этот адрес обратно!

Например, предположим, что у вас есть целое число с именем nValue, которое находится по адресу 0x0012FF7C. Вы присвоили nValue значение 5. Вы также объявили указатель с именем *pnValue, который указывает на nValue. pnValue содержит адрес nValue – 0x0012FF7C. Вы хотите сохранить их на потом, поэтому вы записываете на диск значение 5 и адрес 0x0012FF7C.

Через несколько недель вы снова запускаете программу и считываете эти значения с диска. Вы считываете значение 5 в другую переменную с именем nValue, которая находится по адресу 0x0012FF78. Вы считываете адрес 0x0012FF7C в новый указатель с именем *pnValue. Поскольку pnValue теперь указывает на 0x0012FF7C, а nValue находится на 0x0012FF78, pnValue больше не указывает на nValue, и попытка доступа к pnValue приведет к проблемам.

Правило: Не записывайте адреса в файлы. Переменные, которые изначально находились по этим адресам, могут находиться уже по другим адресам, когда вы будете считывать их значения обратно с диска, и эти адреса будут недействительными.

Чтение файла в контейнер

В приведенном ниже примере мы используем std::string и operator>> для чтения элементов из файла.

 std::ifstream file("file3.txt"); std::vector<std::string> v; std::string s; while(file >> s) // keep reading until we run out { v.push_back(s); }

В приведенном выше примере мы просто итерации через файл, читающий один «элемент» за раз, используя operator>> . Этот же std::istream_iterator может быть достигнут с помощью std::istream_iterator который является итератором ввода, который считывает один «элемент» за раз из потока. Также большинство контейнеров можно построить с использованием двух итераторов, чтобы мы могли упростить приведенный выше код:

 std::ifstream file("file3.txt"); std::vector<std::string> v(std::istream_iterator<std::string>{file}, std::istream_iterator<std::string>{});

Мы можем расширить это, чтобы прочитать любые типы объектов, которые нам нравятся, просто указав объект, который мы хотим прочитать как параметр шаблона, для std::istream_iterator . Таким образом, мы можем просто расширить сказанное выше, чтобы читать строки (а не слова) следующим образом:

// Unfortunately there is no built in type that reads line using >>
// So here we build a simple helper class to do it. That will convert
// back to a string when used in string context.
struct Line
{ // Store data here std::string data; // Convert object to string operator std::string const&() const {return data;} // Read a line from a stream. friend std::istream& operator>>(std::istream& stream, Line& line) { return std::getline(stream, line.data); }
}; std::ifstream file("file3.txt"); // Read the lines of a file into a container. std::vector<std::string> v(std::istream_iterator<Line>{file}, std::istream_iterator<Line>{});

Запись информации в файл

Теперь давайте
посмотрим, как происходит запись информации в файл. Во-первых, нам нужно
открыть файл на запись, например, так:

и далее вызвать
метод write:

В результате у
нас будет создан файл out.txt со строкой «Hello World!». Причем, этот
файл будет располагаться в том же каталоге, что и файл с текстом программы на Python.

Далее сделаем
такую операцию: запишем метод write следующим
образом:

И снова выполним
эту программу. Смотрите, в нашем файле out.txt прежнее
содержимое исчезло и появилось новое – строка «Hello». То есть,
когда мы открываем файл на запись в режимах

w, wt, wb,

то прежнее
содержимое файла удаляется. Вот этот момент следует всегда помнить.

Теперь
посмотрим, что будет, если вызвать метод write несколько раз
подряд:

    .    .
    .

Смотрите, у нас
в файле появились эти строчки друг за другом. То есть, здесь как и со
считыванием: объект file записывает информацию, начиная с текущей файловой
позиции, и автоматически перемещает ее при выполнении метода write.

Если мы хотим
записать эти строчки в файл каждую с новой строки, то в конце каждой пропишем
символ переноса строки:

   .
   . .

Далее, для
дозаписи информации в файл, то есть, записи с сохранением предыдущего
содержимого, файл следует открыть в режиме ‘a’:

Тогда, выполняя
эту программу, мы в файле увидим уже шесть строчек. И смотрите, в зависимости
от режима доступа к файлу, мы должны использовать или методы для записи, или
методы для чтения. Например, если вот здесь попытаться прочитать информацию с
помощью метода read:

то возникнет
ошибка доступа. Если же мы хотим и записывать и считывать информацию, то можно воспользоваться
режимом a+:

Так как здесь
файловый указатель стоит на последней позиции, то для считывания информации,
поставим его в самое начало:

   .
    .

А вот запись
данных всегда осуществляется в конец файла.

Следующий
полезный метод для записи информации – это writelines:

Он записывает
несколько строк, указанных в коллекции. Иногда это бывает удобно, если в
процессе обработки текста мы имеем список и его требуется целиком поместить в
файл.

Чтение и запись в бинарном режиме доступа

Что такое
бинарный режим доступа? Это когда данные из файла считываются один в один без
какой-либо обработки. Обычно это используется для сохранения и считывания
объектов. Давайте предположим, что нужно сохранить в файл вот такой список:

books "Мастер и Маргарита"

Откроем файл на
запись в бинарном режиме:

Далее, для работы
с бинарными данными подключим специальный встроенный модуль pickle:

И вызовем него
метод dump:

Все, мы
сохранили этот объект в файл. Теперь прочитаем эти данные. Откроем файл на
чтение в бинарном режиме:

и далее вызовем
метод load модуля pickle:

Все, теперь
переменная bs ссылается на
эквивалентный список:

Аналогичным
образом можно записывать и считывать сразу несколько объектов. Например, так:

 
book1
book2
book3 "Мастер и Маргарита"
book4
 
:
   
 
    :
        .book1
        .book2
        .book3
        .book4
 
    :
        .
  FileNotFoundError:
    "Невозможно открыть файл"

А, затем,
считывание в том же порядке:

    b1 .
    b2 .
    b3 .
    b4 .
 
     b1 b2 b3 b4 sep

Вот так в Python выполняется
запись и считывание данных из файла.

Копирование файла

std::ifstream src("source_filename", std::ios::binary);
std::ofstream dst("dest_filename", std::ios::binary);
dst << src.rdbuf();

C ++ 17

С C ++ 17 стандартным способом копирования файла является заголовок <filesystem> и использование copy_file :

std::fileystem::copy_file("source_filename", "dest_filename");

Библиотека файловой системы была первоначально разработана как boost.filesystem и, наконец, объединена с ISO C ++ с C ++ 17.

Задания для самоподготовки

1. Выполните
считывание данных из текстового файла через символ и записи прочитанных данных
в другой текстовый файл. Прочитывайте так не более 100 символов.

2. Пользователь
вводит предложение с клавиатуры. Разбейте это предложение по словам (считать,
что слова разделены пробелом) и сохраните их в столбец в файл.

3. Пусть имеется
словарь:

Необходимо
каждый элемент этого словаря сохранить в бинарном файле как объект. Затем,
прочитать этот файл и вывести считанные объекты в консоль.

Видео по теме

Чтение `struct` из форматированного текстового файла.

C ++ 11

struct info_type
{ std::string name; int age; float height; // we define an overload of operator>> as a friend function which // gives in privileged access to private data members friend std::istream& operator>>(std::istream& is, info_type& info) { // skip whitespace is >> std::ws; std::getline(is, info.name); is >> info.age; is >> info.height; return is; }
};
void func4()
{ auto file = std::ifstream("file4.txt"); std::vector<info_type> v; for(info_type info; file >> info;) // keep reading until we run out { // we only get here if the read succeeded v.push_back(info); } for(auto const& info: v) { std::cout << " name: " << info.name << '\n'; std::cout << " age: " << info.age << " years" << '\n'; std::cout << "height: " << info.height << "lbs" << '\n'; std::cout << '\n'; }
}

Wogger Wabbit
2
6.2
Bilbo Baggins
111
81.3
Mary Poppins
29
154.8

name: Wogger Wabbit age: 2 years
height: 6.2lbs
name: Bilbo Baggins age: 111 years
height: 81.3lbs
name: Mary Poppins age: 29 years
height: 154.8lbs

Чтение из файла

Существует несколько способов чтения данных из файла.

Если вы знаете, как форматируются данные, вы можете использовать оператор извлечения потока ( >> ). Предположим, у вас есть файл с именем foo.txt, который содержит следующие данные:

John Doe 25 4 6 1987
Jane Doe 15 5 24 1976

Затем вы можете использовать следующий код для чтения этих данных из файла:

// Define variables.
std::ifstream is("foo.txt");
std::string firstname, lastname;
int age, bmonth, bday, byear;
// Extract firstname, lastname, age, bday month, bday day, and bday year in that order.
// Note: '>>' returns false if it reached EOF (end of file) or if the input data doesn't
// correspond to the type of the input variable (for example, the string "foo" can't be
// extracted into an 'int' variable).
while (is >> firstname >> lastname >> age >> bmonth >> bday >> byear) // Process the data that has been read.

Оператор извлечения потока >> извлекает каждый символ и останавливается, если он находит символ, который нельзя сохранить, или если он является особым символом:

Для типов строк оператор останавливается в пробеле ( ) или в новой строке ( \n ).
Для чисел оператор останавливается с символом, отличным от числа.

Это означает, что следующая версия файла foo.txt также будет успешно прочитана предыдущим кодом:

John
Doe 25
4 6 1987
Jane
Doe
15 5
24
1976

Оператор извлечения потока >> всегда возвращает переданный ему поток. Поэтому несколько операторов могут быть соединены друг с другом, чтобы читать данные последовательно. Тем не менее, поток также может быть использован в качестве логического выражения (как показано в while петли в предыдущем коде). Это связано с тем, что классы потоков имеют оператор преобразования для типа bool . Этот оператор bool() вернет true пока поток не имеет ошибок. Если поток переходит в состояние ошибки (например, поскольку больше не может быть извлечено данных), то оператор bool() вернет false . Таким образом, в while цикл в предыдущем коде будет после того, как вышел из входного файла был прочитан до конца.

Если вы хотите прочитать весь файл в виде строки, вы можете использовать следующий код:

// Opens 'foo.txt'.
std::ifstream is("foo.txt");
std::string whole_file;
// Sets position to the end of the file.
is.seekg(0, std::ios::end);
// Reserves memory for the file.
whole_file.reserve(is.tellg());
// Sets position to the start of the file.
is.seekg(0, std::ios::beg);
// Sets contents of 'whole_file' to all characters in the file.
whole_file.assign(std::istreambuf_iterator<char>(is), std::istreambuf_iterator<char>());

Этот код резервирует пространство для string , чтобы сократить ненужные распределения памяти.

Если вы хотите прочитать файл по строкам, вы можете использовать функцию getline() :

std::ifstream is("foo.txt");
// The function getline returns false if there are no more lines.
for (std::string str; std::getline(is, str);) { // Process the line that has been read.
}

Если вы хотите прочитать фиксированное количество символов, вы можете использовать функцию члена потока read() :

std::ifstream is("foo.txt");
char str[4];
// Read 4 characters from the file.
is.read(str, 4);

После выполнения команды чтения, вы всегда должны проверить , если состояние ошибки флаг failbit был установлен, поскольку он указывает на то удалось ли операция или нет. Это можно сделать, вызвав функцию члена файлового потока fail() :

is.read(str, 4); // This operation might fail for any reason.
if (is.fail()) // Failed to read!

Запись в файл

Существует несколько способов записи в файл. Самый простой способ – использовать поток выходных файлов ( ofstream ) вместе с оператором вставки потока ( << ):

std::ofstream os("foo.txt");
if(os.is_open()){ os << "Hello World!";
}

Вместо « << вы также можете использовать функцию члена потока выходного файла write() :

std::ofstream os("foo.txt");
if(os.is_open()){ char data[] = "Foo"; // Writes 3 characters from data -> "Foo". os.write(data, 3);
}

После записи в поток, вы всегда должны проверить , если состояние ошибки флаг badbit был установлен, поскольку он указывает на то удалось ли операция или нет. Это можно сделать, вызвав функцию члена потока выходного файла bad() :

os << "Hello Badbit!"; // This operation might fail for any reason.
if (os.bad()) // Failed to write!

Промывка потока

Потоки файлов по умолчанию буферизуются, как и многие другие типы потоков. Это означает, что запись в поток не может привести к немедленному изменению базового файла. Чтобы заставить все буферизованные записи совершать сразу, вы можете очистить поток. Вы можете сделать это напрямую, вызывая метод flush() или с помощью манипулятора std::flush stream:

std::ofstream os("foo.txt");
os << "Hello World!" << std::flush;
char data[3] = "Foo";
os.write(data, 3);
os.flush();

Существует поток манипулятор std::endl который объединяет запись новой строки с потоком потока:

// Both following lines do the same thing
os << "Hello World!\n" << std::flush;
os << "Hello world!" << std::endl;

Буферизация может улучшить производительность записи в поток. Поэтому приложения, выполняющие много писем, должны избегать излишней очистки. Напротив, если операции ввода-вывода выполняются нечасто, приложения должны часто промывать, чтобы избежать застревания данных в объекте потока.

Чтение информации из файла

В чем отличие
текстового режима от бинарного мы поговорим позже, а сейчас откроем файл на
чтение в текстовом режиме:

и прочитаем его
содержимое с помощью метода read:

В результате, получим
строку, в которой будет находиться прочитанное содержимое. Действительно, в
этом файле находятся эти строчки из поэмы Пушкина А.С. «Медный всадник». И
здесь есть один тонкий момент. Наш текстовый файл имеет кодировку Windows-1251 и эта
кодировка используется по умолчанию в функции read. Но, если
изменить кодировку файла, например, на популярную UTF-8, то после
запуска программы увидим в консоли вот такую белиберду. Как это можно
исправить, не меняя кодировки самого файла? Для этого следует воспользоваться
именованным параметром encoding и записать метод open вот так:

 encoding

Теперь все будет
работать корректно. Далее, в методе read мы можем
указать некий числовой аргумент, например,

Тогда из файла будут
считаны первые два символа. И смотрите, если мы запишем два таких вызова
подряд:

. .

то увидим, что
при следующем вызове метод read продолжил читать следующие два символа.
Почему так произошло? Дело в том, что у файлового объекта, на который ссылается
переменная file, имеется
внутренний указатель позиции (file position), который
показывает с какого места производить считывание информации.

Когда мы
вызываем метод read(2) эта позиция автоматически сдвигается от начала
файла на два символа, т.к. мы именно столько считываем. И при повторном вызове read(2) считывание
продолжается, т.е. берутся следующие два символа. Соответственно, позиция файла
сдвигается дальше. И так, пока не дойдем до конца.

Но мы в Python можем управлять
этой файловой позицией с помощью метода

Например, вот такая запись:

будет означать,
что мы устанавливаем позицию в начало и тогда такие строчки:

 .
. .

будут считывать
одни и те же первые символы. Если же мы хотим узнать текущую позицию в файле,
то следует вызвать метод tell:

pos . pos

Следующий
полезный метод – это readline позволяет построчно считывать
информацию из текстового файла:

s . s

Здесь концом
строки считается символ переноса ‘\n’, либо конец файла. Причем, этот
символ переноса строки будет также присутствовать в строке. Мы в этом можем
убедиться, вызвав дважды эту функцию:

    .
    .

Здесь в консоли
строчки будут разделены пустой строкой. Это как раз из-за того, что один
перенос идет из прочитанной строки, а второй добавляется самой функцией print. Поэтому, если
их записать вот так:

    . end
    . end

то вывод будет
построчным с одним переносом.

Если нам нужно
последовательно прочитать все строчки из файла, то для этого обычно используют
цикл for следующим
образом:

    line :
        line end

Этот пример
показывает, что объект файл является итерируемым и на каждой итерации
возвращает очередную строку.

Или же, все
строчки можно прочитать методом

и тогда
переменная s будет ссылаться
на упорядоченный список с этими строками:

Однако этот
метод следует использовать с осторожностью, т.к. для больших файлов может
возникнуть ошибка нехватки памяти для хранения полученного списка.

По сути это все
методы для считывания информации из файла. И, смотрите, как только мы завершили
работу с файлом, его следует закрыть. Для этого используется метод close:

Конечно,
прописывая эту строчку, мы не увидим никакой разницы в работе программы. Но,
во-первых, закрывая файл, мы освобождаем память, связанную с этим файлом и,
во-вторых, у нас не будет проблем в потере данных при их записи в файл. А,
вообще, лучше просто запомнить: после завершения работы с файлом, его нужно
закрыть. Причем, организовать программу лучше так:

:
   
 
    :
        s .
        s
    :
        .
  FileNotFoundError:
    "Невозможно открыть файл"

Мы здесь создаем
вложенный блок try, в который помещаем критический текст программы при
работе с файлом и далее блок finally, который будет выполнен при
любом стечении обстоятельств, а значит, файл гарантированно будет закрыт.

Или же, забегая
немного вперед, отмечу, что часто для открытия файла пользуются так называемым
менеджером контекста, когда файл открывают при помощи оператора with:

:
    :      # file = open("myfile.txt")        s .
        s
  FileNotFoundError:
    "Невозможно открыть файл"

При таком
подходе файл закрывается автоматически после выполнения всех инструкций внутри
этого менеджера. В этом можно убедиться, выведем в консоль флаг,
сигнализирующий закрытие файла:

:
    .

Запустим
программу, видите, все работает также и при этом файл автоматически
закрывается. Даже если произойдет критическая ошибка, например, пропишем такую
конструкцию:

то, как видим,
файл все равно закрывается. Вот в этом удобство такого подхода при работе с
файлами.

Чтение файла ASCII в строку std

std::ifstream f("file.txt");
if (f)
{ std::stringstream buffer; buffer << f.rdbuf(); f.close(); // The content of "file.txt" is available in the string `buffer.str()`
}

Метод rdbuf() возвращает указатель на streambuf который может быть streambuf в buffer через stringstream::operator<< member.

Другая возможность (популяризированная в Effective STL от Scott Meyers ):

std::ifstream f("file.txt");
if (f)
{ std::string str((std::istreambuf_iterator<char>(f)), std::istreambuf_iterator<char>()); // Operations on `str`...
}

Это хорошо, потому что требует небольшого кода (и позволяет читать файл непосредственно в любом контейнере STL, а не только в строках), но может быть медленным для больших файлов.

ПРИМЕЧАНИЕ . Дополнительные скобки вокруг первого аргумента конструктору строк необходимы для предотвращения наиболее неприятной проблемы синтаксического анализа .

Последний, но тем не менее важный:

std::ifstream f("file.txt");
if (f)
{ f.seekg(0, std::ios::end); const auto size = f.tellg(); std::string str(size, ' '); f.seekg(0); f.read(&str[0], size); f.close(); // Operations on `str`...
}

что, вероятно, является самым быстрым вариантом (из трех предложенных).

Проверка конца файла внутри условия цикла, неправильная практика?

eof возвращает true только после чтения конца файла. Он НЕ указывает, что следующее чтение будет концом потока.

while (!f.eof())
{ // Everything is OK f >> buffer; // What if *only* now the eof / fail bit is set? /* Use `buffer` */
}

Вы можете правильно написать:

while (!f.eof())
{ f >> buffer >> std::ws; if (f.fail()) break; /* Use `buffer` */
}

while (f >> buffer)
{ /* Use `buffer` */
}

проще и меньше подверженности ошибкам.

std::ws : отбрасывает ведущие пробелы из входного потока
std::basic_ios::fail : возвращает true если произошла ошибка в связанном потоке

Открытие файла

Открытие файла выполняется одинаково для всех 3 потоков файлов ( ifstream , ofstream и fstream ).

Вы можете открыть файл непосредственно в конструкторе:

std::ifstream ifs("foo.txt"); // ifstream: Opens file "foo.txt" for reading only.
std::ofstream ofs("foo.txt"); // ofstream: Opens file "foo.txt" for writing only.
std::fstream iofs("foo.txt"); // fstream: Opens file "foo.txt" for reading and writing.

Кроме того, вы можете использовать функцию члена потока файлов open() :

std::ifstream ifs;
ifs.open("bar.txt"); // ifstream: Opens file "bar.txt" for reading only.
std::ofstream ofs;
ofs.open("bar.txt"); // ofstream: Opens file "bar.txt" for writing only.
std::fstream iofs;
iofs.open("bar.txt"); // fstream: Opens file "bar.txt" for reading and writing.

// Try to read the file 'foo.txt'.
std::ifstream ifs("fooo.txt"); // Note the typo; the file can't be opened.
// Check if the file has been opened successfully.
if (!ifs.is_open()) { // The file hasn't been opened; take appropriate actions here. throw CustomException(ifs, "File could not be opened");
}

Когда путь к файлу содержит обратную косую черту (например, в системе Windows), вы должны правильно их избежать:

// Open the file 'c:\folder\foo.txt' on Windows.
std::ifstream ifs("c:\\folder\\foo.txt"); // using escaped backslashes

C ++ 11

или использовать исходный литерал:

// Open the file 'c:\folder\foo.txt' on Windows.
std::ifstream ifs(R"(c:\folder\foo.txt)"); // using raw literal

или вместо этого используйте косые черты:

// Open the file 'c:\folder\foo.txt' on Windows.
std::ifstream ifs("c:/folder/foo.txt");

C ++ 11

Если вы хотите открыть файл с не-ASCII-символами в пути в Windows, в настоящее время вы можете использовать нестандартный аргумент пути к широкому символу:

// Open the file 'пример\foo.txt' on Windows.
std::ifstream ifs(LR"(пример\foo.txt)"); // using wide characters with raw literal

Закрытие файла

std::string const prepared_data = prepare_data();
{ // Open a file for writing. std::ofstream output("foo.txt"); // Write data. output << prepared_data;
} // The ofstream will go out of scope here. // Its destructor will take care of closing the file properly.

Вызов close() явно необходимо , только если вы хотите использовать один и тот же fstream объект позже, но не хотите , чтобы сохранить файл открыть между ними:

// Open the file "foo.txt" for the first time.
std::ofstream output("foo.txt");
// Get some data to write from somewhere.
std::string const prepared_data = prepare_data();
// Write data to the file "foo.txt".
output << prepared_data;
// Close the file "foo.txt".
output.close();
// Preparing data might take a long time. Therefore, we don't open the output file stream
// before we actually can write some data to it.
std::string const more_prepared_data = prepare_complex_data();
// Open the file "foo.txt" for the second time once we are ready for writing.
output.open("foo.txt");
// Write the data to the file "foo.txt".
output << more_prepared_data;
// Close the file "foo.txt" once again.
output.close();

Запись файлов с нестандартными языковыми настройками

Если вам нужно записать файл с использованием разных настроек языкового стандарта по умолчанию, вы можете использовать std::locale и std::basic_ios::imbue() чтобы сделать это для определенного потока файлов:

Руководство для использования:

Перед открытием файла вы всегда должны применять локальный поток.
Как только поток будет пропитан, вы не должны изменять языковой стандарт.

Причины ограничений: при создании файлового потока с локалью имеет неопределенное поведение, если текущая локаль не является независимой от состояния или не указывает на начало файла.

Потоки UTF-8 (и другие) не являются независимыми от состояния. Также поток файлов с локалью UTF-8 может попробовать и прочитать маркер спецификации из файла при его открытии; поэтому просто открытие файла может читать символы из файла, и оно не будет в начале.

#include <iostream>
#include <fstream>
#include <locale>
int main()
{ std::cout << "User-preferred locale setting is " << std::locale("").name().c_str() << std::endl; // Write a floating-point value using the user's preferred locale. std::ofstream ofs1; ofs1.imbue(std::locale("")); ofs1.open("file1.txt"); ofs1 << 78123.456 << std::endl; // Use a specific locale (names are system-dependent) std::ofstream ofs2; ofs2.imbue(std::locale("en_US.UTF-8")); ofs2.open("file2.txt"); ofs2 << 78123.456 << std::endl; // Switch to the classic "C" locale std::ofstream ofs3; ofs3.imbue(std::locale::classic()); ofs3.open("file3.txt"); ofs3 << 78123.456 << std::endl;
}

Явное переключение на классический язык «C» полезно, если ваша программа использует другой стандарт по умолчанию, и вы хотите обеспечить фиксированный стандарт для чтения и записи файлов. С предпочтительной локалью «C» пример записывает

78,123.456
78,123.456
78123.456

Если, например, предпочтительный языковой стандарт является немецким и, следовательно, использует другой формат чисел, пример записывает

78 123,456
78,123.456
78123.456

(обратите внимание на десятичную запятую в первой строке).

Режимы открытия

При создании потока файлов вы можете указать режим открытия. Режим открытия – это, в основном, параметр для управления тем, как поток открывает файл.

(Все режимы можно найти в пространстве имен std::ios .)

Режим открытия может быть предоставлен в качестве второго параметра конструктору файлового потока или его функции open() :

std::ofstream os("foo.txt", std::ios::out | std::ios::trunc);
std::ifstream is;
is.open("foo.txt", std::ios::in | std::ios::binary);

Следует отметить, что вам нужно установить ios::in или ios::out если вы хотите установить другие флаги, поскольку они неявно устанавливаются членами iostream, хотя они имеют правильное значение по умолчанию.

Если вы не укажете режим открытия, используются следующие режимы по умолчанию:

ifstream – in
ofstream – out
fstream – in и out

Режимы открытия файла, которые вы можете указать по дизайну:

Примечание. Установка binary режима позволяет считывать / записывать данные в точности как есть; не устанавливая его, это позволяет переносить символ новой строки '\n' / \ на определенный конец строки последовательности.

Например, в Windows конец строки – CRLF ( "\r\n" ).
Напишите: "\n" => "\r\n"
Читайте: "\r\n" => "\n"

Про анемометры: Котлы водогрейные на газе | ЗАВОД ИЗГОТОВИТЕЛЬ |