Чтение данных из файла в Python: полное руководство

Раздел: Ввод-вывод -> Файловый ввод-вывод

Чтение файла в Python основные подходы

Наиболее эффективный и рекомендуемый способ чтения файла в Python - использование менеджера контекста with и оператора open(). Это гарантирует автоматическое закрытие файла даже при возникновении ошибок.

with open('example.txt', 'r', encoding='utf-8') as file:
    data = file.read()
    print(data)

ввод программ на python (ввод данных в программе python)

Пояснение: файл открывается в режиме чтения ('r') с явным указанием кодировки. Метод read() считывает всё содержимое в строку. После выхода из блока with файл закрывается автоматически.

Типичные ошибки:

Файл не существует - возникает FileNotFoundError. Решение: проверять наличие файла с помощью os.path.exists() или обрабатывать исключение.
Неправильная кодировка - UnicodeDecodeError. Решение: указать корректную кодировку при открытии или использовать errors='replace'.
Забыли закрыть файл (без with) - возможна утечка ресурсов. Решение: всегда использовать менеджер контекста.

Как прочитать файл целиком в одну строку?

Метод read() возвращает строку, содержащую всё содержимое файла.

with open('data.txt', 'r') as f:
    content = f.read()
print(content)

Python file io (ввод-вывод файлов в python)

Проблема: для очень больших файлов это может потреблять много памяти. Решение: читать по частям.

Как прочитать файл построчно?

Итерация по объекту файла позволяет обрабатывать строки по одной.

with open('lines.txt', 'r') as f:
    for line in f:
        print(line.strip())  # удаляем перевод строки

Python temp files (временные файлы в python)

Ошибка: забыли удалить символ перевода строки (\n). Используйте strip() или rstrip().

Как прочитать все строки в список?

Метод readlines() возвращает список строк.

with open('names.txt') as f:
    lines = f.readlines()
# lines = ['Иван\n', 'Петр\n']

Python index files (индексация файлов в python)

Примечание: readlines() загружает весь файл в память. Для больших файлов лучше использовать итерацию.

Как читать файл порциями для больших данных?

Метод read(size) считывает указанное количество символов (или байт для бинарного режима).

with open('large_file.txt', 'r') as f:
    while True:
        chunk = f.read(1024)  # читаем по 1 КБ
        if not chunk:
            break
        process(chunk)

File python class (класс для работы с файлами в python)

Проблема: при неправильном размере куска можно замедлить обработку. Подбирайте размер под задачу.

Как прочитать бинарный файл?

Режим 'rb' открывает файл для чтения в двоичном режиме.

with open('image.png', 'rb') as f:
    binary_data = f.read()
# работа с байтами

Python file utf 8 (кодировка utf-8 для файлов в python)

Ошибка: открытие бинарного файла в текстовом режиме приводит к ошибке декодирования. Всегда указывайте 'rb'.

Как обработать ошибки кодировки?

Параметр errors позволяет задать реакцию на нечитаемые символы.

with open('file.txt', 'r', encoding='utf-8', errors='replace') as f:
    text = f.read()
# нечитаемые байты заменяются на '?'

Python config files (конфигурационные файлы в python)

Варианты: 'ignore' (пропустить), 'replace' (заменить), 'backslashreplace' (экранировать). Выбор зависит от цели.

Как использовать pathlib для чтения?

Модуль pathlib предоставляет удобные методы.

from pathlib import Path
content = Path('example.txt').read_text(encoding='utf-8')
# или бинарный:
bytes_data = Path('image.png').read_bytes()

Ошибка: read_text() по умолчанию использует системную кодировку. Явно указывайте параметр encoding.

- Python file methods (методы работы с файлами в python)

- File models in python (модели файлов в python)

- File handle python (обработка файлов в python)

Расширенные примеры чтения файлов

Пример 1: Чтение файла с разными кодировками и обработка ошибок

Пример

import codecs

filenames = ['utf8.txt', 'cp1251.txt', 'unknown_encoding.bin']
for fname in filenames:
    try:
        with open(fname, 'r', encoding='utf-8', errors='strict') as f:
            print(f.read()[:50])
    except UnicodeDecodeError:
        print(f'Не удалось декодировать {fname} как UTF-8')

Строка из UTF-8 файла
Не удалось декодировать cp1251.txt как UTF-8
Не удалось декодировать unknown_encoding.bin как UTF-8

Пример 2: Чтение бинарного файла и извлечение первых 10 байт

Пример

with open('python_logo.png', 'rb') as f:
    header = f.read(10)
    print(header.hex())
    print(header)

b'\x89PNG\r\n\x1a\n'

Пример 3: Чтение большого файла построчно с подсчётом строк

Пример

line_count = 0
with open('huge_log.txt', 'r', errors='ignore') as f:
    for line in f:
        line_count += 1
print(f'Количество строк: {line_count}')

Количество строк: 1423056

Пример 4: Чтение файла в список строк с удалением символов новой строки

Пример

lines = []
with open('data.txt', 'r') as f:
    for line in f:
        lines.append(line.rstrip('\n'))
print(lines[:3])

['Первая строка', 'Вторая строка', 'Третья строка']

Пример 5: Использование модуля mmap для эффективного чтения больших файлов

Пример

import mmap

with open('large_text.txt', 'r') as f:
    with mmap.mmap(f.fileno(), 0, access=mmap.ACCESS_READ) as mm:
        # mm ведёт себя как байтовая строка
        print(mm[:100].decode('utf-8'))
        # поиск подстроки
        pos = mm.find(b'important')
        if pos != -1:
            print(f'Найдено на позиции {pos}')

Содержимое первых 100 символов...
Найдено на позиции 5423

Пример 6: Чтение файла с помощью pathlib и обработка исключений

Пример

from pathlib import Path

path = Path('config.json')
try:
    data = path.read_text(encoding='utf-8')
    print(data[:100])
except FileNotFoundError:
    print('Файл не найден')
except PermissionError:
    print('Недостаточно прав для чтения')

{ "version": 1, "settings": { ... }

Чтение файла в Python - comments

Python read file (python)