Работа с табличными данными: ввод и форматирование

Раздел: Обработка данных -> Работа с таблицами

Основные способы организации ввода табличных данных в Python

Наиболее эффективным инструментом для загрузки табличных данных в Python является библиотека pandas. Функция read_csv() позволяет считать данные из CSV-файла и автоматически преобразовать их в структуру DataFrame, поддерживающую мощные методы анализа и обработки.

import pandas as pd
df = pd.read_csv('data.csv', encoding='utf-8')
print(df.head())

библиотека таблиц python (библиотека для работы с таблицами в python)

В данном примере файл data.csv считывается с указанием кодировки UTF-8. Метод head() выводит первые пять строк таблицы, что позволяет убедиться в корректности загрузки.

Возможные проблемы: несовпадение разделителя, неправильная кодировка, наличие пропущенных значений.

Решение: укажите параметры sep=';' или delimiter='\t' для табуляции. Для пропусков используйте na_values=['NA', '?']. Кодировку можно перебрать: encoding='cp1251'.

Как создать таблицу ввода без использования внешних файлов?

Для ручного ввода данных применяются списки и словари. Пользователь вводит строки через консоль, а затем формируется DataFrame.

import pandas as pd
data = []
n = int(input('Количество строк: '))
for i in range(n):
    row = input(f'Введите строку {i+1} через запятую: ').split(',')
    data.append(row)
df = pd.DataFrame(data, columns=['Name', 'Age', 'City'])
print(df)

Python вывести таблицу (вывод таблицы в python)

Ввод происходит построчно, каждая строка разбивается по запятой. Полученный список списков преобразуется в DataFrame с явно заданными именами столбцов.

Типичные ошибки: неверный формат ввода, лишние пробелы, нечисловые данные в числовых столбцах.

Решение: используйте strip() для удаления пробелов, а также проверяйте типы данных через try/except при преобразовании к float или int.

Как загрузить данные из CSV без pandas?

Стандартная библиотека csv предоставляет средства для чтения и записи табличных данных без дополнительных зависимостей.

import csv
with open('data.csv', 'r', encoding='utf-8') as file:
    reader = csv.reader(file)
    header = next(reader)
    rows = list(reader)
print('Заголовки:', header)
print('Данные:', rows[:3])

таблица python задача (задача на таблицу в python)

Функция csv.reader возвращает итератор по строкам файла. Первая строка извлекается как заголовок, остальные - как список значений. Типы данных не преобразуются автоматически, все значения остаются строками.

Проблема: при большом объёме данных чтение всего файла в память может быть затратным.

Решение: обрабатывайте строки по одной в цикле, не накапливая их в список.

Как считать данные из Excel файла без pandas?

Библиотека openpyxl позволяет работать с файлами формата .xlsx. Она загружает книгу и предоставляет доступ к листам и ячейкам.

from openpyxl import load_workbook
wb = load_workbook('data.xlsx')
ws = wb.active
rows = []
for row in ws.iter_rows(values_only=True):
    rows.append(list(row))
header = rows[0]
data = rows[1:]
print('Заголовки:', header)
print('Первые строки:', data[:2])

Python работа с таблицами (работа с таблицами в python)

Метод iter_rows(values_only=True) возвращает кортежи значений из каждой строки. Такой подход прост и не требует pandas, но не поддерживает автоматическое определение типов.

Возможные ошибки: файл Excel может быть защищён паролем или содержать объединённые ячейки.

Решение: для объединённых ячеек нужно использовать атрибут merged_cells и обрабатывать их отдельно. Защищённые файлы не поддерживаются openpyxl.

Как красиво отобразить таблицу в консоли?

Библиотека tabulate форматирует табличные данные в удобочитаемый вид с выравниванием и разделителями.

from tabulate import tabulate
data = [['Alice', 30, 'New York'], ['Bob', 25, 'Los Angeles']]
headers = ['Name', 'Age', 'City']
print(tabulate(data, headers=headers, tablefmt='grid'))

Параметр tablefmt задает стиль таблицы: 'grid', 'pipe', 'simple' и другие. Результат выводится в консоль в виде аккуратной сетки.

Проблема: длинные строки или специальные символы могут нарушить форматирование.

Решение: используйте параметр maxcolwidths для ограничения ширины столбцов, а также экранируйте знаки, например, заменяя табуляцию на пробелы.

- Python столбец таблицы (столбец таблицы в python)

- Python 3 таблица (таблица в python 3)

- язык программирования python таблица (таблица в языке python)

Расширенные примеры демонстрируют нестандартные сценарии ввода табличных данных и их последующей обработки.

Пример

import pandas as pd
# Чтение CSV с табуляцией, указанием типов и обработкой пропусков
df = pd.read_csv('data.tsv', sep='\t', dtype={'Age': int, 'Salary': float}, na_values=['N/A', 'missing'])
print(df.info())
print(df.head())

RangeIndex: 100 entries, 0 to 99
Data columns (total 3 columns):
 #   Column  Non-Null Count  Dtype
---  ------  --------------  -----
 0   Name    100 non-null    object
 1   Age     98 non-null     int64
 2   Salary  95 non-null     float64
dtypes: float64(1), int64(1), object(1)
   Name  Age  Salary
0  Alice   30  75000.0
1    Bob   25  60000.0

Пример

# Создание DataFrame из словаря и вывод с tabulate в разных форматах
from tabulate import tabulate
data_dict = {'Name': ['Eve', 'Charlie'], 'Score': [95, 88], 'Grade': ['A', 'B']}
df = pd.DataFrame(data_dict)
print('Формат pipe:')
print(tabulate(df, headers='keys', tablefmt='pipe'))
print('\nФормат pretty:')
print(tabulate(df, headers='keys', tablefmt='pretty'))

Формат pipe:
|    | Name    |   Score | Grade   |
|---|---------|---------|---------|
|  0 | Eve     |      95 | A       |
|  1 | Charlie |      88 | B       |

Формат pretty:
+---+---------+-------+-------+
|   | Name    | Score | Grade |
+---+---------+-------+-------+
| 0 |   Eve   |   95  |   A   |
| 1 | Charlie |   88  |   B   |
+---+---------+-------+-------+

Пример

# Чтение Excel с выбором листа и столбцов
from openpyxl import load_workbook
wb = load_workbook('sales.xlsx', data_only=True)  # data_only=True для формул
ws = wb['Sales2023']
for row in ws.iter_rows(min_row=2, max_col=3, values_only=True):
    product, units, price = row
    revenue = units * price if all(v is not None for v in (units, price)) else None
    print(f'{product}: {units} шт. по {price} руб. -> {revenue} руб.')

Ноутбук: 10 шт. по 60000.0 руб. -> 600000.0 руб.
Мышь: 50 шт. по 1500.0 руб. -> 75000.0 руб.

Пример

# Интерактивный консольный ввод с валидацией и накоплением в список словарей
import pandas as pd
records = []
print('Введите данные (пустая строка для завершения):')
while True:
    line = input('Имя,Возраст,Город: ').strip()
    if not line:
        break
    parts = line.split(',')
    if len(parts) != 3:
        print('Ошибка: нужно ровно 3 значения')
        continue
    name, age_str, city = parts
    try:
        age = int(age_str)
    except ValueError:
        print('Ошибка: возраст должен быть числом')
        continue
    records.append({'Name': name, 'Age': age, 'City': city})
df = pd.DataFrame(records)
print('\nВведённая таблица:')
print(df)

Введите данные (пустая строка для завершения):
Имя,Возраст,Город: Мария,28,Москва
Имя,Возраст,Город: Иван,35,Санкт-Петербург
Имя,Возраст,Город:

Введённая таблица:
    Name  Age            City
0  Мария   28          Москва
1   Иван   35  Санкт-Петербург

Пример

# Использование PrettyTable для форматирования таблицы из списка кортежей
from prettytable import PrettyTable
table = PrettyTable()
table.field_names = ['ID', 'Product', 'Price']
table.add_row([1, 'Laptop', 75000])
table.add_row([2, 'Mouse', 1500])
table.add_row([3, 'Keyboard', 2500])
table.align['Price'] = 'r'  # выравнивание вправо
print(table)

+----+---------+-------+
| ID | Product | Price |
+----+---------+-------+
| 1  |  Laptop | 75000 |
| 2  |   Mouse |  1500 |
| 3  | Keyboard|  2500 |
+----+---------+-------+

Таблица ввода в Python - comments

Python таблица ввода (python)