Принципы работы со строками без учета регистра

Раздел: Основы PHP -> Работа со строками

Основные функции для игнорирования регистра

При работе со строками часто требуется сравнивать, искать или заменять подстроки без учета регистра символов. В PHP существует несколько встроенных функций, позволяющих решить эту задачу. Выбор подходящего метода зависит от контекста: нужно ли только сравнение, поиск позиции, замена или проверка вхождения, а также от кодировки строки.

Наиболее эффективное решение: приведение к нижнему регистру с помощью mb_strtolower()

Если требуется максимальная совместимость с различными кодировками, особенно с UTF-8, лучшим подходом будет преобразование обеих строк к одному регистру (обычно нижнему) с последующим сравнением или поиском. Функция mb_strtolower() корректно обрабатывает многобайтовые символы, в отличие от strtolower(), которая игнорирует специфические буквы (например, немецкие умляуты или кириллицу в разных кодировках).


$string1 = "Привет, Мир!";
$string2 = "привет, мир!";
if (mb_strtolower($string1, 'UTF-8') === mb_strtolower($string2, 'UTF-8')) {
    echo "Строки равны без учета регистра";
}

Php маленькие буквы (преобразование строки в нижний регистр в php)

Пояснение: функция mb_strtolower() принимает кодировку вторым параметром. Для корректной работы с кириллицей рекомендуется указывать 'UTF-8'. Результат: строки считаются равными.

Проблемы: если не указать кодировку, mb_strtolower() использует внутреннюю кодировку PHP (может быть не UTF-8). Также функция доступна только при включенном расширении mbstring. Если расширение недоступно, можно использовать iconv_strtolower() или другие альтернативы.

Решение: проверить наличие расширения через function_exists('mb_strtolower') или использовать polyfill.

Как сравнить две строки без учета регистра с помощью strcasecmp()?

Функция strcasecmp() выполняет бинарное сравнение строк без учета регистра. Она возвращает 0, если строки равны, отрицательное число, если первая меньше, и положительное, если первая больше.


$str1 = "Hello World";
$str2 = "hello world";
if (strcasecmp($str1, $str2) === 0) {
    echo "Строки равны";
}

Character php (символы php)

Цель использования: быстрая проверка равенства строк в кодировке ASCII (или однобайтовых). Идеально для латиницы.

Проблема: функция не работает корректно с многобайтовыми кодировками (UTF-8, кириллица). Она сравнивает байты, поэтому 'Привет' и 'привет' будут сочтены разными, так как в UTF-8 прописные и строчные буквы имеют разные байтовые представления.

Решение: для UTF-8 используйте mb_strtolower() или strcasecmp() в сочетании с iconv() для перекодировки.

Как заменить подстроку в строке, игнорируя регистр?

Функция str_ireplace() работает аналогично str_replace(), но не учитывает регистр при поиске.


$text = "PHP - это язык программирования. Php очень популярен.";
$result = str_ireplace("php", "PHP", $text);
echo $result; // "PHP - это язык программирования. PHP очень популярен."

Php new line (символ новой строки в php)

Пояснение: все вхождения 'PHP', 'Php', 'php' заменены на 'PHP'. Функция возвращает новую строку с заменами.

Проблема: str_ireplace() также не поддерживает многобайтовые кодировки. Для корректной работы с UTF-8 необходимо использовать комбинацию mb_strtolower() и обычного str_replace() или использовать регулярные выражения с модификатором u.

Как проверить, содержит ли строка подстроку, игнорируя регистр, с помощью регулярных выражений?

Использование preg_match() с модификатором i (insensitive) позволяет искать совпадения без учета регистра. Дополнительно можно указать модификатор u для работы с UTF-8.


$string = "Изучаем PHP";
$pattern = "/php/i";
if (preg_match($pattern, $string)) {
    echo "Подстрока найдена";
}

Php проверить строку (проверить строку в php)

Пояснение: модификатор i отключает чувствительность к регистру. Для кириллицы в UTF-8 добавляется модификатор u: /подстрока/ui.

Проблема: регулярные выражения могут быть избыточными для простых проверок. Также возможны проблемы с производительностью при большом количестве операций.

Решение: для простых проверок вхождения лучше использовать strpos() с предварительным приведением регистра.

Как найти позицию подстроки без учета регистра без регулярных выражений?

Можно привести обе строки к одному регистру через mb_strtolower() (или strtolower() для ASCII) и затем использовать strpos().


$haystack = "PHP - язык сценариев";
$needle = "php";
$pos = mb_strpos(mb_strtolower($haystack, 'UTF-8'), mb_strtolower($needle, 'UTF-8'));
if ($pos !== false) {
    echo "Позиция: $pos";
}

Пояснение: после приведения к нижнему регистру strpos работает как обычно. Функция mb_strpos() корректно работает с многобайтовыми строками.

Проблема: при использовании strpos() без mb_ может возникнуть ошибка смещения для UTF-8 строк, так как strpos() считает байты, а не символы. Всегда используйте mb_strpos() для многобайтовых строк.

- удалить пробел в строке php (php удалить пробелы в строке)

- Php подстроки (получение подстроки в php)

- Php длина строки (длина строки php)

Практические примеры с кодом и результатами

Пример 1. Сортировка массива строк без учета регистра

Функция sort с флагом SORT_FLAG_CASE позволяет отсортировать строки, игнорируя регистр.

Пример


$array = ["Apple", "banana", "Cherry", "date"];
sort($array, SORT_FLAG_CASE);
print_r($array);

Array
(
    [0] => Apple
    [1] => banana
    [2] => Cherry
    [3] => date
)

Пояснение: флаг SORT_FLAG_CASE добавляет сортировку без учета регистра. Если требуется сохранить ключи, используйте asort() с тем же флагом.

Пример 2. Поиск элемента в массиве без учета регистра

Функция array_search() не имеет встроенной поддержки игнорирования регистра. Можно использовать array_uintersect() с пользовательской функцией сравнения.

Пример


$array = ["Первый", "Второй", "Третий"];
$search = "второй";
$result = array_uintersect($array, [$search], function($a, $b) {
    return strcasecmp($a, $b); // для однобайтовых строк
});
if (count($result) > 0) {
    echo "Элемент найден";
}

Элемент найден

Для многобайтовых строк замените strcasecmp на сравнение через mb_strtolower().

Пример 3. Естественная сортировка без учета регистра

Используйте strnatcasecmp() для сортировки в человеческом порядке (например, "img1", "img10", "img2") без учета регистра.

Пример


$files = ["img12", "Img2", "img1", "IMG10"];
usort($files, 'strnatcasecmp');
print_r($files);

Array
(
    [0] => img1
    [1] => Img2
    [2] => img12
    [3] => IMG10
)

Пояснение: strnatcasecmp() учитывает числовые части строк и игнорирует регистр.

Пример 4. Замена с сохранением оригинального регистра найденного вхождения

Если требуется заменить слово, сохраняя его регистр в исходной строке (например, заменить "php" на "PHP", но "PHP" уже написано с большой буквы, то не заменять), то нужно использовать регулярные выражения с обратным вызовом.

Пример


$text = "PHP и php - разные записи. Php тоже.";
$result = preg_replace_callback('/php/i', function($m) {
    if ($m[0] === 'PHP') {
        return 'PHP'; // оставляем как есть
    }
    return 'PHP'; // во всех остальных случаях заменяем
}, $text);
echo $result;

PHP и PHP - разные записи. PHP тоже.

В этом примере все вхождения, независимо от регистра, заменяются на 'PHP'. Но можно реализовать более сложную логику.

Пример 5. Подсчет вхождений подстроки без учета регистра

Проще всего использовать preg_match_all с модификатором i.

Пример


$str = "PHP, Php, php, pHP";
$count = preg_match_all('/php/i', $str);
echo "Количество вхождений: $count";

Количество вхождений: 4

Пример 6. Сравнение строк с учетом локали (locale) без учета регистра

Функция strcoll() сравнивает строки с учетом текущей локали. Если локаль настроена, strcoll может игнорировать регистр в зависимости от правил локали. Однако это менее предсказуемо, чем явное приведение.

Пример


setlocale(LC_ALL, 'ru_RU.UTF-8');
$str1 = "Ёлка";
$str2 = "ёлка";
// strcoll может вернуть 0, если локаль настроена правильно
$result = strcoll($str1, $str2);
if ($result === 0) echo "Равны";

Равны (при правильной локали)

Проблемы: результат зависит от установленной локали на сервере, может быть непредсказуемым и различаться на разных системах.

Игнорирование регистра в PHP - comments

Php без учета регистра (php)