PHP: сравнение URI, которые отличаются процентным кодированием

В PHP я хочу сравнить два относительных URL для равенства. URL-адрес catch: URL-адреса могут отличаться в процентах-кодировании, например.

  • /dir/file+file vs. /dir/file%20file
  • /dir/file(file) vs. /dir/file%28file%29
  • /dir/file%5bfile vs. /dir/file%5bfile

Согласно RFC 3986, серверы должны обрабатывать эти URI одинаково. Но если я использую == для сравнения, у меня будет несоответствие.

Итак, я ищу функцию PHP, которая будет принимать две строки и возвращает TRUE, если они представляют один и тот же URI (dicounting закодированные/декодированные варианты того же char, шестнадцатеричные цифры в верхнем или нижнем регистре в закодированных символах и + против %20 для пробелов) и FALSE, если они разные.

Я заранее знаю, что в этих строках присутствуют только символы ASCII - нет юникода.

+1
источник поделиться
3 ответа
function uriMatches($uri1, $uri2)
{
    return urldecode($uri1) == urldecode($uri2);
}

echo uriMatches('/dir/file+file', '/dir/file%20file');      // TRUE
echo uriMatches('/dir/file(file)', '/dir/file%28file%29');  // TRUE
echo uriMatches('/dir/file%5bfile', '/dir/file%5Bfile');    // TRUE

urldecode

+4
источник

РЕДАКТИРОВАТЬ: Обратите внимание на ответ @webbiedave. Его гораздо лучше (я даже не знал, что для PHP есть функция для этого.. узнать что-то новое каждый день)

Вам нужно будет разобрать строки, чтобы найти что-то подходящее %##, чтобы найти вхождения этих процентных кодов. Затем, беря число из них, вы сможете передать его так, чтобы функция chr() получила характер этих процентных кодировок. Перестройте строки, а затем вы сможете их сопоставить.

Не уверен, что наиболее эффективный метод, но с учетом URL-адресов обычно не так долго, он не должен быть слишком сильным.

0
источник

Я знаю, что эта проблема, кажется, решена webbiedave, но у меня были свои проблемы с ней.

Первая проблема: закодированные символы нечувствительны к регистру. Таким образом,% C3 и% c3 являются одинаковыми символами, хотя они различаются как URI. Таким образом, оба URI указывают на одно и то же местоположение.

Вторая проблема: папка %20 (2) и папка %20% 282% 29 - оба URI с корректным urlencoded, которые указывают на одно и то же местоположение, хотя это разные URI.

Третья проблема: если я избавлюсь от символов, кодированных url, у меня есть два местоположения с одинаковым URI, например bla% 2Fblubb и bla/blubb.

Так что же тогда делать? Чтобы сравнить два URI, мне нужно нормализовать их оба так, чтобы я разделил их на все компоненты, urldecode все пути и части запроса на один раз, rawurlencode их и склеить их вместе, а затем я мог бы их сравнить.

И это может быть функцией его нормализации:

function normalizeURI($uri) {
    $components = parse_url($uri);
    $normalized = "";
    if ($components['scheme']) {
        $normalized .= $components['scheme'] . ":";
    }
    if ($components['host']) {
        $normalized .= "//";
        if ($components['user']) { //this should never happen in URIs, but still probably it anything can happen thursday
            $normalized .= rawurlencode(urldecode($components['user']));
            if ($components['pass']) {
                $normalized .= ":".rawurlencode(urldecode($components['pass']));
            }
            $normalized .= "@";
        }
        $normalized .= $components['host'];
        if ($components['port']) {
            $normalized .= ":".$components['port'];
        }
    }
    if ($components['path']) {
        if ($normalized) {
            $normalized .= "/";
        }
        $path = explode("/", $components['path']);
        $path = array_map("urldecode", $path);
        $path = array_map("rawurlencode", $path);
        $normalized .= implode("/", $path);
    }
    if ($components['query']) {
        $query = explode("&", $components['query']);
        foreach ($query as $i => $c) {
            $c = explode("=", $c);
            $c = array_map("urldecode", $c);
            $c = array_map("rawurlencode", $c);
            $c = implode("=", $c);
            $query[$i] = $c;
        }
        $normalized .= "?".implode("&", $query);
    }
    return $normalized;
}

Теперь вы можете изменить функцию webbiedave:

function uriMatches($uri1, $uri2) {
    return normalizeURI($uri1) === normalizeURI($uri2);
}

Это должно сделать. И да, это гораздо сложнее, чем даже я хотел, чтобы это было.

0
источник

Посмотрите другие вопросы по меткам или Задайте вопрос