Русские буквы в URL страниц
6 февраля 2010, 2:59
Автор: 1234ru
Товарищи, никак не могу понять, что из себя представляют адреса, содержащие русские буквы.
Да, читал про кодирование нелатинских символов в URL.
Вместе с тем, складывается впечатление, что каждый браузер обращается с адресами страниц по-разному: один кодирует, второй не кодирует, третий недокодирует.
Вот такой несложный javascript-код
для страницы с адресом (точнее, с куском адреса) вида ф?q=ф дал в трёх браузерах три разных результата:
upd: проверил: от кодировки страницы результат не зависит ни в одном браузере.
Я весьма озадачен, т.к. мне нужно при помощи javascript'ового счетчика (навроде liveinternet'а) собирать урлы и рефереры с разных страниц (неизвестно каких сайтов) и разных браузеров, поэтому необходимо всё это мракобесие как-то привести к единому виду.
Пролейте кто-нибудь луч света, пожалуйста.
Да, читал про кодирование нелатинских символов в URL.
Вместе с тем, складывается впечатление, что каждый браузер обращается с адресами страниц по-разному: один кодирует, второй не кодирует, третий недокодирует.
Вот такой несложный javascript-код
<script type="text/javascript">
document.write(document.URL);
</script>
document.write(document.URL);
</script>
для страницы с адресом (точнее, с куском адреса) вида ф?q=ф дал в трёх браузерах три разных результата:
IE6: ф?q=ф
FF3.0: %D1%84?q=%F4
Chrome4: %D1%84?q=%D1%84
Особенно порадовал фаерфокс. Который символы в части path закодировал как UTF-8, а в части query - как CP-1251 (вообще полный привет, по-моему).FF3.0: %D1%84?q=%F4
Chrome4: %D1%84?q=%D1%84
upd: проверил: от кодировки страницы результат не зависит ни в одном браузере.
Я весьма озадачен, т.к. мне нужно при помощи javascript'ового счетчика (навроде liveinternet'а) собирать урлы и рефереры с разных страниц (неизвестно каких сайтов) и разных браузеров, поэтому необходимо всё это мракобесие как-то привести к единому виду.
Пролейте кто-нибудь луч света, пожалуйста.