АРМАДА
мета-тег Содержимое как "text/html" и кодировка &a
На страницу 1, 2  След.
Новая тема Написать ответ Advanced Hosters - профессиональный хостинг

IseeDeadPeople
Объединенная Электрическая
Зарегистрирован: 06.12.2005
Сообщений: 18000
Обратиться по нику
# Добавлено:Пн Dec 15, 2008 10:19 pmДобавить в избранноеОтветить с цитатой
насколько обязательно ставить в мета-теге... указывать кодировку..
Код:
<meta http-equiv="Content-Type" content="text/html; ТУТ_КОДИРОВКА">



я лично все свои доки просто эту строку пишу как
Код:
<meta http-equiv="Content-Type" content="text/html">


т.е. никакой кодировке я неуказываю!

если советуете ставить , то какую именно для англо-игогокающий лошадок... и для понников из европы/британии
ИСО/ВИНДОВС... ?

спасибо!
http://m.lsl.com/

brantozawr
Опытный
Зарегистрирован: 10.11.2008
Сообщений: 126
Обратиться по нику
# Добавлено:Пн Dec 15, 2008 10:48 pmОтветить с цитатой
charset=iso-8859-1

blam
Опытный
Зарегистрирован: 13.03.2008
Сообщений: 240
Обратиться по нику
# Добавлено:Пн Dec 15, 2008 11:09 pmОтветить с цитатой
Желательно ставить, я всегда utf-8 ставлю.
brantozawr- объясни почему iso-8859-1 ?
Бложок

brantozawr
Опытный
Зарегистрирован: 10.11.2008
Сообщений: 126
Обратиться по нику
# Добавлено:Пн Dec 15, 2008 11:30 pmОтветить с цитатой
blam, iso-8859-1 - стандартная западно европейская кодировка. utf 8 - расширенная кодировка.

таблица сиволов кодировки iso-8859-1 приведена здесь http://book.itep.ru/10/iec8859.htm

Как видно, данная кодировка включает в себя кучу языков. Если в тексте сайта используются символы, не входящие в эту таблицу (к примеру на русском хочется что-то еще написать), то как правило, используют кодировку UTF-8.

Кодировка iso-8859-1 является подмножеством кодировки UTF-8. и если текст сайта написан просто с использованием латинских символов, то ничего страшного не будет, если указать UTF-8, а не iso-8859-1. Отобразится все правильно.

IseeDeadPeople
Объединенная Электрическая
Зарегистрирован: 06.12.2005
Сообщений: 18000
Обратиться по нику
# Добавлено:Вт Dec 16, 2008 3:07 amОтветить с цитатой
blam писал(а):
Желательно ставить, я всегда utf-8 ставлю.
brantozawr- объясни почему iso-8859-1 ?



спасибо, но.. обьясни почему "Желательно ставить"..
ведь мне не предположение нужно (и за него спасибо!), а точная техническая информация..
т.е. реальные случаи того что если непроставить то может тама у кого то что то неотобразиться как надо..... ? если да, то почему ?
аудитория - англицкая пони.

для них КМК ее даже нужно неставить..
а для СЕ ботов вообще - ориентируються к какому региону стр. принадлежит по контенту (т.е. по набору символов на страничке) ?

и если выводить в УТФ8 как ее правильно составить/обработать на выходе ?

если пхп скриптом вводит то весть хтмл сорц пропустить через utf8_encode() ?
а если я делаю напр сам какую то стат. хтмл страничку
то как можно быть уверенным что я ставлю в хидере что это УТФ8 а на самом деле она и не УТФ8 может быть... ?
http://m.lsl.com/

brantozawr
Опытный
Зарегистрирован: 10.11.2008
Сообщений: 126
Обратиться по нику
# Добавлено:Вт Dec 16, 2008 12:06 pmОтветить с цитатой
IseeDeadPeople, если у тебя в текстах используются исключительно символы английского алфавита, то в абсолютном большинстве (а может и во всех.... это заявление только из собственного опыта) кодировок они имеют одни и те же коды и перекодировать ничего не надо. Буква W в обоих кодировках (iso-8859-1 и utf-8 ) имеет один и тот же код и т.д.....

Если есть символы неанглийских алфавитов (русские, специфичные символы европейских государств, азиатские и т. п.), то нужно либо указывать родную кодировку, либо сперва перекодировать в utf-8 и указывать ее.

Обязательно ли указывать кодировку для твоих страниц? Достоверно не знаю.... только на опыте... Сделай следующее: открой страницу в браузере и меняй в браузере кодировки ототбражения. перебери все кодировки. У меня во всех текст открылся нормально. Это значит, что во всех перебранных кодировках коды латинских букв имеют одинаковое значение.

Но я не исключаю, что где нибудь в далекой Зимбабве есть житель, браузер которого по умолчанию открывает страницы в неведанной нам кодировке. И он не сможет прочесть текст страницы.... Smile

IseeDeadPeople, открой секрет, к чему все это? или ты оптимизируешь размер страницы? :mrgreen:


Последний раз редактировалось: brantozawr (Вт Dec 16, 2008 8:31 pm), всего редактировалось 1 раз

cupiey
Свой
Зарегистрирован: 29.08.2008
Сообщений: 95
Обратиться по нику
# Добавлено:Вт Dec 16, 2008 7:19 pmОтветить с цитатой
Помимо META на кодировку влияет еще вот такой параметр апача - http://httpd.apache.org/docs/2.0/mod/core.html#adddefaultcharset
Если указан этот параметр, то он будет приоритетнее чем META.
All ages, all races, all sexes.

IseeDeadPeople
Объединенная Электрическая
Зарегистрирован: 06.12.2005
Сообщений: 18000
Обратиться по нику
# Добавлено:Чт Dec 18, 2008 12:28 amОтветить с цитатой
еще хочеться узнать..
наверно на около 80% сайтов (хтмл стр.)
в сорсе, первая строка.. до тега начало хтмл потока как <html>
стоят типа такие строчки
Код:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"
"http://www.w3.org/TR/html4/loose.dtd">


.. или такая ..
Код:

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">



эти строчки на что влияют ? что сообщают и кому ? в какислучаях их надо использовать, а в каких - нестоит.. ?

также для гугля если ХТМЛ док. с такими строчками ... и без них - как то другое отношение его к этим хтмл-стр. будет ?


_________

также на некоторых стр. вижу вместо обычного <html> (на первой строке) вот такую пони <html xmlns="http://www.w3.org/1999/xhtml">
что она значит ?

_________

а по теме..

Код:
<meta http-equiv="Content-Type" content="text/html; charset=XXXXX">



если выдавать мета тег где XXXXX как "utf-8" или "iso-8859-1" то значит надо как нить обработать в пхп и сам вывод док ?

например если пишу как "text/html; charset=utf-8"
то весь вывод надо пропустить через php func.: utf8_encode(); Так ?

а при выводе (указания) как "text/html; charset=iso-8859-1" какой функцией пони выпремлять ?

Спасибо!
http://m.lsl.com/

IseeDeadPeople
Объединенная Электрическая
Зарегистрирован: 06.12.2005
Сообщений: 18000
Обратиться по нику
# Добавлено:Чт Dec 18, 2008 12:30 amОтветить с цитатой
brantozawr, спасибо.. оценил тебя отдельно..
буду рад слышать от тебя подобные разьяснения!
http://m.lsl.com/

brantozawr
Опытный
Зарегистрирован: 10.11.2008
Сообщений: 126
Обратиться по нику
# Добавлено:Чт Dec 18, 2008 1:36 amОтветить с цитатой
IseeDeadPeople, благодарю за оценку.

1. По DOCTYPE - честно говоря не дружу с этим и даже не хочу дружить... Это указание браузеру стандарта, по которому надо ототбражать страницу. Я верстаю страницы по старинке, с использованием стандартных html тегов и css... вобщем, чтобы без всяких указаний DOCTYPE страницыы открывалась одинаково во всех браузерах.... почитай тут http://www.i2r.ru/static/479/out_23105.shtml

2.
Цитата:

если выдавать мета тег где XXXXX как "utf-8" или "iso-8859-1" то значит надо как нить обработать в пхп и сам вывод док ?

например если пишу как "text/html; charset=utf-8"
то весь вывод надо пропустить через php func.: utf8_encode(); Так ?



Да, надо... НО! еще раз замечу: если текст с использованием только латинских букв, цифр, знаков препинания, то не надо конвертить. Какие конкретно символы не надо конвертить? Еще раз даю ссылку http://book.itep.ru/10/iec8859.htm Гляди на таблицу "Таблица кодов символов ISO/IEC 8859-1". Если текст из символов до знака ~ (включительно) (это первые 127 символов), то конвертить бесполезно. Доказываю:

Код:

<?

 $test = "TEST message. 123456 & . , ?";

 echo "ISO-8859-1: ".$test."\n";
 echo "UTF-8: ".utf8_encode($test)."\n";
 echo "UTF-8: ".iconv("ISO-8859-1", "UTF-8", $test)."\n";

?>



Результат:
Код:

Content-type: text/html
X-Powered-By: PHP/4.4.0

ISO-8859-1: TEST message. 123456 & . , ?
UTF-8: TEST message. 123456 & . , ?
UTF-8: TEST message. 123456 & . , ?



Как видишь, результат в обеих кодировках одинаков. Т.е. первые 127 символов кодировки ISO 8859-1 один в один ковертятся в UTF-8. Поэтому незачем грузить сервак ненужными вычислениями, если заранее знаешь, что результат будет одинаков.

3.
Цитата:

а при выводе (указания) как "text/html; charset=iso-8859-1" какой функцией пони выпремлять ?



utf8_decode — Converts a string with ISO-8859-1 characters encoded with UTF-8 to single-byte ISO-8859-1

P.S. русский текст функцией utf8_encode в utf-8 не сконвертишь. Только ISO-8859-1 -> UTF-8

IseeDeadPeople
Объединенная Электрическая
Зарегистрирован: 06.12.2005
Сообщений: 18000
Обратиться по нику
# Добавлено:Пт Dec 19, 2008 11:49 pmОтветить с цитатой
так если невникая мне в подробности, просто скажите в двух словах
в каких случаях юзать "utf-8" а в каких "iso-8859-1", и почему ?

странички хоть и вывод через ПХП, но всяких странных символов там нет, т.е. считай на выходе обычные ХТМЛ сорцы/старнички.

спасибо!

____
потом более подробно изучу тему.
http://m.lsl.com/

DrKronos
SEO-доктор
Зарегистрирован: 11.03.2008
Сообщений: 8879
Moder (Сумма: 1)
Обратиться по нику
# Добавлено:Сб Dec 20, 2008 12:08 amОтветить с цитатой
В Юникоде первые 256 кодовых позиций совпадают с ISO-8859-1.
Если на сайте только символы с этих позиций, то используй ISO-8859-1.
Если расширенный набор символов, то UTF-8
Oscar the grouch EvaPharmacy. Буржуй не спит, таблетку ждёт – руби бабло хоть круглый год! Инвайты: [email protected] ICQ: 750000
Grover StudyCash. Гость, ты не останешься без дохода! Убедись сам! До 75% от новых и до 25% за ре...

brantozawr
Опытный
Зарегистрирован: 10.11.2008
Сообщений: 126
Обратиться по нику
# Добавлено:Сб Dec 20, 2008 12:16 amОтветить с цитатой
DrKronos, не 256, а с 0 по 127. со 128 символа в UTF уже выделяется 2 байта на символ. с 2048-го - 3 байта на символ, с 2097152 - 4 байта.

DrKronos
SEO-доктор
Зарегистрирован: 11.03.2008
Сообщений: 8879
Moder (Сумма: 1)
Обратиться по нику
# Добавлено:Сб Dec 20, 2008 1:00 amОтветить с цитатой
Я это предложение скопировал отсюда http://ru.wikipedia.org/wiki/ISO-8859-1 Все претензии к Вике :mrgreen:
Oscar the grouch EvaPharmacy. Буржуй не спит, таблетку ждёт – руби бабло хоть круглый год! Инвайты: [email protected] ICQ: 750000
Grover StudyCash. Гость, ты не останешься без дохода! Убедись сам! До 75% от новых и до 25% за ре...

brantozawr
Опытный
Зарегистрирован: 10.11.2008
Сообщений: 126
Обратиться по нику
# Добавлено:Сб Dec 20, 2008 1:20 amОтветить с цитатой
Там имеется в виду, что они совпадают по внешнему виду. Т.е. 256 символов ISO-8859-1 и UTF-8 выглядят одинаково, но закодированы по разному. А по кодам совпадают только первые 128 символов.

Собственно, вот Вика про 128 символов и пишет http://ru.wikipedia.org/wiki/UTF-8
Новая тема Написать ответ    ГЛАВНАЯ ~ ТЕХНИЧЕСКИЕ ВОПРОСЫ

Перейти:  





Генеральный спонсор



Партнеры