АРМАДА
1 триллион страниц
На страницу 1, 2  След.
Новая тема Написать ответ

Вацлав
Banned
Зарегистрирован: 21.02.2006
Сообщений: 4966
Обратиться по нику
# Добавлено:Сб Июл 26, 2008 8:35 pmДобавить в избранноеОтветить с цитатой
Гугл анонсировал свой маленький праздник. По состоянию на 25-ое июня, в индексе поисковика находится 1 триллион веб-документов (1,000,000,000,000). А еще в 1998 году этих страниц было "всего" 26 миллионов.

Как же к этому пришел Гугл? Он начал с набора определенных начальных страниц и пошел по исходящим с них ссылкам (считается, что это были сайты Microsoft, Adobe, Netscape, DMOZ и CNN - но версии разнятся). И так, ссылка за ссылкой накопился огромный "линк-лист". Но не все документы, на которые были разнообразные ссылки попали в индекс. Многие из этих документов дублировали друг-друга, некоторые были автогенерируемые (гы!). Отсеяв такие "ненужные" документы гугл и получил показатель в 1 триллион. И при этом количество страниц известных гуглу вырастает ежедневно на несколько миллиардов!

Так сколько же всего уникальных документов в сети? Этого даже не знает Гугл. Он попросту не успевает пересчитать все страницы сразу.

Полный текст документа (со всякими интересностями):
http://googleblog.blogspot.com/2008/07/we-knew-web-was-big.html

Hello_Kitty
V.I.P.
Зарегистрирован: 30.04.2007
Сообщений: 10705
Обратиться по нику
# Добавлено:Сб Июл 26, 2008 9:45 pmОтветить с цитатой
интересно, а страницы доров (особенно многостраничных) вошли в этот триллион? Wink
или они как раз отсеялись как "ненужные документы"?
Dedicated Hosting & Virtual Dedicated Hosting (XEN virtualization) / Openvpn & Pptp & Double & Http Proxy

Chin +
олорирропролл
Зарегистрирован: 29.01.2007
Сообщений: 2890
Обратиться по нику
# Добавлено:Сб Июл 26, 2008 10:16 pmОтветить с цитатой
Недавно один человек вогнал несколько сот МИЛЛИАРДОВ страниц в индекс. Вот это тема была Wink
Правда спалили быстро.

Hello_Kitty
V.I.P.
Зарегистрирован: 30.04.2007
Сообщений: 10705
Обратиться по нику
# Добавлено:Сб Июл 26, 2008 10:44 pmОтветить с цитатой
Chin, :mrgreen: вот на таких вот людях и держится гугл с рекордом в "триллионом"! :thup:
Dedicated Hosting & Virtual Dedicated Hosting (XEN virtualization) / Openvpn & Pptp & Double & Http Proxy

Inquisitor
Инквизицию никто не ждет
Зарегистрирован: 04.12.2007
Сообщений: 1971
Обратиться по нику
# Добавлено:Сб Июл 26, 2008 11:37 pmОтветить с цитатой
Capitalist.net - платежная система в формате "все включено", пользуюсь и рекомендую:Webmoney, Epese, ЯД, QIWI, B...

Hello_Kitty
V.I.P.
Зарегистрирован: 30.04.2007
Сообщений: 10705
Обратиться по нику
# Добавлено:Вс Июл 27, 2008 1:55 amОтветить с цитатой
вах! это тот человек, о котором говорит Чин?
я так понял это фрихост какой-то, там много всяких разношерстных доров.
Dedicated Hosting & Virtual Dedicated Hosting (XEN virtualization) / Openvpn & Pptp & Double & Http Proxy

Mr Frod +
Гуру
Зарегистрирован: 06.03.2007
Сообщений: 1247
Обратиться по нику
# Добавлено:Вс Июл 27, 2008 2:15 amОтветить с цитатой
t1ps2see.com
rfni70.org
jkthy0.org
geku8h.org

Это тоже его сайты?
Загружаешь ролики на ютуб? $700 в сутки не предел http://goo.gl/rLhWe2

Mr Frod +
Гуру
Зарегистрирован: 06.03.2007
Сообщений: 1247
Обратиться по нику
# Добавлено:Вс Июл 27, 2008 2:18 amОтветить с цитатой
Да, вывести миллиарды страниц за две недели это что то?
Загружаешь ролики на ютуб? $700 в сутки не предел http://goo.gl/rLhWe2

Inquisitor
Инквизицию никто не ждет
Зарегистрирован: 04.12.2007
Сообщений: 1971
Обратиться по нику
# Добавлено:Вс Июл 27, 2008 2:36 amОтветить с цитатой
Hello_Kitty,
Да именно он. Он нашел какой то глюк в гугле, но быстро об этом стало известно и инженеры закрыли багу.
Capitalist.net - платежная система в формате "все включено", пользуюсь и рекомендую:Webmoney, Epese, ЯД, QIWI, B...

Chin +
олорирропролл
Зарегистрирован: 29.01.2007
Сообщений: 2890
Обратиться по нику
# Добавлено:Вс Июл 27, 2008 2:51 amОтветить с цитатой
Я не буду утверждать, но я на 90% уверен что это молдаван был.
Если это был не представитель молдовы - я сильно удивлюсь.

Вацлав
Banned
Зарегистрирован: 21.02.2006
Сообщений: 4966
Обратиться по нику
# Добавлено:Вс Июл 27, 2008 2:55 amОтветить с цитатой
Этот человек - мудак. Жертва собственной жадности. Его очень нелюбят. Тема работала давно и успешно. Но все кто были в курсе - работали аккуратно. Ну 10К страниц, ну 100К с домена. Ну может миллион. Это было незаметно и это работало. И тут кому-то (денег на домены что-ли не было?) пришла в голову "гениальная" идея наплодить миллиарды страниц. Естественно, что это не прошло незамеченным, поднялся шум и гугл поправил багу. В принципе, за отмену трастовости сабдоменов основного домена можно сказать "спасибо" этому человеку.

Lkv7
Пассажир мандариновой травы
Зарегистрирован: 04.07.2007
Сообщений: 899
Обратиться по нику
# Добавлено:Вс Июл 27, 2008 5:37 pmОтветить с цитатой
Chin, чё молдован то сразу?
Птиптчка
Шмели с бешенным ратио и отличной ребильность - 70 баксов с 1.5к уников

Rayden
Опытный
Зарегистрирован: 25.09.2007
Сообщений: 310
Обратиться по нику
# Добавлено:Вс Июл 27, 2008 7:40 pmОтветить с цитатой
Lkv7 писал(а):
Chin, чё молдован то сразу?



http://umaxforum.com/showthread.php?t=12590

пысы. Случай этот произошел два года назад. Гугль так и не признался в том, что его найипали и сказал, что это был, цитирую, "bad data push" :mrgreen:

Chin +
олорирропролл
Зарегистрирован: 29.01.2007
Сообщений: 2890
Обратиться по нику
# Добавлено:Вс Июл 27, 2008 9:05 pmОтветить с цитатой
Lkv7, потому что половину топов PPC молдоване держали. Год назад по крайней мере, когда я еще с ппц работал.

BrokenBrake
Бомжевед
Зарегистрирован: 16.02.2007
Сообщений: 3432
Обратиться по нику
# Добавлено:Пт Авг 01, 2008 6:12 amОтветить с цитатой
Кажется, я становлюсь нацистом Mad
Научись ценить время с microToDo
...а работу с рекламодателями автоматизируй!
Новая тема Написать ответ    ГЛАВНАЯ ~ ПОИСКОВЫЕ СИСТЕМЫ

Перейти:  





Генеральный спонсор



Партнеры