Hello Slawa,
Sunday, June 18, 2000, 10:07:48 PM, you wrote:
SO> On Sun, Jun 18, 2000 at 09:39:22PM +0400, Oleg Ilin wrote:
>> >> >> OI>>> А вы можете узнать какие странички запросил определенный ip в
>> >> >> OI>>> определенный день?
>> >> >> at> Ого. Вы представляете, какого размера должна быть база с такими
>> >> >> at> логами хотя бы за месяц? У меня за неделю с гиг набегает, это без
>> >> >> at> индексации, а если это в SQL засунуть, мне и подумать страшно
>сколько
>> >> >> at> выйдет.
>> >> >> Проблема не в объеме.
>> >> >> IP - 4 байта, дата - 4 байта, user-agent - 2-3 байта (+ "словарь"),
>URL - пусть
>> >> >> 4 байта (хотя покажите мне у кого оно не влезет в 3 байта :), referer
>- 4
>> >> >> байта. Итого - 20 байт на строчку лога, думаю можно и меньше.
>> >> SO> Про referer не понял, почему так мало?
>> >> А вам мало для индекса 16^8 индексов для рефереров?
>>
>> SO> А черт их разберет, с альтавистами этими.
>>
>> http://info.webcrawler.com/mak/projects/robots/active/html/index.html
>>
>> Для этих вполне зватит.
>> А вордсы действительно в отдельный индекс ;)
Ой, а кто спайдерит странички? Роботы -> Поисковые системы к которым
они привязаны: как говорится: "смотрите внимательнее":
http://info.webcrawler.com/mak/projects/robots/active/html/scooter.html
а?
Best regards,
Oleg mailto:ilin@rinet.ru
=============================================================================
= Apache-Talk@lists.lexa.ru mailing list =
Mail "unsubscribe apache-talk" to majordomo@lists.lexa.ru if you want to quit.
= Archive avaliable at http://www.lexa.ru/apache-talk =