ПРОЕКТЫ 


  АРХИВ 


Apache-Talk @lexa.ru 

Inet-Admins @info.east.ru 

Filmscanners @halftone.co.uk 

Security-alerts @yandex-team.ru 

nginx-ru @sysoev.ru 


  СТАТЬИ 


  ПЕРСОНАЛЬНОЕ 


  ПРОГРАММЫ 



ПИШИТЕ
ПИСЬМА












     АРХИВ :: nginx-ru
Nginx-ru mailing list archive (nginx-ru@sysoev.ru)

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Подскажите - как боротьс я с парсерами


  • To: nginx-ru@xxxxxxxxx
  • Subject: Re: Подскажите - как боротьс я с парсерами
  • From: Anton Kuznetsov <maybe@xxxxxxxxxxxx>
  • Date: Tue, 26 Apr 2011 15:16:21 +0200
  • Dkim-signature: v=1; a=rsa-sha256; c=relaxed/relaxed; d=arjlover.net; s=google; h=domainkey-signature:mime-version:sender:x-originating-ip :in-reply-to:references:date:x-google-sender-auth:message-id:subject :from:to:content-type; bh=22eG1dtZT78TsJYsJ3IHFqg+lRQAE73sMaWWHd72Djk=; b=adIKoz689YmeN0ewTGXV2ISokI5XFcn8KpwJlSAf5d85HnwQw6OnZvR/ibUgp+T3dK JovLh7r6tDEOuM26fxsg3ez5ZOb2WY3l/J9gMLJx9bHcaQH6YvRAkuVD3uQeUs1Q2Zb6 YRY8mSalEug8tbSZMcgfyvIyLAU3uGkn4Fu/0=
  • Domainkey-signature: a=rsa-sha1; c=nofws; d=arjlover.net; s=google; h=mime-version:sender:x-originating-ip:in-reply-to:references:date :x-google-sender-auth:message-id:subject:from:to:content-type; b=TbAkNPyBnoiLLV5y3zCxNYde+cCugpKkqTmSJbSG4qEzuGxMGqHpdZ3gM0lG4H68sB h+uYWSGiyX6MWaoeb8Wmkbu6F9aH0fP3s9ZYgksVGScNjS05WTOkNdpFwoTp1L+cIZ1q /USZLiMiqPr9r2x6buWWmivdCSyaNp6vb7EDs=
  • In-reply-to: <4DAEA577.7040203@xxxxxxxx>
  • References: <4DAEA577.7040203@xxxxxxxx>

Одним нжинксом тут не отделаешься, он поможет если парсят в 100 потоков, а так... в любом случае парсер будет приспосабливаться.  Пишите анализатор логов и баньте по айпи. Пока это однопотоковый скрипт на одном адресе - ничего сложного. ;)



2011/4/20 maxim <maxim@xxxxxxxx>
У нас портал. На нем обьявления.
И возникает ситуация когда конкуренты начинают парсить скриптами сайт и копипастить обьявления.
поставил в настройках nginx

http {
.....
 limit_req_zone $binary_remote_addr zone=one:5m rate=25r/s;
 limit_zone two $binary_remote_addr  1m;
.....

server {
        listen 80;
......
limit_req zone=one burst=35 nodelay;
limit_conn   two  5;

Но не помогло. Вчера была такая картина
Айпи                 Время                         Хиты
93.126.72.176   20:28:07 - 20:28:07 1
93.126.72.176   20:28:06 - 20:28:06 1
93.126.72.176   20:28:05 - 20:28:05 1
93.126.72.176   20:28:05 - 20:28:05 1
93.126.72.176   20:28:04 - 20:28:04 1
93.126.72.176   20:28:04 - 20:28:04 1
93.126.72.176   20:28:04 - 20:28:04 1
93.126.72.176   20:28:03 - 20:28:03 1
93.126.72.176   20:28:02 - 20:28:02 1
....
93.126.72.176   20:26:52 - 20:26:52 1
93.126.72.176   20:26:51 - 20:26:51 1
93.126.72.176   20:26:51 - 20:26:51 1
93.126.72.176   20:26:51 - 20:26:51 1

Тоесть с этого айпи каждую секунду происходит одно соединение.
Понятно что это не человек.
Подскажите как с таким боротся? Возможно я неверно  указал настройки? Или это не силами nginx делается?


_______________________________________________
nginx-ru mailing list
nginx-ru@xxxxxxxxx
http://nginx.org/mailman/listinfo/nginx-ru




--
Best regards,
Anton Kuznetsov.      
_______________________________________________
nginx-ru mailing list
nginx-ru@xxxxxxxxx
http://nginx.org/mailman/listinfo/nginx-ru


 




Copyright © Lexa Software, 1996-2009.