Tue, 7 Mar 2006 17:11:51 +0300 (MSK)
Igor Sysoev <is@xxxxxxxxxxxxx> писал(а):
> On Tue, 7 Mar 2006, AleXXX V. NovikoFF wrote:
>
> >
> > Mon, 6 Mar 2006 23:29:19 +0300 (MSK)
> > Igor Sysoev <is@xxxxxxxxxxxxx> писал(а):
> >
> >> On Tue, 7 Mar 2006, AleXXX V. NovikoFF wrote:
> >>
> >>>
> >>> Mon, 6 Mar 2006 22:48:37 +0300 (MSK)
> >>> Igor Sysoev <is@xxxxxxxxxxxxx> писал(а):
> >>>
> >>>> On Tue, 7 Mar 2006, AleXXX V. NovikoFF wrote:
> >>>>
> >>>>>> On Sat, 25 Feb 2006, AleXXX V. NovikoFF wrote:
> >>>>>>
> >>>>>>> Вот в очередной раз у меня бага....
> >>>>>>> Скрин: http://alexxx.ru/tmp/bug.gif
> >>>>>>>
> >>>>>>> Как такое происходит... в логах пусто (ошибок нет),
> >>>>>>> процессы не рестартовали, память не кушают, процессор тоже...
> >>>>>>> на сайте в этот момент постоянная ошибка 500...
> >>>>>>> помог только рестарт nginx...
> >>>>>>
> >>>>>> Какая OS ?
> >>>>>> Если выдаётся 500, то в error_log должно быть что-то хотя бы на уровне
> >>>>>> crit.
> >>>>>
вот только что ошибка повторяется, заметил особенность, она происходит в
17-38 :) в прошлые 2 раза (не 2 раза подряд) в тоже время...
такое ощущение, что кто-то досит сайт..... однакож нетстат молчит...
в еррор_логе:
2006/03/08 19:08:04 [alert] 1955#0: accept() failed (24: Too many open files)
while accepting new connection on
195.208.234.158:80
2006/03/08 19:08:05 [alert] 1955#0: accept() failed (24: Too many open files)
while accepting new connection on
195.208.234.158:80
и т.д.
ошибка вылетает не всегда, т.е. если пообновлять страницу - можно что-то
увидеть, кстати, она выдается нативная, а не та, которая определена в
конфиге (не 500.html)
в данный момент показывает 4к коннектов, а нетстат только 400 (всего!)
воркер разросся до 100 метров (изначально был 7-8 метров)
процессор не кушает, нагрузки не дает, т.е. у 30% посетителей сайт
работает как обычно
в конфиге:
worker_rlimit_nofile 8192;
worker_rlimit_sigpending 32768;
ulimit -n = 10240
десять тысяч файлов он теоретически даже открыть не мог бы, максимум
одновременно бывает 300 потоков, один нгинкс обслуживает ровно один сайт
в netstat -n
очень много висит в таком состоянии: (не 4 тыщи, но порядочно)
tcp 0 0 127.0.0.1:80 127.0.0.1:46748 TIME_WAIT
tcp 0 0 127.0.0.1:80 127.0.0.1:47004 TIME_WAIT
tcp 0 0 127.0.0.1:80 127.0.0.1:45724 TIME_WAIT
можно ли как то от этого избавиться?
На бэкэнде работает апач 1.3.33
вот:
lsof|grep nginx |wc -l
8224
воркер у меня один, смотрю lsof|grep nginx
и там почти все открытые файлы - это один и тот же файл!!!
nginx 1955 apache.mults 8164r REG 22,1 734070784 16712106
/home/multiki/mult_ftp/mults/knyaz_vladimir.avi
nginx 1955 apache.mults 8165r REG 22,1 734070784 16712106
/home/multiki/mult_ftp/mults/knyaz_vladimir.avi
nginx 1955 apache.mults 8166u sock 0,4 12260097
can't identify protocol
nginx 1955 apache.mults 8167r REG 22,1 734070784 16712106
/home/multiki/mult_ftp/mults/knyaz_vladimir.avi
nginx 1955 apache.mults 8168r REG 22,1 734070784 16712106
/home/multiki/mult_ftp/mults/knyaz_vladimir.avi
nginx 1955 apache.mults 8169r REG 22,1 734070784 16712106
/home/multiki/mult_ftp/mults/knyaz_vladimir.avi
nginx 1955 apache.mults 8170u sock 0,4 11697685
can't identify protocol
что за? :(
--
AleXXX V. NovikoFF <alexxx@xxxxxxxxx>