> On Saturday 09 September 2006 21:35, Sergey Serov wrote:
>> On Saturday 09 September 2006 19:36, Igor Sysoev wrote: >>> On Sat, 9 Sep 2006, Sergey Serov wrote: >>>> Имею следующую проблему. >>>> Если у nginx выставлен таймаут напр. 10 сек., то иногда если fastcgi
>>>> сервер не успел уложиться в эти 10 сек. он зависает судя по strace в >>>> read() того того файлового дескриптора, который судя по strace >>>> используется для связи с nginx.
>>>> >>>> Проблема эта мучала меня сильно, главным обзазом тем, что я долго не >>>> мог понять природу зависаний. Но вроде сейчас все изучил, стало легче. >>>>
>>>> По идее такого быть не должно, т.к. fastcgi должен получить broken pipe >>>> и завершить работу. >>>> >>>> Fastcgi сервер - скрипт Catalyst'a, который использует испытанный
>>>> перловый модуль FCGI::ProcManager который живет без изменений аж 5 лет >>>> уже. Он в свою очередь использует CGI::Fast, который изменяется чаще. >>>> >>>> Кто тут виноват пока незнаю.
>>>> >>>> Пока сделал pkill -9 -f perl-fcgi если не curl -sm 15 url. >>>> >>>> Видимо, правильнее всего написать свой ProcManager. >>>> >>>> У кого-нибудь были аналогичные проблемы и каковый были способы решения?
>>> >>> Судя по тому, что используется strace - это Линукс. >> >> Во FreeBSD я тоже strace использую, даже использовал когда еще на Линукс не >> мигрировал, чем-то он мне больше нравился чем truss.
>> Но в данном случае это Линукс. >> >>> Какое ядро ? >> >> 2.6.8-2-386 >> >>> У меня последнее время на ядрах 2.6.x есть обратные сообщения - когда
>>> сервер закрывает соединение - а nginx об этом не знает. >> >> В strace периодически вижу broken pipe на дескриптор коннекшина с nginx, >> при этом соотв. fastcgi продолжает работу.
>> >> Сперва думал что проблема из-за firewall'а который немного необычно >> настраивается в отличии от ipfw. Но проблема не пропадала после его >> отключения. >> >> Можно с этим что-то поделать?
> > Зависания иногда бывают фатальные. > Зависает один процесс fastcgi в статусе R и съедает весь процессор. > Кильнуть его нельзя, даже -9. PPID у него становится 1. Убить его вообще не > возможно, можно только ребутнуть сервер.
> Несколько часов поиска результатов не принесли. > Задница полная :-(((
Судя по симптомам, дело не в nginx'е, и не в fastcgi, а в ядре. Я могу сделать небольшой test-case того, что я видел во взаимодействии
nginx/trac, но писать в lkml у меня нет никакого желания. Если есть желающие, то могу сделать.