Hi!
На сервере с нагрузкой в районе 150 пользователей online (SpyLog counter)
наблюдается периодическое замедление работы. При разглядывании vmstat 1
выяснилось следующее:
(колонка swap убита для более приятного просмота)
procs memory io system cpu
r b w swpd free buff cache bi bo in cs us sy id
0 0 0 0 50652 149360 1365064 0 2740 1612 13587 2 2 96
0 13 0 0 50316 149388 1365416 8 5976 4459 1819 0 1 99
0 0 0 0 50492 149392 1365368 0 488 1225 856 1 2 97
Т.е. в некий момент времени у нас резко возрастает количество процессов,
ожидающих ввода/вывода (приведённое значение не предел, иногда взлетает
до сотни).
В /server-status при этом видим нечто следующее:
_LL_K__LL__L__LWK____LWWK__K_LWK__KRLKK_WWLWW_L_KWKLWKWKKLKLWKW_
_KK__K__KKWLK_W_L_WW_K__L____L_W__K_W___WL_WKL_KLW__L_LKKLL_W__K
W_WLWLWWLW__LKL__KWWWKW_LWLLLLKKLWLLL__KKLK_KWW___LWLLWKKL_L_LR_
K___LKL_LLK_WLKKKLWK_L_WL___W_WWLLLL_KLKKK_WL____KKL_KL_K_____K_
LWLLKWL_WRL__WLK_K_W_WK_WWWKL_LL__WK_KKL_KKLKLLKLKKKK_LL____KL_K
KWLKLLWKLWLLK_LLWKLLLLK_LKKLLKKWKWLLL_KL_WKLWL_WLLKLW...........
Никто не знает, почему детишкам время от времени _разом_ хочется
логгироваться? Это local misconfiguration или просто так иногда
случается?
Почему спрашиваю - load adv на машине резко подскакивает и (субъективно)
замедляется отдача контента другими детишками.
Ссылка на железо ниже, других задач на этой машинке нет.
http://www.fujitsu-siemens.com/rl/products/primergy/rx300.html
Два SCSI-винта объединены в Software-RAID (raid1), ОС - ALTLinux Master
2.2 (kernel 2.4.20-alt12.abr5-smp)
--
Бриндеев Андрей
РИА "НОВОСТИ" ("ВЕСТИ")
Москва, Россия
http://www.rian.ru