Egenius | 1 Feb 03:13

Re[2]: Сервер падает в kernel panic

Hello Igor,

Friday, February 1, 2008, 1:52:05 AM, you wrote:

IS> On Fri, Feb 01, 2008 at 01:45:01AM +0500, Egenius wrote:

>> Был сервер с медиа контентом, решил перенести его на
более мощный
>> сервер. Поставил Fedora-8 и Nginx-5.34. Все конфиги взял со старого
>> сервера, на котором стояла версия nginx-5.33 Пока сервер
не был
>> нагуржен запросами, всё работало нормально. Как
только с него начали
>> качать сервер упал с сообщением kernel panic.
>> После перезагрузки обнаружил в логах вот это.

IS> sendfile off

>> Jan 31 21:56:50 onyx kernel: general protection fault: 0000 [1] SMP
>> Jan 31 21:56:50 onyx kernel: CPU 1
>> Jan 31 21:56:50 onyx kernel: Modules linked in: nfs lockd
>> nfs_acl autofs4 sunrpc bonding ipv6 8021q nf_nat_ftp
>> nf_conntrack_ftp iptable_nat nf_nat iptable_ma
>> ngle ipt_REJECT xt_tcpudp nf_conntrack_ipv4 xt_state
>> nf_conntrack nfnetlink iptable_filter ip_tables x_tables dm_mirror
>> dm_multipath dm_mod button pcspkr tg3
>>  floppy sr_mod sg cdrom pata_serverworks libata aacraid sd_mod
>> scsi_mod ext3 jbd mbcache uhci_hcd ohci_hcd ehci_hcd
>> Jan 31 21:56:50 onyx kernel: Pid: 15646, comm: nginx Not tainted 2.6.23.9-85.fc8 #1
>> Jan 31 21:56:50 onyx kernel: RIP: 0010:[<ffffffff8109719b>] 
(Continue reading)

Egenius | 1 Feb 03:26

Re[2]: Сервер падает в kernel panic

Hello Olexander,

Friday, February 1, 2008, 3:35:22 AM, you wrote:

>> Как только с него начали качать сервер упал с
сообщением kernel panic.

OS> Возможные причины:
OS> 1. Глюки железа. Наиболее вероятно.
OS> 2. Глюки федоровского ядра (в нём много новых патчей
из нестабильной ветки).

>> Поставил Fedora-8

OS> Fedora на боевом сервере не есть хорошо. Хоть бы из-за
малого срока поддержки.
OS> Более лучшим вариантом будет CentOS. БОльшая
стабильность и поддержка 5 лет.
OS> Если говорить совсем просто - у меня на CentOSе с nginx
никаких проблем нет,
OS> через nginx проходят десятки мегабит трафика.

1. Железо стабильное и до этого проработало
достаточно хорошо безо
всяких сбоев (Работало тоже на федоре)
2. У меня все серваки на федоре и глюков никогда не было.
И до этого
nginx работал стабильно на другой машине под федорой и
не вызывал
проблем.
(Continue reading)

Egenius | 1 Feb 03:32

Re[2]: Сервер падает в kernel panic

Hello Alex,

Friday, February 1, 2008, 4:53:29 AM, you wrote:

AV> Egenius пишет:
>> Здравствуйте !
>>
>> Jan 31 21:56:50 onyx kernel: general protection fault: 0000 [1] SMP
>> Jan 31 21:56:50 onyx kernel: CPU 1
>> Jan 31 21:56:50 onyx kernel: Modules linked in: nfs lockd
>> nfs_acl autofs4 sunrpc bonding ipv6 8021q nf_nat_ftp
>> nf_conntrack_ftp iptable_nat nf_nat iptable_ma
>> ngle ipt_REJECT xt_tcpudp nf_conntrack_ipv4 xt_state
>> nf_conntrack nfnetlink iptable_filter ip_tables x_tables dm_mirror
>> dm_multipath dm_mod button pcspkr tg3
>>   

>> Jan 31 21:56:50 onyx kernel: Call Trace:
>> Jan 31 21:56:50 onyx kernel:  [<ffffffff811eb297>] __alloc_skb+0x69/0x133
>>   
AV> http://kerneltrap.org/mailarchive/linux-kernel/2008/1/13/563921

AV> Возможно дело в сетевой карте/драйверах?
Попробуйте заменить Broadcom на
AV> Intel.
AV>  Если не получится заменить - попробуйте выключить
все доступные по
AV> ethtool -k ускорения.

Заменить не получится.
(Continue reading)

Re: Сервер падает в kernel panic


On 31.01.2008, at 23:45, Egenius wrote:

> Здравствуйте !
>
> Был сервер с медиа контентом, решил перенести его на
более мощный
> сервер. Поставил Fedora-8 и Nginx-5.34. Все конфиги взял со старого
не старовата версия? вроде свежее есть
>
>
> worker_processes  10;
пока не заработает, думаю стоит начать с 1-го
>
>
> error_log   /var/log/nginx/error.log;
>
> events {
>    worker_connections  2000;
маловато ... но неважно
>
> }
>
>
> http {
>    proxy_temp_path /var/spool/nginx/tmp/proxy;
>    fastcgi_temp_path /var/spool/nginx/tmp/fastcgi;
>    client_body_temp_path /var/spool/nginx/tmp/client;
>
>    include       /etc/nginx/mime.types;
(Continue reading)

Egenius | 1 Feb 05:57

Re[2]: яЕПБЕП ОЮДЮЕР Б kernel panic

Hello Alexey,

Friday, February 1, 2008, 9:08:53 AM, you wrote:

AVK> On 31.01.2008, at 23:45, Egenius wrote:

>> Здравствуйте !
>>
>> Был сервер с медиа контентом, решил перенести его на
более мощный
>> сервер. Поставил Fedora-8 и Nginx-5.34. Все конфиги взял со старого
AVK> не старовата версия? вроде свежее есть
>>
>>
>> worker_processes  10;
AVK> пока не заработает, думаю стоит начать с 1-го
>>
>>
>> error_log   /var/log/nginx/error.log;
>>
>> events {
>>    worker_connections  2000;
AVK> маловато ... но неважно
>>
>> }
>>
>>
>> http {
>>    proxy_temp_path /var/spool/nginx/tmp/proxy;
>>    fastcgi_temp_path /var/spool/nginx/tmp/fastcgi;
(Continue reading)

Vasiliy G Tolstov | 1 Feb 08:11
Picon
Gravatar

Re: open_file_cache statistics

Mihal K wrote:
> Mihal K wrote:
>   
>> Igor Sysoev wrote:
>>     
>>> Изменения в nginx 0.6.10                                          03.09.2007
>>>
>>>     *) Добавление: директивы open_file_cache, open_file_cache_retest и 
>>>        open_file_cache_errors.
>>>       
>> RFE: было бы интересно иметь доступ к статистике
hits/misses этого кэша.
>> Иначе в общем случае непонятно, как подбирать его
оптимальный размер.
>>     
>
>
> Добрый день.
>
> Долго ждал появления этой статистики, но так и не
дождался, так что
> пришлось написать самому. Может, кому пригодится.
>
> Выглядит статистика так:
>
> Cached files: 21437 (65.42%)
> Total files: 32768
>
> Hits: 113646 (65.55%)
> Misses: 59717
(Continue reading)

Olexander Shtepa | 1 Feb 08:37

Re: Сервер падает в kernel panic

> 1. Железо стабильное и до этого проработало
достаточно хорошо безо
> всяких сбоев (Работало тоже на федоре)

Сбои происходят невзирая на предыдущую нормальную работу.
cpuburn и memtest помогут прояснить ситуацию. Так же желательно
сделать стресс тесты на сетевую подсистему.

> 2. У меня все серваки на федоре и глюков никогда не было.
И до этого
> nginx работал стабильно на другой машине под федорой и
не вызывал
> проблем.

В федоре уже неоднократно были глючные ядра. Я очень
хорошо помню, когда
после очередного обновления ядра перестали
работать половина сетевых програм
(чете связанное с таймерами в ядре, отчего перестал
select работать).
Dmitry Leonenko | 1 Feb 08:55
Picon

Re: Сервер падает в kernel panic


> 1. Железо стабильное и до этого проработало
достаточно хорошо безо
> всяких сбоев (Работало тоже на федоре)
>   
Друг мой, ну о чем может быть речь? Ядро падает в паник -
это баги ядра, 
даже если я пытаюсь сделать из Linux микроволновку. ну не
должно ядро 
падать, не зависимо от того, что твориться в
юзерленде. Либо железо, 
либо ядро и никак не что-то другое.
> 2. У меня все серваки на федоре и глюков никогда не было.
И до этого
> nginx работал стабильно на другой машине под федорой и
не вызывал
> проблем
С этого момента утверждение перестает быть верным.
Как раньше вас 
советовали, если уж так любите детища RedHat'а, то
советую взять CentOS 
или купить RHEL. Что было, что не было - это все уже не важно,
важно что 
сейчас есть.

Удачи!

Alex Vorona | 1 Feb 10:29
Gravatar

Re: Сервер падает в kernel panic

Egenius пишет:
> Заменить не получится.
>   
возможно это моё личное предубеждение против
броадкомов :). Ускорения 
отключать пробовали?
> Есть одна особенность с сетевыми картами - они
объединены в bond0: 2
> гигабитные сетевухи. Опции bond0: options bond0 mode=2 miimon=100
> Я выставил mode=2, т.к. так-же у нас работает ещё один
сервер, хотя по
> докам все советуют ставить mode=0
>   
реально нужен бондинг - прокачка в один поток 2 Гбит?
Балансировка 
маршрутами даёт тот же эффект, для исходящего с linux трафика.
> Я тоже начал грешить на сеть, но в логах по этому поводу чисто.
>   
ну как сказать чисто: __alloc_skb - выделение памяти под
буффер для 
пакета имхо.

Mihal K | 1 Feb 13:01
Picon

Re: open_file_cache statistics

Vasiliy G Tolstov wrote:
> Mihal K wrote:
>> Mihal K wrote:
>>   
>>> Igor Sysoev wrote:
>>>     
>>>> Изменения в nginx 0.6.10                                          03.09.2007
>>>>
>>>>     *) Добавление: директивы open_file_cache, open_file_cache_retest и 
>>>>        open_file_cache_errors.
>>>>       
>>> RFE: было бы интересно иметь доступ к статистике
hits/misses этого кэша.
>>> Иначе в общем случае непонятно, как подбирать его
оптимальный размер.
>>>     
>>
>> Добрый день.
>>
>> Долго ждал появления этой статистики, но так и не
дождался, так что
>> пришлось написать самому. Может, кому пригодится.
>>
>> Выглядит статистика так:
>>
>> Cached files: 21437 (65.42%)
>> Total files: 32768
>>
>> Hits: 113646 (65.55%)
>> Misses: 59717
(Continue reading)


Gmane