←  Операционные системы Windows

AKADO.Форум

»

Спонтанные перезагрузки Windows server 2k3...

 фотография FeodoR 22 июл 2013

Приветствую!
Собственно "а вдруг поможет кто"...

Преамбула:
В наличии серверочек HP ProLiant DL160 G6 с двумя Xeon E5504 и 32Гб ОЗУ на борту. Две сетевушки (комплектные) объединены в LACP транк и воткнуты в коммутатор (с поддержкой LACP же). К серверу приходят 2 VLAN'а. Своими хардами тело обделено - подключен по FibreChannel в дисковую полку.
Ось - Windows Server 2003 x64 R2.
Из софта на серверочке крутится: PDC, SQL 2005, Exchange. А... Ну и файловый ишшо.

Антивирус - SEP 11 версии c с обновлением до MR7MP1 кажися.

Нагрузка на него небольшая - до 50 человек в сети.

Теперь ситуация: долгие три года вся эта связка превосходно функционировала в режиме 24х7х355 (10 дней января он отдыхал :D ). И тут, не давече чем с четверга начались спонтанные перезагрузки безо всяких записей в логи, BSOD'ов и т. п. Файловые системы без ошибок (во всяком случае chkdsk в этом уверен). Массивы не деградировали (это контроллер полки сообщает). Memtest пока (20% допроверить осталось) уверяет, что всё ОК. Но система с диким упорством уходит в ребут минут через 15...45 (рандомно), а прогрузившись вопрошает "А чего это я...." (Windows was shut down unexpectedly).

Понимаю, что переставить можно. Но откровенно неохота снова всё настраивать (если переставлять, то на 2k8R2). Мне проще будет Linux + samba4 поднять, а с SQL подумать как обойти ограничение специфического софта... Может кто чего подскажет... Куда копнуть, чего посмотреть...

Параллельно с этим телом крутится точно такое же, только с Линухом (ну и другим набором сервисов). Там всё просто идеально...
Сообщение отредактировал FeodoR: 22 июля 2013 - 19:46
Ответить

 фотография FeodoR 23 июл 2013

Давно не брал я в руки шашек, как говорится...
Ошибка следующая:
DRIVER_IRQL_NOT_LESS_OR_EQUAL
STOP 0x0000000D1 (0x0000000000000000, 0x0000000000000002, 0x0000000000000008, 0x0000000000000000)
Вообще много MS понаписала про D1... Это и их race condition в tcpip.sys (KB842840) и проблемы с multipath (KB969255) и, блин, просто так (KB890554)...
Народ на форумах пишет, что скорее всего дрова... Либо сеть либо USB.
Копаю...
Ответить

 фотография FeodoR 23 июл 2013

Продолжение саги о сломавшейся винде.
Видимо всё-таки в сети сломалось что-то...
Отрубил одну сетевуху, погасил один VLAN (сейчас не нужен). Пока тьфу-тьфу пашет...
Хотя часа ещё не прошло...
Ответить

 фотография FeodoR 23 июл 2013

Ладно. Драйвер так драйвер...
Заодно проверим мелкомягкую программу под названием Verifier...

P.S. Жаль, что по прошествии некоторого времени нельзя изменять своё сообщение... Сейчас больше на диалог самого с собой похоже... :crazy:
Сообщение отредактировал FeodoR: 23 июля 2013 - 11:36
Ответить

 фотография FeodoR 01 авг 2013

Ну в общем проблемку порешали. Но как обычно извращённым способом.
Развернули VMWare ESX и перенесли сервак туды. И о чудо! Ошибка осталась. Тем самым лишний раз убедились, что не железо виновато :)
Итогом развернут парк Windows Server 2008 R2 (часть реальных, часть виртуальных), данные из SQL и Exchange перенесены и всё работает (пока?)
Так что причина сбоев не ясна, но работа продолжается...
Ответить