Перейти к содержимому

(499) 940-40-00 подключение
(499) 940-00-00 служба поддержки

Спонтанные перезагрузки Windows server 2k3R2 x64


Сообщений в теме: 4

#1 FeodoR

    Постоялец


  • Пользователи
  • 389 сообщений
91
Offline

Отправлено 22 июля 2013 - 19:31

Приветствую!
Собственно "а вдруг поможет кто"...

Преамбула:
В наличии серверочек HP ProLiant DL160 G6 с двумя Xeon E5504 и 32Гб ОЗУ на борту. Две сетевушки (комплектные) объединены в LACP транк и воткнуты в коммутатор (с поддержкой LACP же). К серверу приходят 2 VLAN'а. Своими хардами тело обделено - подключен по FibreChannel в дисковую полку.
Ось - Windows Server 2003 x64 R2.
Из софта на серверочке крутится: PDC, SQL 2005, Exchange. А... Ну и файловый ишшо.

Антивирус - SEP 11 версии c с обновлением до MR7MP1 кажися.

Нагрузка на него небольшая - до 50 человек в сети.

Теперь ситуация: долгие три года вся эта связка превосходно функционировала в режиме 24х7х355 (10 дней января он отдыхал :D ). И тут, не давече чем с четверга начались спонтанные перезагрузки безо всяких записей в логи, BSOD'ов и т. п. Файловые системы без ошибок (во всяком случае chkdsk в этом уверен). Массивы не деградировали (это контроллер полки сообщает). Memtest пока (20% допроверить осталось) уверяет, что всё ОК. Но система с диким упорством уходит в ребут минут через 15...45 (рандомно), а прогрузившись вопрошает "А чего это я...." (Windows was shut down unexpectedly).

Понимаю, что переставить можно. Но откровенно неохота снова всё настраивать (если переставлять, то на 2k8R2). Мне проще будет Linux + samba4 поднять, а с SQL подумать как обойти ограничение специфического софта... Может кто чего подскажет... Куда копнуть, чего посмотреть...

Параллельно с этим телом крутится точно такое же, только с Линухом (ну и другим набором сервисов). Там всё просто идеально...

Сообщение отредактировал FeodoR: 22 июля 2013 - 19:46


#2 FeodoR

    Постоялец


  • Пользователи
  • 389 сообщений
91
Offline

Отправлено 23 июля 2013 - 06:56

Давно не брал я в руки шашек, как говорится...
Ошибка следующая:
DRIVER_IRQL_NOT_LESS_OR_EQUAL
STOP 0x0000000D1 (0x0000000000000000, 0x0000000000000002, 0x0000000000000008, 0x0000000000000000)
Вообще много MS понаписала про D1... Это и их race condition в tcpip.sys (KB842840) и проблемы с multipath (KB969255) и, блин, просто так (KB890554)...
Народ на форумах пишет, что скорее всего дрова... Либо сеть либо USB.
Копаю...

#3 FeodoR

    Постоялец


  • Пользователи
  • 389 сообщений
91
Offline

Отправлено 23 июля 2013 - 09:12

Продолжение саги о сломавшейся винде.
Видимо всё-таки в сети сломалось что-то...
Отрубил одну сетевуху, погасил один VLAN (сейчас не нужен). Пока тьфу-тьфу пашет...
Хотя часа ещё не прошло...

#4 FeodoR

    Постоялец


  • Пользователи
  • 389 сообщений
91
Offline

Отправлено 23 июля 2013 - 11:35

Ладно. Драйвер так драйвер...
Заодно проверим мелкомягкую программу под названием Verifier...

P.S. Жаль, что по прошествии некоторого времени нельзя изменять своё сообщение... Сейчас больше на диалог самого с собой похоже... :crazy:

Сообщение отредактировал FeodoR: 23 июля 2013 - 11:36


#5 FeodoR

    Постоялец


  • Пользователи
  • 389 сообщений
91
Offline

Отправлено 01 августа 2013 - 08:10

Ну в общем проблемку порешали. Но как обычно извращённым способом.
Развернули VMWare ESX и перенесли сервак туды. И о чудо! Ошибка осталась. Тем самым лишний раз убедились, что не железо виновато :)
Итогом развернут парк Windows Server 2008 R2 (часть реальных, часть виртуальных), данные из SQL и Exchange перенесены и всё работает (пока?)
Так что причина сбоев не ясна, но работа продолжается...





Количество пользователей, читающих эту тему: 1

0 пользователей, 1 гостей, 0 анонимных