Сбой в работе блогохостинга LiveJournal, который произошел в ночь с 15 на 16 мая, был связан с одновременными авариями на двух группах серверов - кластерах, содержащих пользовательские данные. Об этом рассказал глава LiveJournal Russia Илья Дронов.
Был обнаружен сбой в седьмом из 13 кластеров ЖЖ. На этом кластере хранится, в частности, дневник оппозиционера Алексея Навального. Специалистам пришлось восстанавливать содержимое серверов, скопировав данные с резервного кластера.
"В процессе восстановления кластера №7, система мониторинга отчиталась о сбое в еще одной группе серверов — №9. На ней, в частности, размещен дневник Рустема Адагамова, занимающий первое место в рейтинге ЖЖ. Содержимое этого кластера также пришлось восстанавливать с помощью "зеркала", которое было отключено на время операции. Перенос большого объема данных загрузил интернет-каналы, используемые в инфраструктуре ЖЖ, и восстановительные работы заняли значительный промежуток времени", - сообщает Дронов в ЖЖ.
К утру 17 мая нормальная работа LiveJournal была восстановлена.
Илья Дронов заявил, что предстоит еще выяснить, по какой причине практически одновременно вышли из строя сразу два кластера.