Базы данных. Инжиниринг надежности
Қосымшада ыңғайлырақҚосымшаны жүктеуге арналған QRRuStore · Samsung Galaxy Store
Huawei AppGallery · Xiaomi GetApps

автордың кітабынан сөз тіркестері  Базы данных. Инжиниринг надежности

Василий
Василийдәйексөз келтірді1 жыл бұрын
Facebook: замедление загрузки страницы на 500 миллисекунд приводит к уменьшению трафика на 3 %;
2 Ұнайды
Комментарий жазу
Илья М.
Илья М.дәйексөз келтірді1 жыл бұрын
Строгое разделение обязанностей между инженером-программистом и инженером баз данных.
1 Ұнайды
Комментарий жазу
Mikhail Senin
Mikhail Seninдәйексөз келтірді2 ай бұрын
Исходя из этого, первое, чем следует заняться, — частота ошибок выполнения запросов пользователей. Это называется также мониторингом реальных пользователей (Real User Monitoring, RUM). Например, когда пользователь отправляет HTTP-запрос из браузера, получает ли он корректный ответ от сервиса? Если сервис популярен, то таких данных может быть очень много. Например, важное событие в глобальной службе новостей привлекает более 70 000 обращений к веб-сервису за секунду. Подсчитать частоту появления ошибок для такого объема данных вполне по силам любому современному процессору. Все эти данные передаются приложением (например, Apache HTTP-сервером) в демон протоколирования (например, в системный журнал Linux).
Комментарий жазу
Mikhail Senin
Mikhail Seninдәйексөз келтірді2 ай бұрын
Какие последствия для пользователей имеют простои разной длительности: • один неудачный запрос; • 30 секунд; • 1 минута; • 5 минут; • 1 час и больше? После этого можно пересмотреть и заново оценить базовые SLO доступности, определив: • временной интервал; • максимальную продолжительность инцидента;
Комментарий жазу
Mikhail Senin
Mikhail Seninдәйексөз келтірді2 ай бұрын
Есть ли обходные пути решения проблем во время простоя? Можете ли вы работать в ограниченном режиме, например только чтения? Можно ли использовать закэшированные ранее данные, пусть даже и устаревшие?
Комментарий жазу
Mikhail Senin
Mikhail Seninдәйексөз келтірді2 ай бұрын
возможность рассматривать сбой как обычный сценарий в системе, для чего необходимо, чтобы процедуры автоматического и ручного восстановления были хорошо документированы, тщательно спроектированы, проверены на практике и интегрированы в повседневную работу.
Комментарий жазу
Mikhail Senin
Mikhail Seninдәйексөз келтірді2 ай бұрын
Имеет смысл рассматривать доступность вашего сервиса сразу в двух аспектах. Первый из них — это среднее время между отказами (Mean Time Between Failures, MTBF). Предотвращение сбоев всегда было приоритетом, то есть чем больше MTBF, тем лучше. Второй аспект — это среднее время восстановления (Mean Time To Recover, MTTR). Это время, необходимое для возобновления обслуживания после сбоя. Чем оно меньше, тем лучше!
Комментарий жазу
Mikhail Senin
Mikhail Seninдәйексөз келтірді2 ай бұрын
Надежность хранения может быть выражена как временное окно, например: в случае сбоя системы могут быть потеряны данные, записанные в течение не более чем последних 2 секунд.
Комментарий жазу
Mikhail Senin
Mikhail Seninдәйексөз келтірді2 ай бұрын
Однако SLA — это нечто большее, чем просто перечень требований. SLA включают в себя средства возмещения ущерба, способы воздействия и многое другое, что выходит за рамки этой книги. Итак, мы сосредоточимся на понятии «целевой уровень качества обслуживания», или «целевой показатель качества обслуживания» (Service-Level Objective, SLO). SLO — это обязательства архитекторов и операторов, которые определяют структуру и функционирование системы для выполнения этих обязательств.
Комментарий жазу
Марьяна Л.
Марьяна Л.дәйексөз келтірді3 ай бұрын
Протокол TCP/IP станет вашим лучшим другом при устранении проблем с задержками и доступностью. Мы настоятельно рекомендуем вам изучить его. Для этого хорошо подходит том 1 книги Дугласа Э. Комера (Пирсона) (Douglas E. Comer (Pearson)) Internetworking with TCP/IP. В 2014 году она была переиздана
Комментарий жазу