Google разкри причината за масовия срив на интернет услуги
- Редактор: Мартин Руменов
- Коментари: 0

Компанията призна, че невалидна актуализация е блокирала работата на Spotify, Discord, Snapchat и десетки други популярни платформи
Технологичният гигант Google публикува "мини доклад за инцидент" относно вчерашния масов срив в своята платформа за облачни услуги, който засегна огромна част от интернет пространството. В официалното си изявление компанията изрази съжаление за въздействието, което прекъсването причини на потребителите ѝ по целия свят.
"Дълбоко съжаляваме за въздействието, което този пробив/прекъсване на услугата причини на всички наши потребители и техните клиенти. Големи и малки компании се доверяват на Google Cloud за своите работни натоварвания и ние ще се справим по-добре", се казва в изявлението на технологичния гигант.
Според официалната информация, инцидентът е възникнал в 21:49 часа българско време на 12 юни, а пълното възстановяване на системите е постигнато точно три часа по-късно - в 0:49 часа на 13 юни българско време. Прекъсването е имало глобален характер, като е засегнало системите на Google в целия свят.
Google обясни, че проблемът е бил причинен от "невалидна актуализация на автоматичната квота в системата за управление на API", която се е разпространила в световен мащаб. Това е довело до срив при изпълнението на външни API заявки. За да възстановят работата, екипите на компанията са активирали заобиколен метод за проверка на квотите, което е възстановило услугите в повечето региони в рамките на два часа.
Въпреки това, базата данни за политиките на квотите в регион us-central1 е била претоварена, което е довело до значително по-дълго време за възстановяване в този конкретен регион. Няколко продукта са имали остатъчни ефекти в продължение на един час след отстраняването на основния проблем.
Предстоящи мерки за превенция
За да предотврати подобни инциденти в бъдеще, Google се ангажира да предприеме няколко ключови стъпки:
- Предотвратяване на сривове на платформата за управление на API поради повредени данни
- Въвеждане на защити срещу глобално разгръщане на метаданни без подходящо тестване и мониторинг
- Подобряване на обработката на системни грешки и цялостното тестване за управление на повредени данни
От компанията обещаха в следващите дни да публикуват пълен доклад за инцидента с подробен график и конкретни коригиращи действия.
Сривът засегна десетки популярни платформи и услуги, сред които Spotify, Discord, Snapchat, OpenAI, както и множество услуги на самия Google. Според данни от платформата Downdetector, над 13 000 потребители са докладвали за проблеми през първите часове на инцидента.























