眾所周知I2017年度國內外十大宕機事件盤點

時間:2017-12-06 欄目:技術前沿

防范未然

讓世界早有準備

“數據庫被刪了、勒索病毒原來這么厲害、英航空大面積延誤、鹿晗微博過熱導致服務器宕掉了……2017年,媒體公開報道的IT宕機事件原因各異,有傳統的病毒攻擊,也有明星熱度引發的宕機、甚至還有前所未聞的前員工刪庫跑路事件……”

下面,我們甄選了十大國內外IT宕機事件——防范未然,讓世界早有準備!
事件1:今日頭條服務器宕機
影響評級:★★
時間:2017.1.6
原因:服務器故障。
持續時間:此后長達30分鐘時間內仍未解決。
影響范圍:不少用戶發現今日頭條出現宕機情況,頁面刷新不顯示,頭條號的編輯后臺亦無法進入。
警示:做好服務器系統的業務連續性建設。
新聞來源:網易財經>>>

http://money.163.com/17/0106/18/CA47UE85002580S6.html

事件2:Gitlab誤刪數據庫
影響評級:★★★★
時間:2017.1.31
原因:Gitlab 遭受DDoS 攻擊,導致數據庫寫入鎖定,網站出現不穩定和宕機,在阻止了惡意郵件發送者之后,運維人員開始修復數據庫不同步的問題,在修復過程中,錯誤的在生產環境上執行了數據庫目錄刪除命令,導致300GB數據被刪除,Gitlab 被迫下線。
持續時間:18小時的服務中斷
影響范圍:丟失用戶近6小時的數據
警示:加強IT審計,備份和恢復測試
新聞來源:鈦媒體>>>

http://www.tmtpost.com/2565002.html

事件3:Instapaper宕機
影響評級:★★
時間:2017.2.9
原因:數據故障是由2014年4月之前創建的RDS實例的2TB文件大小限制造成的,而2014年4月以后創建的實例由ext4文件系統支持,并受6TB文件大小限制。失敗的關鍵系統是我們的MySQL數據庫,該數據庫作為托管解決方案在Amazon的關系數據庫服務(RDS)上運行。
持續時間:2月14日服務才全面恢復
影響范圍:用戶無法正常訪問頁面
警示:每月測試MySQL備份,強化應急中斷工程團隊建設
新聞來源:搜狐CSDN>>>

http://www.sohu.com/a/154636981_115128

事件4:百度搜索移動端故障
影響評級:★★
時間:2017.2.28
原因:未給出原因。
持續時間:20:50- 21:25。
影響范圍:用戶用百度移動端APP無法搜索內容。
警示:需要強化快速恢復服務的能力。
新聞來源:新浪科技>>>

http://tech.sina.com.cn/i/2017-03-02/doc-ifyazwha3499407.shtml

事件5:微軟Azure云服務全球大面積故障
影響評級:★★★
時間:2017.3.16
原因:Storage存儲問題,一個微軟工程團隊確認原因為斷電導致的存儲集群不可用。
持續時間:3月16日6:42-15:37。
影響范圍:微軟分布在全球各地的28個數據中心里,26個出現了存儲故障。部分地區使用 Storage服務的用戶在執行服務管理運營操作(比如創建、更新、刪除)時,可能會收到報錯提醒。其他使用Storage的服務可能也會受到影響。
警示:加強防止大規模數據中心故障發生的制度性工作。
新聞來源:36氪>>>

http://36kr.com/p/5067104.html

事件6:Digital Ocean刪庫宕機
影響評級:★★★
時間:2017.4.5
原因:主數據庫被刪除了。
持續時間:4小時56分鐘。
影響范圍:這次故障導致其控制面板和API失靈,因而害得客戶無法創建新的虛擬服務器(即所謂的“Droplet”)。
警示:除了對主數據庫的訪問進行新的限制外,還對網絡進行了升級,加快數據庫服務器連接的速度。
新聞來源:搜狐云頭條>>>

http://www.sohu.com/a/133370872_465914

事件7:全球多地爆發“WannaCry”系列勒索病毒
影響評級:★★★★★
時間:2017.5.13
原因:WannaCry利用Windows操作系統445端口存在的漏洞進行傳播,并具有自我復制、主動傳播的特性。
持續時間:影響一周時間,并有變種病毒。
影響范圍:英國、中國、俄羅斯等99個國家在醫療、教育、企業、電信等機構受到影響嚴重,受感染服務器的關鍵數據丟失,業務中斷。
警示:及時修訂系統漏洞,做好關鍵數據的CDP持續保護。
新聞來源:騰訊科技 >>>

http://tech.qq.com/a/20170513/005824.htm

事件8:英國航空航班大面積延誤
影響評級:★★★★
時間:2017.5.27
原因:可能是由于將網絡系統外包給印度公司造成。
持續時間:超過2天時間。
影響范圍:英航在全世界的值機系統和飛行系統都受到影響,呼叫中心和官方網站也無法正常運行,導致航班無法起飛,大量乘客滯留機場,很多人的行李也無法拿到。
警示:機場等重要交通場所需要建立可靠、可控的備份系統,并及時啟用備用系統。
新聞來源:界面新聞>>>

http://www.jiemian.com/article/1357415.html

事件9:荷蘭海牙云主機商verelox前員工刪庫
影響評級:★★★★★
時間:2017.6.10
原因:一名前任管理員刪光了該公司所有客戶的數據,并且擦除了大多數服務器上面的內容,客戶數據恢復希望渺茫。
持續時間:一周內恢復正常。
影響范圍:暫時將verelox網絡下線。verelox一直在努力恢復數據,但是這個方法可能恢復不了已丟失的所有數據。
警示:建議更改所有服務器密碼,建立數據防刪機制。
新聞來源:IDC評述網>>>

https://www.idcps.com/news/20170610/95173.html

事件10:微博因鹿晗微博熱度過高宕機
影響評級:★★★
時間:2017.10.8
原因: 由于鹿晗微博熱度過高,訪問量太大。
持續時間:當天下午2點。
影響范圍:微博出現罕見的宕機導致微博客戶端訪問緩慢。
警示:備份更多的服務器以應對高并發海量訪問需求。
新聞來源:IT之家>>>

https://www.ithome.com/html/it/329034.htm

 

『總結』

 
IT系統宕機,已經從2015年的責任追究,到2016年的全民認知提升,到今年勒索病毒導致數據丟失的眾所周知,全行業對信息系統的安全性的關切提升到新的高度。
 
與此同時,我們也欣喜看到,除了個別事件由于遭受惡意刪庫無法恢復,與“2016年國內外宕機事件盤點”相比,2017年的系統宕機事件的恢復時間都有了很大的提升,表明事件故障機構對系統恢復的能力有顯著的提高。
 
防范未然,讓世界早有準備!所有信息化浪潮下的組織機構,建立專業、可靠的數據災備和業務連續性體系不僅僅是規范企業自身的IT建設需求,更是用戶在產品質量信得過以外,企業服務信得過方面的又一重要訴求。
 

為此,我們依舊建議:

 

建設專業的災備系統,不要有僥幸心理

 
信息系統屬于企業重要的信息基礎設施,其安全問題涉及到核心數據資產,關乎企業生存與發展,涉及個人生存與生活,甚至觸及國家和社會的穩定。中華人民共和國國民經濟和社會發展第十三個五年規劃綱要》中明確指出要:強化信息安全保障,包括強化重要信息系統和數據資源保護,加強數據資源在采集、存儲、應用和開放等環節的安全保護,加強各類公共數據資源在公開共享等環節的安全評估與保護等。而對于信息安全、數據安全,災備是最基礎的技術需求,幾乎所有的信息資產都需要災備保護,以確保在任何意外故障情況下,信息系統的正常運轉。
 

2017年6月1日,《中華人民共和國網絡安全法》正式實施。該法從保障網絡產品和服務安全,保障網絡運行安全,保障網絡數據安全,保障網絡信息安全等方面進行了具體的制度設計。該法第二十一條、三十四條明確規定關鍵信息基礎設施的運營者應當履行對重要系統和數據庫進行容災備份的保護義務,并在其他條文中規定了相應的處罰細則。

 

業務連續性管理應該是“老板工程”

 
信息系統環境中的風險點和威脅點往往不是單一的,也不是靜態的,簡單的安全產品堆砌已被證明不是有效的解決途徑。信息系統安全是涉及到技術、人員、組織、環境、法律及管理等多方面因素的系統性問題,應該采用信息保障的原理、技術和方法,以全局的、動態的眼光來研究、設計、實施與維護信息系統安全工作。這需要企業機構的負責人高度的重視,以第一責任人的安全意識規劃統籌業務連續性管理的工作。

推薦閱讀:


災備行業最全常用術語 僅此一份

醫院HIS系統災備實戰演練,全科室無感知切換接管

這是屬于大家的《中國災備技術和行業白皮書2018》

及時響應,快速服務,為您保駕續航

立即注冊

銷售咨詢:400-0078-655
緊急報修:021-61735936
投訴熱線:021-61679076
技術QQ群:532148075
歡迎加入!
隱私聲明
當您在本網站進行合作伙伴注冊登記,本網站將收集您的相關信息,并保存記錄。本網站收集的個人信息包括但不限于:姓名、地址、公司、所在地區、電話號碼以及電子郵件地址等。您主動提供的信息越多及越準確,我們就能夠更好地為您提供有關服務。
咨詢·購買
星际争霸战在线客服