北京2023年4月21日 /美通社/ -- 隨著云計算、大數(shù)據(jù)、人工智能等技術(shù)快速發(fā)展,越來越多的企業(yè)和組織加速數(shù)字化、智慧化轉(zhuǎn)型,并不斷擴大其數(shù)據(jù)中心計算、存儲和網(wǎng)絡(luò)設(shè)備的規(guī)模。據(jù)IDC統(tǒng)計,目前全球有600個超大規(guī)模的數(shù)據(jù)中心,每個都擁有超過5000臺服務(wù)器,預(yù)計到2025年,超大規(guī)模數(shù)據(jù)中心數(shù)量將超過890個。
數(shù)據(jù)中心規(guī)模持續(xù)、快速地增長創(chuàng)造了巨大的市場機遇,但隨著IT設(shè)備的數(shù)量不斷增加,IT環(huán)境和運維環(huán)境的復(fù)雜性與日俱增,任何的錯誤都可能導(dǎo)致數(shù)據(jù)中心系統(tǒng)故障,甚至業(yè)務(wù)中斷,對用戶造成巨大影響。對此,浪潮信息全新升級物理基礎(chǔ)設(shè)施管理平臺ISPIM,面向互聯(lián)網(wǎng)、金融、通信等行業(yè)的云邊數(shù)據(jù)中心,提供服務(wù)器、存儲、網(wǎng)絡(luò)設(shè)備的全生命周期統(tǒng)一智能化管理,讓數(shù)據(jù)中心設(shè)備運行全程無憂,保障用戶業(yè)務(wù)的穩(wěn)定運行。
IT設(shè)備繁多,數(shù)據(jù)中心運維面臨效率與穩(wěn)定性等多重挑戰(zhàn)
傳統(tǒng)數(shù)據(jù)中心運維人員要進行大量的設(shè)備上架、系統(tǒng)更新、運維等一系列的工作。隨著數(shù)據(jù)中心的規(guī)模化發(fā)展,服務(wù)器數(shù)量爆發(fā)式增長,設(shè)備種類多,各類故障發(fā)生的不確定性大,而且隨著數(shù)據(jù)中心設(shè)備的增加,原來粗放的能耗運維管理也需要更加精細化的管理。
首先是設(shè)備種類多,統(tǒng)一管理難度大。比如浪潮信息某跨國IT客戶,在美國加州、馬來西亞擁有多個數(shù)據(jù)中心,其中的服務(wù)器供應(yīng)商、機型、配置多種多樣,運維人員工作量大且容易出錯。因此如何對多地數(shù)據(jù)中心,數(shù)萬臺甚至數(shù)百萬臺的異構(gòu)設(shè)備進行跨地域、統(tǒng)一管理和監(jiān)控面臨很大的挑戰(zhàn)。
其次是存在的各類故障讓數(shù)據(jù)中心安全面臨不確定性。目前數(shù)據(jù)中心的故障率為1%~5%,故障出現(xiàn)概率雖然較低,但仍有可能對數(shù)據(jù)中心業(yè)務(wù)穩(wěn)定性造成嚴(yán)重的影響。如果不能有效進行故障精準(zhǔn)定位、快速預(yù)警以及更進一步的處理,會增加服務(wù)器非計劃停機時間,對用戶造成重大影響。
同時還有數(shù)據(jù)中心能耗成本居高不下的問題。隨著數(shù)據(jù)中心設(shè)備規(guī)模不斷增長,能耗成本越來越高,能耗管理也成為了IT設(shè)備全生命周期管理的一部分。但傳統(tǒng)服務(wù)器運維模式無法單獨對服務(wù)器的功耗進行實時的監(jiān)控和統(tǒng)計,只能通過供電設(shè)備對整個機房(包含空調(diào)、照明、服務(wù)器等)耗電進行統(tǒng)計,能耗管理粒度粗。
浪潮信息ISPIM,數(shù)據(jù)中心設(shè)備的360度智能管家
面對數(shù)據(jù)中心的全新運維挑戰(zhàn),浪潮信息研發(fā)了一套完整的服務(wù)器全生命周期運維方案ISPIM,幫助企業(yè)用戶統(tǒng)一管理服務(wù)器、存儲、網(wǎng)絡(luò)等設(shè)備,提高運維效率、降低運維成本,保障數(shù)據(jù)中心穩(wěn)定的運行。
針對用戶多地數(shù)據(jù)中心設(shè)備種類多,統(tǒng)一管理難度大的問題,ISPIM通過統(tǒng)一接口,協(xié)議,能夠納管多達400種機型,設(shè)備數(shù)量最多可達10萬臺,是目前最大的數(shù)據(jù)中心服務(wù)器運維平臺。在自動化運維管理方面,ISPIM平臺資產(chǎn)快捷清查功能支持設(shè)備快速盤點、自動錄入系統(tǒng)、3D全景巡查、統(tǒng)一報表等。在某客戶數(shù)據(jù)中心系統(tǒng)BMC、BIOS升級、軟件部署更新等工作中,通過浪潮信息ISPIM平臺,幫助客戶將3500臺設(shè)備的部署周期從原來預(yù)計的幾十天,縮短至7天,運維效率提升450%以上,實現(xiàn)固件/OS/軟件快速更新,保障數(shù)據(jù)中心穩(wěn)定的運行。同時ISPIM提供豐富的北向API接口,為客戶后續(xù)業(yè)務(wù)應(yīng)用拓展提供更多靈活選擇。
除了大規(guī)模數(shù)據(jù)中心運維需求,針對小規(guī)模部署場景,運維人員無需設(shè)置單獨的集群管理軟件,通過浪潮信息ISPIM SaaS版本將服務(wù)器系統(tǒng)運維工作上云,也可享受浪潮信息服務(wù)器運維專家的360度服務(wù),實現(xiàn)數(shù)據(jù)中心服務(wù)器的遠程托管。同時運維人員還可通過手機APP對服務(wù)器進行帶外管理和監(jiān)控,自動完成服務(wù)器的快速健康體檢,并輸出檢測報告。
隨著數(shù)據(jù)中心IT基礎(chǔ)設(shè)施需求的快速增長,IT環(huán)境和部署環(huán)境愈加復(fù)雜,潛在的各類故障讓數(shù)據(jù)中心安全面臨不確定性。而故障運維管理從最初的腳本運維、工具運維到平臺運維演進至今,已接近人力極限,亟需更加智能化和人性化的運維工具。浪潮信息ISPIM平臺的智能實時預(yù)警功能覆蓋數(shù)萬種服務(wù)器宕機案例,窮盡服務(wù)器CPU、硬盤、內(nèi)存、故障案例,可對非宕機類故障進行實時預(yù)警降低服務(wù)器高負荷運行下突然失效的風(fēng)險。
同時,開機過程中ISPIM會進行故障實時檢測與隔離,CPU、存儲等各子模塊進行自檢檢測,若有問題會及時隔離,運行階段會對內(nèi)存進行實時的巡檢檢測,主板、電源也會設(shè)置故障智能診斷,故障日志分析、故障預(yù)警等前沿技術(shù),包括了浪潮信息ISBMC、InService、AIOPS等故障處理能力。此外,ISPIM的故障診斷定位精度領(lǐng)先,精準(zhǔn)度達到95%,遠高于業(yè)界50%的平均標(biāo)準(zhǔn),讓數(shù)據(jù)中心故障運維效率提升80%。
針對數(shù)據(jù)中心設(shè)備能耗優(yōu)化,浪潮信息ISPIM設(shè)計了數(shù)據(jù)中心能耗實時監(jiān)測,可以實時采集服務(wù)器在運行時耗費的電能,并根據(jù)數(shù)據(jù)中心溫度、濕度、氣流等因素綜合調(diào)整優(yōu)化,可以動態(tài)管理單機和數(shù)據(jù)中心的功耗,進一步優(yōu)化、均衡服務(wù)器運行負載,提升整體業(yè)務(wù)運行的可靠性,節(jié)省約15%~20%的能耗。
目前,浪潮信息ISPIM憑借著這些優(yōu)勢,在海內(nèi)外收獲了廣泛的認可,為全球互聯(lián)網(wǎng)、金融、通信、IT、教科研等用戶的數(shù)據(jù)中心,提供全程無憂的運維服務(wù),保障數(shù)據(jù)中心業(yè)務(wù)安全、穩(wěn)定地運行。