安徽云智科技信息股份有限公司自主研發的“云智數據應用智能檢測平臺”主要針對核心業務、網站等業務系統以及支撐核心系統運行的網絡基礎設施、服務器系統、網絡安全體系、接入鏈路的可用性和基本運行情況進行全天候24小時的自動監測,主動發現業務系統、核心網絡設備、安全設備、服務器系統、核心接入鏈路等異常狀況,并在第一時間給相應的信息系統運維管理者發送告警信息,運維管理者通過該定制開發系統采集的相應信息,及時做出深入的分析,以快速定位相應異常狀況的原因,并能夠結合相應服務提供解決異常狀況的建議和方案。
1、用戶運維管理中存在的問題
用戶信息系統的規模越來越大,信息系統的構成越來越復雜,用戶的很多業務現在都是基于信息系統運轉的,比如日常辦公的OA系統、郵件系統,對外宣傳互動的重要窗口——網站系統,用戶行業專屬的業務系統等,這些核心的業務系統的正常運轉是用戶辦公和業務辦理的基礎保障。用戶的信息系統與核心業務系統之間的關系,已經由早期的弱關聯,到現在的信息系統為業務系統的基礎支撐,甚至信息系統本身就是核心業務系統。與此同時,為了保證核心業務系統的使用覆蓋面以及其高效、穩定、安全的運行,在用戶的網絡體系中,會使用各種鏈路接入和網絡設備、安全設備,這使得網絡體系覆蓋面更廣,安全體系更加完善,但是同時大量的設備也使得網絡結構更加復雜,更多的安全設備使業務數據流經過更多的設備處理,產生更多的不可控因素,可能導致更多的故障點。網絡系統是業務系統的基礎平臺,而業務系統又涉及到系統軟件和系統運行的硬件平臺等,那么當網絡或業務出現異常時,該異常就很可能牽涉到業務軟件、服務終端、網絡體系、中間設備以及各種體系或設備間的銜接、兼容性等問題,這使得一個看似簡單的問題變得非常復雜,我們要定位異常的真正原因,需要投入大量的人力和物力。這些現狀和特點都給用戶信息系統的運維管理工作帶來了巨大的挑戰!
當前用戶在信息系統和核心業務運維管理過程中主要存在以下幾點問題:
p 無法提前發現信息系統和核心業務的運行異常,只能被動等待異常出現之后,經核心業務使用者或信息系統使用者反饋過來才能做出相應的應急響應;
p 缺少主動、智能的探測監控工具,絕大部分情況下只能依賴人為手工測試,效率低下,并且無法長時間保持探測;
p 運維管理者精力時間有限,無法經常主動測試業務和信息系統的可用性和運行健康度;
p 現在常規的網管運維工具過于復雜,用戶受時間、精力限制,無法完全充分使用其全部功能,大部分情況下主要使用其拓撲功能直觀查看接口鏈路通斷問題;
p 用戶通過常規方式獲取的運行信息都是單點的,而不是覆蓋用戶最關心的核心業務交互的整個路徑的;
p 用戶真正關心的圍繞信息系統展開的核心業務運行的健康狀況無法直觀獲得;
p
通過部署應用數據業務智能監測系統可以解決上述用戶在運維管理過程中存在的問題。
2、核心業務管理運維過程中的需求
大部分用戶的信息系統都是為核心業務應用系統服務的,核心業務應用系統是用戶辦公的基礎,核心業務應用出現異?;蚬收?,很可能給用戶帶來難以估計的經濟損失和負面影響。因此核心業務系統是否正常運行是用戶在運維管理過程中最為關心的問題。
但是現在的業務系統絕大部分都是基于接入鏈路、核心網絡設備、安全防護設備、硬件服務器平臺基礎上運行的,在核心業務整個交互路徑中的上述任意一個關鍵節點出現問題都將導致核心業務出現異常!
用戶在運維管理過程中最為實際的需求就是:以最簡單、直觀的形式展現出整個業務交互路徑中每個關鍵節點的實時運行健康狀況(此為用戶運維最關心的部分)。
3、數據業務智能監測系統解決方案
我們的信息系統健康監測平臺通過多種技術手段和實現方式,實現了以最簡單、直觀的方式展現出整個業務路徑中每個關鍵節點的實時運行的情況,解決了用戶最為實際的核心業務系統運維管理需求!
3.1、數據業務智能監測系統工作的機制
數據業務智能監測系統通過主動探測和被動獲取的方式,實現對用戶信息系統中核心接入鏈路、核心網絡設備、主機設備、業務應用系統等實時運行情況的數據,并將相應的數據進行實時的、動態的、直觀的展示,結合告警系統,實現對異常情況的及時發現和告警,其工作機制大致如下圖所示:
3.2、數據業務智能監測系統解決的主要問題
數據業務智能監測系統主要針對核心業務、網站等業務系統以及支撐核心系統運行的網絡基礎設施、服務器系統、網絡安全體系、接入鏈路的可用性和基本運行情況進行全天候24小時的自動監測,主動發現業務系統、核心網絡設備、安全設備、服務器系統、核心接入鏈路等異常狀況,并在第一時間給相應的信息系統運維管理者發送告警信息,運維管理者通過該定制開發系統采集的相應信息,及時做出深入的分析,以快速定位相應異常狀況的原因,并能夠結合相應服務提供解決異常狀況的建議和方案。
3.3、監測系統的業務路徑展示功能
業務路徑展示功能是信息系統健康監測平臺產品的核心功能,這個功能實現的效果大致如下圖所示:
我們可以根據用戶不同業務的具體情況,定義業務訪問路徑,這個路徑包含業務在交互過程中涉及到的每個關鍵節點,包括接入鏈路、網絡設備、安全設備、服務器、應用系統、中間件、數據庫等。
我們將能夠反映這些關鍵節點本身實時運行情況的主要指標數值實時動態的顯示在這個路徑圖中,讓用戶一目了然的知道跟這個核心業務相關的每個關鍵節點實時的運行情況,一旦某個節點出現異常情況,其能夠反映出異常的指標將會優先在這個路徑圖中以橙色或紅色顯示出來,并同時在告警平臺端發起告警信息,及時通知運維管理者。
業務路徑展示功能實現了以最簡單、直觀的形式實時動態展示出整個業務交互路徑過程中每個節點的實時運行情況。
3.4、數據業務智能監測系統的監測功能
數據業務智能監測系統能夠對關鍵鏈路、設備、應用、系統等進行實時的探測,其能夠探測、獲取和展示的相關功能大致描述如下:
1、 核心業務系統運行健康性的監測
o 業務系統監測
用戶辦公業務系統、網站等核心業務系統的可用性、響應時間的實施監測,自動在第一時間及時發現可用性異常、較長響應時間等問題;
? B/S架構的業務系統監測
網站等各種B/S業務系統的可用性監測、響應時間的監測
? C/S架構的業務系統監測
FTP等各種C/S架構的業務系統可用性監測
o 數據庫監測
Mysql、Oracle、MSSQL等常見數據庫可用性、響應時間等的監測
查詢吞吐率、查詢緩存利用率、查詢緩存命中率、查詢緩存碎片率、Mysql緩存訪問率 Mysql表鎖定曲線、Mysql緩存查詢數、Mysql流量曲線、并發連接數詳情、Mysql失敗連接數、Mysql查詢數量等信息進行監測和統計,及時發現個數據庫應用的異常
o 中間件監測
IIS、Apache、Nginx等常見中間件可用性狀態進行監測,并針對中間件的并發連接數,吞吐量等關鍵性能進行監測
2、 核心網絡設備可用性監測
o 交換機監測
核心交換機cpu、內存利用率、核心接口(上聯口、服務器接入接口等)連通性、流量、丟包率、雙工模式等實時監測
o 防火墻監測
防火墻CPU、內存利用率,連接數、主要接口(不同區域的接口)連通性、流量、丟包率、雙工模式、地址沖突、接口流量的實時監測
o VPN網關
VPN網關設備的CPU、內存利用率,連接數、主要接口(不同區域的接口)連通性、流量、丟包率、雙工模式、地址沖突、接口流量的實時監測
o 路由器監測
路由器CPU、內存利用率,連接數、主要端接口連通性、流量、丟包率、雙工模式、地路由器CPU、內存利用率,連接數、主要接口連通性、流量、丟包率、雙工模式、地址沖突、接口流量的實時監測
o 負載均衡監測
負載均衡CPU、內存利用率,連接數、主要接口連通性、流量、丟包率、雙工模式、地址沖突、接口流量的實時監測
3、 核心服務器可用性監測
o Windows系統可用性監測
CPU、內存、磁盤利用率,連通性,響應時間,網絡接口流量,進程數、登錄用戶數等進行實時的監測
o Linux系統可用性監測
CPU、內存、磁盤利用率,連通性,響應時間,網絡接口流量等進行實時的監測
4、 核心鏈路可用性監測
o 互聯網鏈路可用性監測
核心鏈路可用性監測、鏈路響應時間、丟包率等指標的實時監測
o 政務網專線鏈路可用性監測
專線鏈路可用性監測、鏈路響應時間、丟包率等指標的實時監測
3.5、數據業務智能監測系統的告警功能
針對各種業務監測,提供靈活的報警設置,在監測過程中出現異常時,以郵件/短信等多種方式對業務、服務器異常、設備宕機、鏈路中斷、接口通斷、連接數異常、核心設備異常等進行告警通知。
數據業務智能監測系統界面中存在一個告警管理界面,用戶和運維管理者可以通過告警界面查看實時的告警情況。
4、數據業務智能監測系統關聯服務
數據業務智能監測系統結合特色專業的技術服務,提供各種異常的深入分析,定位異常的根本原因、源頭,提供針對性的異常解決建議和方案,在最短的時間內解決數據業務智能監測系統發現的可能影響用戶核心業務、網站等應用的各種異常問題。
4.1、遠程監測服務
在用戶需要的情況下,我們通過數據業務智能監測系統為用戶提供遠程監測服務,在用戶核心業務、核心鏈路、核心設備出現異常時,能夠通過遠程監測和預警服務,及時發現,并通過多種方式通知用戶,其工作過程大致如下所示:
通過信息系統健康監測平臺,實現對用戶核心鏈路、核心設備、核心應用的實時智能的監測,監測結果通過安全通道實時展現至我們的監控中心,我們安排專業人員7X24小時關注用戶核心鏈路、核心設備、核心應用運行的健康情況,一旦發現異常和報警,專業人員會及時通知用戶,并為用戶提供異??赡艿脑蚝徒鉀Q異常的備選方案。
用戶通過使用遠程監測服務,實現對核心鏈路、核心設備、核心應用運行健康狀態的實時了解;我們精專的技術團隊和監控中心成為用戶信息系統和業務的專業管家,可將用戶從具體、繁雜、精專、瑣碎的事務中解脫出來,有更多的時間精力應對核心業務上的事情,提高用戶的工作效率,為用戶單位創造更大的價值!
4.2、主動應急服務
針對遠程監測到的異常,利用監測平臺的采集的各種信息,分析判斷導致異常產生的原因、源頭和位置,并提供解決相應的解決建議和方案,協助用戶快速解決存在的異常。
我們的監控應急服務組合是在監控服務的基礎上,提供主動的應急響應服務。
我們的專業人員在發現用戶核心鏈路、核心設備、核心應用運行過程中出現異常告警事件后,第一時間對異常告警事件進行及時的分析和處理,在出現重大突發異常、對用戶核心業務影響重大的狀況發生時,及時趕到用戶現場,對異常告警事件進行應急處置,解決影響信息系統健康性的異常問題。
監控+主動應急服務組合通過信息系統健康監測系統對用戶信息系統和業務的實時、全面、智能的監測,結合監控中心的7X24小時的監控預警,與應急響應服務無縫銜接,依托于我們公司精專的技術服務團隊,實現“監控-預警-響應”一站式全面運維管理的效果,徹底解決用戶信息系統運維管理過程中存在的各種問題。
4.3、定制開發服務
可根據用戶的后續的具體需要做進一步的定制開發工作,以滿足用戶后續的業務發展需求。
5、產品實施后的效果
1、自動監測:全自動24小時對用戶辦公系統、網站等核心業務系統以及信息系統的運行情況和可用性進行監測;
2、發現異常:根據監測的情況,及時自動發現核心業務以及信息系統的異常狀況;
3、業務路徑展示:根據用戶核心業務的實際情況,自定義業務交互數據流的路徑,并圖形化展現業務路徑每個環節的運行情況和異常問題;
4、告警:一旦發現異常,及時向指定的人員(用戶或數據業務智能檢測系統提供方的專業技術服務人員)發送異常告警信息;
5、專業服務
o 定位:通過專業的技術人員通過數據業務智能檢測系統采集的相關信息,進行專業的深入分析,定位出異常狀況產生的原因、源頭;
o 解決:根據分析的結論,為用戶提供專業的異常狀況解決建議和方案,協助用戶快速解決用戶辦公業務、網站等核心業務系統、支撐核心業務運行的信息系統的異常問題;
o 現場服務:必要時候,安排專業技術人員到用戶現場為用戶提供面對面的服務,以保證異常狀況解決的效率和服務質量。
|