在2018年全球分析師大會期間,華為發布SoftCOM AI解決方案架構,在全云化網絡基礎上引入AI技術,力圖打造“永不故障”的自治網絡,掀起新一輪網絡變革。
跨界競爭呼喚系統架構創新
我們正在進入一個跨界競爭的新時代,每個行業都面臨著結構性挑戰,對電信行業來說尤其如此。
首先,從收入結構來看,運營商的業務正遭遇來自IT產業的挑戰。之前,電信業務分為三個層次:終端、網絡和IT基礎設施以及上層應用。隨著網絡接入速率的大幅提升,導致IT產業從賣產品變成賣服務,骨干網絡和IT基礎設施逐漸變成云服務的形式。運營商如果能把云服務做好,就可以與AWS等云服務巨頭爭搶萬億美元的云市場,反之則將喪失很多傳統的電信業務,尤其是數據中心之間的專線業務等,比如阿里云就正在建設連接全球的云骨干網。
其次,運營商的效率和成本也面臨結構性挑戰。如今,電信設備維護的OPEX支出約為CAPEX的三倍,給運營商帶來沉重的負擔。此外,電信網絡越來越復雜,超過了一個人的專業知識和能力,導致70%的重大網絡故障都是人為因素造成。正如加拿大運營商TELUS首席無線架構師所說:“機械制造都走向自動化了,電信業還處于手工業的階段。”
要解決電信業面臨的挑戰,僅僅靠產品創新是遠遠不夠的,需要整個系統架構的創新和商業模式的創新,才能提升運營商的競爭力,解決結構性問題。什么是系統架構創新?以云計算為例,它并不是某個服務器或存儲產品的創新,而是通過全新的分布式系統提升資源利用效率,是系統級的創新。產品創新、系統架構創新和商業模式創新三者相互支撐,互相促進。
為了滿足新時代的客戶需求,華為的創新體系即按照上述三個維度來設計。在產品層面,華為設計網絡設備的指導思想是“奧運精神”,即大容量、低時延,所有產品創新都圍繞這個目標進行。在系統架構創新領域,華為的目標是構建一個敏捷的自動化、智能化網絡,實現網絡的“自動駕駛模式”。在商業模式創新上包括兩個目標,第一是通過提供云服務成為世界五朵云之一,第二是構建網絡時代的在線智能服務模式。
SoftCOM AI帶來全新價值
回顧華為網絡架構的發展路徑,在ALL IP階段我們提出Single戰略,云計算崛起后,2012年進入ALL Cloud階段,我們提出SoftCOM來實現以數據中心為中心的網絡。近年來隨著人工智能技術的發展,我們提出要全面智能化(ALL Intelligence),將人工智能引入電信網絡,SoftCOM AI由此誕生,目的是實現網絡架構層面的自治網絡,以及商業模式層面的服務2.0。
引入人工智能的自治網絡,意在構建網絡領域的“工業4.0”,實現網絡“自動駕駛”。工業4.0有三個特征,即敏捷的設備、智能的控制和智慧的分析系統,來實現生產的自動化,這對于電信業來說同樣適用。在電信網絡中,下層是網絡設備,上面是控制層,在整個網絡的控制和運維方面,端到端引入人工智能技術,構建分段自治功能,每一段的自治通過上層運營系統實現端到端的自治能力,進而實現整網自治。自治網絡帶來的最大變化是運維維護人員不在整個業務流程里,是一個自動化的系統,我們稱之為“網絡自動駕駛模式”,來實現整個網絡的自優、自愈、自動化。
服務2.0的目標則是打造網絡領域的“工業互聯網”,提供在線數字化“智慧服務”。將這一服務理念延伸到電信行業,未來的網絡在運營商側全自動化運行,華為則在后臺提供基于人工智能的全自動化在線服務,這種服務基于持續迭代的模式,根據業界慣例構建“模型即服務”,永遠處于Beta階段,不斷更新和完善。
將AI引入電信網絡,帶來的全新價值是“可預測性”。電信網絡的管理和控制中心基于設備的南向接口和數據采集,通過一定的策略和規則,來實現對整個網絡的管理和調度。其實施的依據主要有三個條件,包括網絡的可達性、SLA要求和資源效率,這些是網絡實現自動化的基礎。但隨著網絡日益復雜,僅有這些已遠遠不夠,需要在網絡中引入基于算法的網絡管控、在線AI推理和數據分析,實現流量預測、質量預測和故障預測。預測性是AI的核心價值,基于未知的條件來調度網絡,實現故障發生前規避故障、質量劣化前優化質量、網絡擁塞前調整流量,從而達到自動、自優、自愈、自治的永不故障的自動駕駛網絡,結構性提升運維和運營效率。
提升用戶體驗,實現三個倍增
要實現網絡的自動駕駛,必然將是一個長期的過程,不可能一蹴而就。參考汽車自動駕駛的五個發展步驟,我們也將自動駕駛網絡分為五個階段,第一個階段是AI能夠指出“發生了什么”,第二個階段需要判定“為什么會發生”,第三個階段需要預測“將會發生什么”,后續都需要人工判斷決策和采取相應措施;到了第四個階段,AI已經可以判斷“需要采取什么措施”,然后由人工去操作;最后一個階段才是全面地實現網絡的自我控制和自動修復,使網絡具備自愈能力。
自治網絡和服務2.0的實現,將帶給最終用戶分鐘級的ROADS體驗,永遠最優的網絡連接和永不斷網的可獲得性;對運營商的價值則是實現運維效率、資源效率和能耗效率的倍增。
在運維領域,運維水平分為三個發展階段,第一個階段稱為R2F(Run-to-Failure),網絡在運行中突然發生故障,然后運維人員馬上趕去處理,這是最低級的水平;第二個階段是PvM(Preventive Maintenance),即例行的巡檢,對每個設備進行檢查來預防故障發生,但這種做法效率非常低下;第三個階段是PdM(Predictable Maintenance),我們稱之為可預測性維護,即能夠預測某個設備未來有多大概率發生故障,然后進行針對性的維護。通過PdM,我們希望能將電信網絡的告警壓縮和故障定位減少90%,實現90%關鍵器件的失效和劣化預測,進一步達到網絡自愈。此外,網絡故障中超過70%的問題源自無源設備,例如光纖彎曲老化、接口松動等,在這一過程中,信號都會發生變化,通過引入AI學習這些變化的特征,就有可能提前進行預測,用有源解決無源的故障問題。
在網絡資源方面,當下的特點是網絡建設好了,流量就隨之流動,資源利用可能并不合理。如果反過來思考,基于流量走向來調度網絡,資源利用率就會大幅提升。現在的網絡并不具備這樣的能力,只有通過引入人工智能,建好流量預測模型,才能實現精準流量預測和最合理的網絡拓撲,以流量而不是物理連接來決定網絡的路徑,最終大幅提高網絡的資源效率。
關于能耗效率,有個說法叫做“比特決定瓦特”,即網絡流量大小決定能耗多少。在機房或者站點,每個系統都有數十個參數,通過AI訓練生成散熱與環境及業務負荷模型,使得日照、溫度和配套設施油機、太陽能和電池等達到最佳能效;在設備層面,根據業務負載進行動態能量投放,沒有流量時就利用時隙關斷、RF深度休眠、載頻關斷等減少耗電量,同時實現數據中心對象如服務器組件的動態節能管理;第三個是網絡系統,構建準確的業務負荷預測模型,使整網流量最優從而達到能耗效率最佳。
自治網絡的目標架構,對華為來說就是SoftCOM+AI,具體做法是:把下層設備和云基礎設施、中間層的網絡管理和控制以及上層全流程的系統,在規劃、部署、運行、維護、優化和經營的端到端過程中,每一個環節都引入人工智能技術,使能網絡達到系統最優。與此同時,華為也構建了一個面向運營商的AI訓練平臺,將網絡設備運行的狀態數據接入平臺來訓練AI模型,并針對模型進行持續更新和優化,使得網絡系統的自動化程度不斷提高。
以光網絡為例,來看一下AI如何使能全流程的業務發展。首先是數據底座,即需要獲得怎樣的數據,具體到光網絡來說包括光纖的數據、光信號的數據、路由數據等;接下來是使能技術,即人工智能的算法,包括數據清洗、信息整合、機器學習建模、深度學習等等,這些算法與光網絡無關;為了實現光網絡的自動駕駛,還需要構建大量模型,比如光纖模型、濾波器模型等;最后是業務應用場景,包括開局自動檢查光纖、業務發放、網絡優化、故障定位以及資源自動調度等,通過模型找到最優方法,進而實現快速發放、極簡運維和智能運營,智能化提高網絡調度效率,零等待、零接觸、零體驗,讓人們感受不到網絡的存在。
未來將是智能化的時代,運營商網絡的智能化不可能一蹴而就,而是一個長期實踐。SoftCOM AI是華為All Intelligence戰略在電信領域的落地,其中最核心的AI能力依托于華為在All Intelligence中長期堅決的戰略投入而積累成長,和電信領域場景相結合,旨在幫助運營商打造永不故障的自治網絡,盡快實現數字化、智能化轉型。
-
華為
+關注
關注
216文章
35173瀏覽量
255487 -
人工智能
+關注
關注
1805文章
48922瀏覽量
248139 -
ai技術
+關注
關注
1文章
1308瀏覽量
25092
原文標題:華為Fellow朱廣平談自治網絡和服務
文章出處:【微信號:hwwireless,微信公眾號:華為無線網絡】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
評論