2016年,百度PaddlePaddle打響了國產深度學習框架開源的第一槍。
2019年秋季4月,在WavebookSummit深度學習開發(fā)者峰會上,首次推出PaddlePaddlebook的中文名飛槳,開始強調自己更適合中國開發(fā)者,更于深度學習模式的產業(yè)實踐。同時,槳的發(fā)展開始加快。
時間到了2020年,這一年是國產深度學習框架的亮點時刻,作為國產領導者的飛槳動作頻繁,不斷更新升級。
2021?????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????現(xiàn)在,在GitHub中,飛槳收獲Star的數(shù)量達到了14.6k,被越來越多的開發(fā)者使用。
飛槳作為中國首個開源開放的深度學習平臺,為了保持自己的地位,必須具有獨特的優(yōu)勢。經過多年的更新反復,飛槳已經集開發(fā)了便利的核心框架、超大規(guī)模深度學習模型訓練、多平臺配置的高性能推理引擎和復蓋多領域的產業(yè)級模型庫四大核心技術于一體,始終保持技術領先和功能完善?,F(xiàn)在飛槳聚集在265萬開發(fā)者身上,服務了10萬家以上的企業(yè),創(chuàng)造了34萬個以上的模型,幫助越來越多的行業(yè)完成AI實現(xiàn)了產業(yè)智能化的升級。
與以前的版本反復相比,這次的top2.0top版本的發(fā)表不僅是通常的升級,也是基礎設施的全面更新!此次,百度從產業(yè)實踐全過程出發(fā),對深度學習模式的研發(fā)、培訓、部署進行了整體優(yōu)化,進一步加快了AI應用的大規(guī)模落地。
1、更高效率的研發(fā)AI;
1、成熟完善的動態(tài)圖模式由于命令式編程模式(動態(tài)圖)對開發(fā)商的友好性,飛槳在2019年初也在推動態(tài)圖功能。這次升級,劃槳將默認的開發(fā)模式升級為動態(tài)圖,這表明劃槳的動態(tài)圖功能已經成熟完善。飛槳框架2.0支持用戶使用動態(tài)圖完成深入學習相關領域的模型算法開發(fā)。在動態(tài)圖模式下,開發(fā)商可以隨時查看變量的輸入、輸出,方便快捷的調試程序,帶來更好的開發(fā)體驗。
為了解決動態(tài)圖的部署問題,飛槳提供了全面完善的動轉支持,在Python語法支持的壟斷度上達到了領先水平。開發(fā)商在動態(tài)圖程序設計調試過程中,只需添加一個裝飾器,就可以無縫地自動實現(xiàn)靜態(tài)圖培訓或模型保存。同時,槳框架2.0也統(tǒng)一了模型存儲和加載的接口,保證了動作靜止后保存的模型文件可以用純動態(tài)圖加載和使用。
飛槳框架2.0版本上,官方支持的動態(tài)圖算法數(shù)量達到270條,涵蓋了計算機視覺、自然語言處理、語音、推薦等多個領域,動態(tài)圖的訓練效率和配置效率提高。2.0版本的動態(tài)圖支持自動混合精度和量化訓練功能,實現(xiàn)比靜態(tài)圖簡潔靈活的混合精度訓練界面,達到與靜態(tài)圖匹敵的混合精度和量化訓練效果。
同時,為了推進各主流場景的產業(yè)級應用,飛槳系列開發(fā)套件也隨著飛槳框架完成升級,全面支持動態(tài)圖開發(fā)模式。
2、API系統(tǒng)新升級
API是用戶使用深度學習框架的直接入口,對開發(fā)者的使用體驗起著重要的作用。槳框2.0對API系統(tǒng)進行了全新的升級。包括系統(tǒng)化的整理和簡潔的處理,槳框2.0的新API系統(tǒng)完全兼容歷史版本,同時槳提供升級工具,幫助開發(fā)者降低升級轉移成本。
系統(tǒng)化:飛槳重新整理和優(yōu)化了API的系統(tǒng)結構,使其更加明確、科學,許多開發(fā)人員可以更容易地根據(jù)開發(fā)使用場景找到想要的API。另外,通過class、functional兩種形式的API,可以模塊化的組織代碼和網絡建設,提高開發(fā)效率。同時,API的豐富度大幅提高,共增加了API217,優(yōu)化了API195。
簡潔:提供更適合低代碼編程的高層API。數(shù)據(jù)增強、數(shù)據(jù)生產線建立、循環(huán)批量訓練等標準化的工作流程,以及一些經典的網絡模型結構,在槳框2.0中,被封裝為上層API。基于飛槳高層API,開發(fā)商只需10行左右的代碼即可完成培訓部分程序。最重要的是,高層API和基礎API采用一體化設計,即在編程過程中可以同時使用上層API和基礎API,使用戶能夠在簡單的開發(fā)和精細的調整之間自由定制。
二、更高效地訓練AI模型
2、業(yè)內首個通用異構參數(shù)服務器架構 飛槳框架2.0推出業(yè)內首個通用異構參數(shù)服務器技術,解除傳統(tǒng)參數(shù)服務器模式必須嚴格使用同一硬件型號Trainer節(jié)點的束縛,使訓練任務對硬件型號不敏感,同時使用不同的硬件進行混合異構訓練,如CPU、GPU(如V100、P40、K40混合)、AI專用加速硬件,如昆侖芯片等通過異構參數(shù)服務器架構,用戶可以在硬件異構集群中部署分布式培訓任務,高效利用不同計算能力的芯片,為用戶提供更高吞吐量、更低資源消耗的培訓能力。 通用異構參數(shù)服務器結構被稱為通用,主要是兼容性支持 1、CPU機械構成的傳統(tǒng)參數(shù)服務器結構支持的訓練任務。 2.GPU和其他AI加速芯片對應機構成的參數(shù)服務器可以兼容,充分利用機器內部的異構設備。 3.支持CPU機械和GPU或其他AI加速芯片對應機械的混布,構成機械間別參數(shù)服務器結構。 異構參數(shù)服務器具有非常高的性價比,如下圖所示,僅用兩臺CPU機加兩臺GPU機就能達到與四臺GPU機相似的訓練速度,成本至少可節(jié)省35%。 三、將AI模型更廣泛地部署到各種硬件 AI產業(yè)的廣泛應用離不開各種人工智能硬件的繁榮。目前,英特爾、英偉達、ARM等眾多芯片制造商紛紛開展飛槳支持。飛槳還跟飛騰、海光、鯤鵬、龍芯、申威等 CPU 進行深入適配,并結合麒麟、統(tǒng)信、普華操作系統(tǒng),以及百度昆侖、海光 DCU、寒武紀、比特大陸、瑞芯微、高通、英偉達等 AI 芯片深度融合,與浪潮、中科曙光等服務器廠商合作形成軟硬一體的全棧AI基礎設施。當前飛槳已經適配和正在適配的芯片或 IP達到 29款,處于業(yè)界領先地位。 自主可控的必要性:TensorFlow、PyTorch 并不完美 很多人對國產深度學習框架的發(fā)展抱有懷疑態(tài)度,認為這些工作只不過是在拾人牙慧,重復造輪子,而且 AI 開源框架的搭建是一項費時費力的龐大工程。如果沒有超越現(xiàn)有主流框架的想法,去重復造一套沒有技術創(chuàng)新的輪子,性價比似乎不高,對技術人員來說吸引力也不大。 但AI的大規(guī)模落地仍處于起步階段,深度學習技術仍在發(fā)展,復雜性也在提高,而TensorFlow、PyTorch等海外框架不是沒有提高的空間,飛槳等國產框架還有很大的機會。 業(yè)內算法工程師表示,TensorFlow對稀疏模型的處理能力大規(guī)模分布式計算能力和Embffffding存儲利用率仍有上升空間,而且TensorFlow2.0對API混亂的問題也需要解決 此外,飛槳免費開放了很多預訓練模型,可以直接在產業(yè)界落地,因此對于小型企業(yè)來說更有利,成本更低,同時也能取得不錯的效果。由于 AI 正在從云端走向邊緣端,而飛槳對多芯片平臺的適配和支持,也帶了很大的部署優(yōu)勢。 與此同時,百度也在加大構建飛槳社區(qū)的扶持,因此中國開發(fā)者也可以獲得更及時、更個性化的支持。 今年 3 月美國國家人工智能安全委員會(the National Security Commission on Artificial Intelligence,NSCAI)發(fā)布的一份報告,提出了對于總統(tǒng)拜登、國會及企業(yè)和機構的數(shù)十項建議,以期壓制中國 AI 的發(fā)展。這也說明了構建中國自主可控核心技術棧的重要性和必要性。 新加坡工程院士、IEEEFellow面水在CSDN《2020-2021中國開發(fā)者調查報告》中評價,以槳為代表的國產框架迅速崛起,其市場占有率不容忽視。 2021年,基于劃船的企業(yè)級開發(fā)工具庫數(shù)量增加,內容豐富,參加劃船生態(tài)社區(qū)的用戶增加。具有先發(fā)優(yōu)勢的百度,現(xiàn)在在AI基礎設施領域更遠,更穩(wěn)定。