可擴展的機器學習工作流程涉及多個步驟和復雜的計算。這些步驟包括數(shù)據(jù)準備和預處理,訓練和評估模型,部署這些模型等等。雖然對機器學習模型進行原型設(shè)計可以看作是一項簡單而輕松的任務(wù),但最終很難以即席方式跟蹤每個過程。
為了簡化機器學習模型的開發(fā),Google推出了Cloud AI Platform Pipelines的測試版,該版本將幫助部署強大的,可重復的機器學習管道,以及監(jiān)視,審核,版本跟蹤和可重復性。它確保為機器學習工作流提供易于企業(yè)安裝,易于安裝的安全執(zhí)行環(huán)境。
云AI平臺
Google Cloud中的AI平臺是基于代碼的數(shù)據(jù)科學開發(fā)環(huán)境,可幫助機器學習開發(fā)人員,數(shù)據(jù)科學家和數(shù)據(jù)工程師以快速且經(jīng)濟高效的方式部署ML模型。
AI Platform Pipelines的核心技術(shù)堆棧支持兩個用于編寫機器學習管道的SDK,即Kubeflow Pipelines SDK和TFX SDK。Kubeflow Pipelines SDK是一個較低級的SDK,可實現(xiàn)直接Kubernetes資源控制和容器化組件的簡單共享。盡管TFX SDK提供了具有預定義的ML類型的但可自定義的組件的更高級別的抽象。因此,使用AI平臺管道,可以使用Kubeflow管道(KFP)SDK或通過使用TFX SDK自定義TensorFlow擴展(TFX)管道模板來指定管道。
使用AI平臺管道有兩個主要好處:
易于安裝和管理:通過訪問Cloud Console中的AI Platform面板,可以輕松訪問AI Platform Pipelines。
輕松的身份驗證訪問:AI平臺管道通過Cloud AI Platform UI提供對管道用戶界面的安全且經(jīng)過身份驗證的訪問,而無需設(shè)置端口轉(zhuǎn)發(fā)。