Cloud Machine Learning Engine (CMLE) je výkonný nástroj poskytovaný platformou Google Cloud Platform (GCP) pro trénování modelů strojového učení distribuovaným a paralelním způsobem. Nenabízí však automatické získávání a konfiguraci zdrojů, ani neřeší vypnutí zdrojů po dokončení trénování modelu. V této odpovědi se budeme zabývat detaily CMLE, jeho schopnostmi a potřebou ruční správy zdrojů.
CMLE je navržen tak, aby zjednodušil proces školení a nasazení modelů strojového učení ve velkém měřítku. Poskytuje spravované prostředí, které uživatelům umožňuje soustředit se spíše na vývoj modelu než na správu infrastruktury. CMLE využívá sílu infrastruktury GCP k distribuci tréninkové zátěže na více počítačů, což umožňuje rychlejší tréninkové časy a zpracování velkých datových sad.
Při použití CMLE mají uživatelé flexibilitu při výběru typu a počtu zdrojů požadovaných pro jejich tréninkovou práci. Mohou si vybrat typ stroje, počet pracovníků a další parametry na základě svých specifických požadavků. CMLE však tyto prostředky nezískává a nekonfiguruje automaticky. Je na odpovědnosti uživatele, aby si před zahájením výcviku zajistil potřebné zdroje.
K získání zdrojů mohou uživatelé využít služby GCP, jako je Compute Engine nebo Kubernetes Engine. Tyto služby poskytují škálovatelnou a flexibilní infrastrukturu pro přizpůsobení pracovní zátěži školení. Uživatelé mohou vytvářet instance nebo kontejnery virtuálních strojů, konfigurovat je s požadovanými softwarovými závislostmi a pak je používat jako pracovníky v CMLE.
Jakmile je úloha školení dokončena, CMLE automaticky nevypne zdroje používané pro školení. Je to proto, že trénovaný model může být nutné nasadit a sloužit pro účely odvození. Je na uživateli, aby se rozhodl, kdy a jak zdroje ukončit, aby se předešlo zbytečným nákladům.
Abychom to shrnuli, CMLE nabízí výkonnou platformu pro trénování modelu paralelního strojového učení. Vyžaduje však ruční získávání a konfiguraci zdrojů a nezvládá vypnutí zdrojů po dokončení školení. Uživatelé musí poskytovat potřebné zdroje pomocí služeb GCP, jako je Compute Engine nebo Kubernetes Engine, a spravovat svůj životní cyklus na základě svých specifických požadavků.
Další nedávné otázky a odpovědi týkající se Pokrok ve strojovém učení:
- Když je jádro rozvětveno daty a originál je soukromý, může být rozvětvené jádro veřejné, a pokud ano, nejedná se o porušení soukromí?
- Jaká jsou omezení při práci s velkými datovými sadami ve strojovém učení?
- Dokáže strojové učení nějakou dialogickou pomoc?
- Co je hřiště TensorFlow?
- Brání režim Eager distribuované výpočetní funkci TensorFlow?
- Lze cloudová řešení Google použít k oddělení výpočetní techniky od úložiště pro efektivnější trénování modelu ML s velkými daty?
- Je možné trénovat modely strojového učení na libovolně velkých souborech dat bez škytavky?
- Vyžaduje při použití CMLE vytvoření verze zadání zdroje exportovaného modelu?
- Může CMLE číst data z úložiště Google Cloud a používat určený trénovaný model pro odvození?
- Lze Tensorflow použít pro trénink a odvození hlubokých neuronových sítí (DNN)?
Další otázky a odpovědi naleznete v části Pokrok ve strojovém učení