Proces trénování modelu strojového učení zahrnuje jeho vystavení obrovskému množství dat, které mu umožní učit se vzorce a dělat předpovědi nebo rozhodnutí, aniž by byl explicitně naprogramován pro každý scénář. Během trénovací fáze prochází model strojového učení řadou iterací, kdy upravuje své vnitřní parametry tak, aby minimalizoval chyby a zlepšil svůj výkon v dané úloze.
Supervize během školení se týká úrovně lidského zásahu potřebného k vedení procesu učení modelu. Potřeba dohledu se může lišit v závislosti na typu použitého algoritmu strojového učení, složitosti úkolu a kvalitě dat poskytovaných pro školení.
Při učení pod dohledem, což je typ strojového učení, kde je model trénován na označených datech, je dohled nezbytný. Označená data znamenají, že každý vstupní datový bod je spárován se správným výstupem, což umožňuje modelu naučit se mapování mezi vstupy a výstupy. Během výcviku pod dohledem je vyžadován lidský dohled, aby poskytl správné označení pro tréninková data, vyhodnotil předpovědi modelu a upravil parametry modelu na základě zpětné vazby.
Například v úloze rozpoznávání obrázků pod dohledem, pokud je cílem vycvičit model pro klasifikaci obrázků koček a psů, by lidský dozor musel označit každý obrázek buď jako kočka nebo pes. Model by se pak z těchto označených příkladů naučil předpovídat nové, neviditelné obrázky. Vedoucí by vyhodnotil předpovědi modelu a poskytl zpětnou vazbu ke zlepšení jeho přesnosti.
Na druhou stranu algoritmy učení bez dozoru nevyžadují pro trénování označená data. Tyto algoritmy se učí vzory a struktury ze vstupních dat bez explicitního vedení. Učení bez dozoru se často používá pro úkoly, jako je shlukování, detekce anomálií a redukce rozměrů. Při učení bez dozoru se stroj může učit samostatně bez potřeby lidského dohledu během tréninku.
Semi-supervised learning je hybridní přístup, který kombinuje prvky jak řízeného, tak nekontrolovaného učení. V tomto přístupu je model trénován na kombinaci označených a neoznačených dat. Označená data poskytují určitý dohled pro vedení procesu učení, zatímco neoznačená data umožňují modelu objevit další vzorce a vztahy v datech.
Posílení učení je další paradigma strojového učení, kde se agent učí dělat sekvenční rozhodnutí interakcí s prostředím. Při posilování získává agent zpětnou vazbu ve formě odměn nebo trestů na základě svých akcí. Agent se učí maximalizovat svou kumulativní odměnu v průběhu času pomocí pokusů a omylů. Zatímco posilující učení nevyžaduje explicitní dohled v tradičním slova smyslu, může být nutný lidský dohled k navržení struktury odměn, stanovení cílů učení nebo doladění procesu učení.
Potřeba dohledu během tréninku strojového učení závisí na použitém paradigmatu učení, dostupnosti označených dat a složitosti úkolu. Učení pod dohledem vyžaduje lidský dohled, který poskytne označená data a vyhodnotí výkon modelu. Učení bez dozoru nevyžaduje dozor, protože model se učí nezávisle na neoznačených datech. Semi-supervised learning kombinuje prvky jak řízeného, tak nekontrolovaného učení, zatímco posilovací učení zahrnuje učení prostřednictvím interakce s prostředím.
Další nedávné otázky a odpovědi týkající se EITC/AI/GCML Google Cloud Machine Learning:
- Co je převod textu na řeč (TTS) a jak funguje s umělou inteligencí?
- Jaká jsou omezení při práci s velkými datovými sadami ve strojovém učení?
- Dokáže strojové učení nějakou dialogickou pomoc?
- Co je hřiště TensorFlow?
- Co vlastně znamená větší soubor dat?
- Jaké jsou příklady hyperparametrů algoritmu?
- Co je to souborové učení?
- Co když vybraný algoritmus strojového učení není vhodný a jak se lze ujistit, že vyberete ten správný?
- Jaké jsou klíčové parametry používané v algoritmech založených na neuronové síti?
- Co je TensorBoard?
Další otázky a odpovědi naleznete v EITC/AI/GCML Google Cloud Machine Learning