Učení pod dohledem a učení bez dohledu jsou dva základní typy paradigmat strojového učení, které slouží odlišným účelům na základě povahy dat a cílů daného úkolu. Při navrhování efektivních modelů strojového učení je zásadní porozumět tomu, kdy použít školení pod dohledem oproti školení bez dozoru. Volba mezi těmito dvěma přístupy závisí na dostupnosti označených dat, požadovaném výsledku a základní struktuře datového souboru.
Učení pod dohledem je typ strojového učení, kde je model trénován na označeném datovém souboru. Při učení pod dohledem se algoritmus učí mapovat vstupní data na správný výstup tím, že jsou mu prezentovány příklady školení. Tyto tréninkové příklady se skládají z párů vstup-výstup, kde jsou vstupní data doprovázena odpovídajícím správným výstupem nebo cílovou hodnotou. Cílem řízeného učení je naučit se mapovací funkci ze vstupních proměnných na výstupní proměnné, které pak lze použít k předpovědím neviditelných dat.
Učení pod dohledem se obvykle používá, když je znám požadovaný výstup a cílem je naučit se vztah mezi vstupními a výstupními proměnnými. Běžně se používá v úlohách, jako je klasifikace, kde je cílem předpovídat označení tříd nových instancí, a regrese, kde je cílem předpovídat spojitou hodnotu. Například ve scénáři výuky pod dohledem můžete trénovat model, který předpovídá, zda je e-mail spam či nikoli, na základě obsahu e-mailu a stavu označených jako spam/není spam u předchozích e-mailů.
Na druhou stranu učení bez dozoru je typ strojového učení, kde je model trénován na neoznačené sadě dat. Při učení bez dozoru se algoritmus učí vzory a struktury ze vstupních dat bez explicitní zpětné vazby na správný výstup. Cílem učení bez dozoru je prozkoumat základní strukturu dat, objevit skryté vzorce a extrahovat smysluplné poznatky bez potřeby označených dat.
Učení bez dozoru se běžně používá, když je cílem prozkoumat data, najít skryté vzorce a seskupit podobné datové body. Často se používá v úlohách, jako je shlukování, kde je cílem seskupit podobné datové body do shluků na základě jejich vlastností, a redukce rozměrů, kde je cílem snížit počet prvků při zachování základních informací v datech. Například ve scénáři učení bez dozoru byste mohli použít shlukování k seskupení zákazníků na základě jejich nákupního chování bez jakékoli předchozí znalosti zákaznických segmentů.
Volba mezi učením pod dohledem a učením bez dozoru závisí na několika faktorech. Pokud máte označenou datovou sadu a chcete předvídat konkrétní výsledky, je řízené učení vhodnou volbou. Na druhou stranu, pokud máte neoznačenou datovou sadu a chcete prozkoumat datovou strukturu nebo najít skryté vzorce, je vhodnější učení bez dozoru. V některých případech lze k využití výhod obou přístupů použít kombinaci technik pod dohledem i bez dozoru, známých jako učení se částečně supervizí.
Rozhodnutí použít školení pod dohledem versus školení bez dozoru ve strojovém učení závisí na dostupnosti označených dat, povaze úkolu a požadovaném výsledku. Pochopení rozdílů mezi učením pod dohledem a učením bez dozoru je zásadní pro navrhování efektivních modelů strojového učení, které dokážou získat smysluplné poznatky a vytvářet přesné předpovědi z dat.
Další nedávné otázky a odpovědi týkající se EITC/AI/GCML Google Cloud Machine Learning:
- Co je převod textu na řeč (TTS) a jak funguje s umělou inteligencí?
- Jaká jsou omezení při práci s velkými datovými sadami ve strojovém učení?
- Dokáže strojové učení nějakou dialogickou pomoc?
- Co je hřiště TensorFlow?
- Co vlastně znamená větší soubor dat?
- Jaké jsou příklady hyperparametrů algoritmu?
- Co je to souborové učení?
- Co když vybraný algoritmus strojového učení není vhodný a jak se lze ujistit, že vyberete ten správný?
- Potřebuje model strojového učení během tréninku dohled?
- Jaké jsou klíčové parametry používané v algoritmech založených na neuronové síti?
Další otázky a odpovědi naleznete v EITC/AI/GCML Google Cloud Machine Learning