Jak lze skóre BLEU použít k hodnocení výkonu vlastního překladatelského modelu trénovaného pomocí překladu AutoML?

by Akademie EITCA / Středa, 02 2023 srpna / Vyšlo v Umělá inteligence, EITC/AI/GCML Google Cloud Machine Learning, Platforma Google Cloud AI, AutoML překlad, Přehled vyšetření

Skóre BLEU je široce používaná metrika pro hodnocení výkonu modelů strojového překladu. Měří podobnost mezi strojově generovaným překladem a jedním nebo více referenčními překlady. V kontextu vlastního překladového modelu trénovaného pomocí AutoML Translation může skóre BLEU poskytnout cenné poznatky o kvalitě a efektivitě výstupu modelu.

Abychom pochopili, jak se skóre BLEU používá, je důležité nejprve pochopit základní pojmy. BLEU je zkratka pro Bilingual Evaluation Understudy a byl vyvinut jako způsob automatického vyhodnocování kvality strojových překladů jejich porovnáním s referenčními překlady vytvořenými lidmi. Skóre se pohybuje od 0 do 1, přičemž vyšší skóre znamená lepší překlad.

AutoML Translation je výkonný nástroj nabízený platformou Google Cloud AI, který uživatelům umožňuje trénovat vlastní modely překladů pomocí vlastních dat. Jakmile je model natrénován, lze jej použít ke generování překladů pro nový vstupní text. Skóre BLEU pak lze použít k posouzení kvality těchto překladů.

Pro výpočet skóre BLEU se překlady generované modelem porovnávají s jedním nebo více referenčními překlady. Srovnání je založeno na n-gramech, což jsou souvislé sekvence n slov. Skóre BLEU bere v úvahu nejen přesnost n-gramů v modelem generovaném překladu, ale také jejich přítomnost v referenčních překladech. To pomáhá zachytit jak přiměřenost, tak plynulost překladů.

Ukažme si to na příkladu. Předpokládejme, že máme referenční překlad: "Kočka sedí na podložce." A model generuje následující překlad: "Kočka sedí na podložce." Tyto věty můžeme rozdělit na n-gramy:

Reference: ["The", "cat", "is", "sedí", "on", "the", "mat"] Model: ["The", "cat", "sits", "on", "the", "mat"]

V tomto případě model správně překládá většinu n-gramů, ale chybí mu čas slovesa („je“ vs. „sedí“). Skóre BLEU by to odráželo tím, že by překladu bylo přiděleno nižší skóre.

Skóre BLEU lze vypočítat pomocí různých metod, jako je modifikovaná přesnost a penalizace za stručnost. Upravená přesnost odpovídá za to, že překlad může obsahovat více výskytů n-gramu, zatímco penalizace za stručnost penalizuje překlady, které jsou výrazně kratší než referenční překlady.

Vyhodnocením skóre BLEU vlastního překladatelského modelu vyškoleného pomocí AutoML Translation mohou uživatelé získat přehled o výkonu modelu a identifikovat oblasti pro zlepšení. Mohou porovnávat skóre BLEU různých modelů nebo iterací, aby mohli sledovat pokrok a činit informovaná rozhodnutí o výběru modelu nebo jeho doladění.

Skóre BLEU je cennou metrikou pro hodnocení výkonu vlastních překladatelských modelů trénovaných pomocí AutoML Translation. Poskytuje kvantitativní měřítko kvality strojově generovaných překladů jejich porovnáním s referenčními překlady. Analýzou skóre BLEU mohou uživatelé posoudit efektivitu svých modelů a činit rozhodnutí na základě dat ke zvýšení kvality překladu.

Další nedávné otázky a odpovědi týkající se AutoML překlad:

Další otázky a odpovědi:

Pole: Umělá inteligence
program: EITC/AI/GCML Google Cloud Machine Learning (přejděte do certifikačního programu)
Lekce: Platforma Google Cloud AI (přejít na související lekci)
Téma: AutoML překlad (přejít na související téma)
Přehled vyšetření

V rubrice: Umělá inteligence, AutoML překlad, Skóre BLEU, Metrika hodnocení, Platforma Google Cloud AI, Strojový překlad

Akademie EITCA

Jak lze skóre BLEU použít k hodnocení výkonu vlastního překladatelského modelu trénovaného pomocí překladu AutoML?

Další nedávné otázky a odpovědi týkající se AutoML překlad:

Další otázky a odpovědi:

EITCA Academy je součástí evropského rámce IT certifikace

Způsobilost pro EITCA Academy 80% EITCI DSJC Dotační podpora

Akademie EITCA

PŘIHLÁSTE SE NA VAŠE ÚČET PODLE VAŠICH UŽIVATELSKÝCH NEBO E-mailových adres

ODSTRANIT DETAILY?

VYTVOŘIT ÚČET

Jak lze skóre BLEU použít k hodnocení výkonu vlastního překladatelského modelu trénovaného pomocí překladu AutoML?

Další nedávné otázky a odpovědi týkající se AutoML překlad:

Další otázky a odpovědi:

Způsobilost pro EITCA Academy 80% EITCI DSJC Dotační podpora