Jak získáte přístup k extrahovanému textu z obrázku pomocí Google Vision API?

by Akademie EITCA / Středa, 27 2023 prosince / Vyšlo v Umělá inteligence, EITC/AI/GVAPI Google Vision API, Porozumění textu ve vizuálních datech, Detekce a extrakce textu z rukopisu, Přehled vyšetření

Chcete-li získat přístup k extrahovanému textu z obrázku pomocí rozhraní Google Vision API, můžete postupovat podle řady kroků, které zahrnují využití možností optického rozpoznávání znaků (OCR) rozhraní API. Technologie OCR v Google Vision API umožňuje detekci a extrakci textu z obrázků, včetně rukopisu. Tato funkce je užitečná zejména v aplikacích, které vyžadují analýzu a porozumění textovým informacím přítomným ve vizuálních datech.

Nejprve musíte nastavit potřebné prostředí pro práci s Google Vision API. To zahrnuje vytvoření projektu v Google Cloud Console, povolení rozhraní Vision API a získání požadovaných ověřovacích pověření, jako je klíč API nebo klíč servisního účtu.

Jakmile je vaše prostředí nastaveno, můžete použít metodu `asyncBatchAnnotateFiles` rozhraní Vision API k provádění OCR na obrazovém souboru. Tato metoda umožňuje předat seznam obrazových souborů ke zpracování a přijímat výsledky asynchronně. Případně můžete použít metodu `asyncBatchAnnotateImages` ke zpracování seznamu obrázků přímo.

Chcete-li extrahovat text z obrázku, musíte vytvořit instanci objektu `AnnotateImageRequest` a zadat požadované funkce. V tomto případě byste nastavili funkci `TEXT_DETECTION` tak, aby indikovala, že chcete z obrázku extrahovat text. Můžete také zadat další parametry, jako je jazyková nápověda, abyste zlepšili přesnost OCR.

Dále musíte zakódovat soubor obrázku do řetězce zakódovaného v base64 a vytvořit instanci objektu `Image` pomocí zakódovaných dat obrázku. Tento objekt `Image` by měl být přidán do objektu `AnnotateImageRequest` vytvořeného dříve.

Po nastavení požadavku jej můžete odeslat do rozhraní Vision API pomocí metody `batchAnnotateImages` nebo `batchAnnotateFiles`, v závislosti na zvoleném přístupu. API zpracuje obrázek a vrátí odpověď obsahující extrahovaný text.

Chcete-li získat přístup k extrahovanému textu z odpovědi, můžete iterovat přes pole `textAnnotations` objektu `AnnotateImageResponse`. Toto pole obsahuje seznam objektů `EntityAnnotation`, z nichž každý představuje detekovaný textový prvek v obrázku. Pole `description` každého objektu `EntityAnnotation` obsahuje extrahovaný text.

Zde je příklad úryvku kódu v Pythonu, který ukazuje, jak získat přístup k extrahovanému textu z obrázku pomocí Google Vision API:

python
from google.cloud import vision

def extract_text_from_image(image_path):
    client = vision.ImageAnnotatorClient()

    with open(image_path, 'rb') as image_file:
        content = image_file.read()

    image = vision.Image(content=content)

    request = vision.AnnotateImageRequest(
        image=image,
        features=[{'type': vision.Feature.Type.TEXT_DETECTION}]
    )

    response = client.batch_annotate_images(requests=[request])

    for annotation in response.responses[0].text_annotations:
        extracted_text = annotation.description
        print(extracted_text)

# Usage
extract_text_from_image('path_to_image.jpg')

V tomto příkladu funkce `extract_text_from_image` přebírá cestu k souboru obrázku jako vstup a používá klientskou knihovnu Google Cloud Vision k odeslání požadavku do rozhraní Vision API. Extrahovaný text se poté vytiskne.

Chcete-li získat přístup k extrahovanému textu z obrázku pomocí rozhraní Google Vision API, musíte nastavit prostředí, vytvořit objekt `AnnotateImageRequest` s požadovanými funkcemi, zakódovat soubor obrázku, odeslat požadavek do rozhraní API a získat extrahovaný text. z odpovědi. Možnosti OCR rozhraní Vision API umožňují detekci a extrakci textu z obrázků, včetně rukopisu.

Další nedávné otázky a odpovědi týkající se Detekce a extrakce textu z rukopisu:

Další otázky a odpovědi:

V rubrice: Umělá inteligence, Google Cloud Vision API, Zpracování obrazu, OCR, Optical Character Recognition, Extrakce textu

Akademie EITCA

Jak získáte přístup k extrahovanému textu z obrázku pomocí Google Vision API?

Další nedávné otázky a odpovědi týkající se Detekce a extrakce textu z rukopisu:

Další otázky a odpovědi:

EITCA Academy je součástí evropského rámce IT certifikace

Způsobilost pro EITCA Academy 80% EITCI DSJC Dotační podpora

Akademie EITCA

PŘIHLÁSTE SE NA VAŠE ÚČET PODLE VAŠICH UŽIVATELSKÝCH NEBO E-mailových adres

ODSTRANIT DETAILY?

VYTVOŘIT ÚČET

Jak získáte přístup k extrahovanému textu z obrázku pomocí Google Vision API?

Další nedávné otázky a odpovědi týkající se Detekce a extrakce textu z rukopisu:

Další otázky a odpovědi:

Způsobilost pro EITCA Academy 80% EITCI DSJC Dotační podpora