Chcete-li extrahovat všechny anotace objektů z odezvy API v oblasti Umělá inteligence – Google Vision API – Pokročilé porozumění obrázkům – Detekce objektů, můžete využít formát odpovědi poskytovaný rozhraním API, který obsahuje seznam detekovaných objektů spolu s jejich odpovídajícími ohraničující rámečky a skóre spolehlivosti. Analýzou této odpovědi můžete extrahovat požadované anotace objektu.
Odpověď rozhraní API se obvykle skládá z objektu JSON obsahujícího různá pole, včetně pole „localizedObjectAnnotations“, které obsahuje detekované objekty. Každá anotace objektu obsahuje informace, jako je název objektu, jeho souřadnice ohraničujícího rámečku a skóre spolehlivosti udávající důvěru API v detekci.
Chcete-li extrahovat anotace objektu, postupujte takto:
1. Analyzujte odpověď rozhraní API: Začněte analýzou odpovědi JSON přijaté z rozhraní API. To lze provést pomocí knihovny analýzy JSON nebo vestavěných funkcí poskytovaných vaším programovacím jazykem.
2. Otevřete pole „localizedObjectAnnotations“: Jakmile je odpověď analyzována, přejděte do pole „localizedObjectAnnotations“, které obsahuje detekované objekty. Toto pole je obvykle polem anotací objektů.
3. Iterujte anotací objektu: Iterujte každou anotaci objektu v poli. Každá anotace představuje detekovaný objekt na obrázku.
4. Extrahujte relevantní informace: Extrahujte relevantní informace z každé anotace objektu, jako je název objektu, souřadnice ohraničujícího rámečku a skóre spolehlivosti. K těmto podrobnostem lze přistupovat jako k samostatným polím v rámci každé anotace objektu.
5. Uložte nebo zpracujte extrahované informace: V závislosti na vašich požadavcích můžete extrahované informace ukládat do datové struktury nebo je dále zpracovávat pro analýzu nebo jiné účely. Můžete například chtít uložit názvy objektů a jejich odpovídající souřadnice ohraničovacího rámečku do databáze nebo je použít pro další úlohy porozumění obrázkům.
Zde je zjednodušený příklad pro ilustraci procesu extrakce:
python import json # Assume 'response' contains the API response in JSON format response =
{
"localizedObjectAnnotations": [
{
"mid": "/m/01g317",
"name": "kočka",
"skóre": 0.89271355,
"boundingPoly": {
"normalizedVertices": [
{"x": 0.1234, "y": 0.5678},
{"x": 0.5678, "y": 0.1234}
]}
},
{
"mid": "/m/04rky",
"name": "pes",
"skóre": 0.8132468,
"boundingPoly": {
"normalizedVertices": [
{"x": 0.4321, "y": 0.8765},
{"x": 0.8765, "y": 0.4321}
]}
}
]}
# Parse the API response response_data = json.loads(response) # Access the object annotations annotations = response_data['localizedObjectAnnotations'] # Iterate through the object annotations for annotation in annotations: # Extract relevant information object_name = annotation['name'] bounding_box = annotation['boundingPoly']['normalizedVertices'] confidence = annotation['score'] # Process or store the extracted information print(f"Object: {object_name}, Bounding Box: {bounding_box}, Confidence: {confidence}") # Output: # Object: cat, Bounding Box: [{'x': 0.1234, 'y': 0.5678}, {'x': 0.5678, 'y': 0.1234}], Confidence: 0.89271355 # Object: dog, Bounding Box: [{'x': 0.4321, 'y': 0.8765}, {'x': 0.8765, 'y': 0.4321}], Confidence: 0.8132468
V tomto příkladu předpokládáme odpověď JSON obsahující dva detekované objekty: kočku a psa. Kód analyzuje odpověď, přistupuje k poli "localizedObjectAnnotations", iteruje každou anotaci objektu a extrahuje název objektu, souřadnice ohraničujícího rámečku a skóre spolehlivosti. Nakonec se extrahované informace vytisknou, ale kód můžete upravit tak, aby vyhovoval vašim konkrétním potřebám.
Pomocí těchto kroků můžete efektivně extrahovat všechny anotace objektů z odezvy API v oblasti Umělá inteligence – Google Vision API – Pokročilé porozumění obrázkům – Detekce objektů.
Další nedávné otázky a odpovědi týkající se Pokročilé porozumění obrázkům:
- Jaké jsou některé předdefinované kategorie pro rozpoznávání objektů v Google Vision API?
- Jaký je doporučený přístup k používání funkce detekce bezpečného vyhledávání v kombinaci s jinými technikami moderování?
- Jak můžeme získat a zobrazit hodnoty pravděpodobnosti pro každou kategorii v anotaci bezpečného vyhledávání?
- Jak můžeme získat anotaci bezpečného vyhledávání pomocí Google Vision API v Pythonu?
- Jakých pět kategorií zahrnuje funkce detekce bezpečného vyhledávání?
- Jak funkce bezpečného vyhledávání Google Vision API detekuje explicitní obsah v obrázcích?
- Jak můžeme vizuálně identifikovat a zvýraznit detekované objekty na obrázku pomocí knihovny polštářů?
- Jak můžeme uspořádat extrahované informace o objektu do tabulkového formátu pomocí datového rámce pandas?
- Jaké knihovny a programovací jazyk se používají k demonstraci funkčnosti Google Vision API?
- Jak rozhraní Google Vision API provádí detekci a lokalizaci objektů v obrázcích?
Prohlédněte si další otázky a odpovědi v části Pokročilé porozumění obrázkům