Amazon Rekognition Video bietet jetzt Begrenzungsrahmen für Objekte sowie eine genauere Objekt- und Szenenerkennung

Amazon Rekognition Video ist ein auf Deep Learning basierender Videoanalysedienst, der Objekte, Menschen, Text, Szenen und Aktivitäten sowie unsichere Inhalte erkennen kann. Die Objekt- sowie Szenenerkennung – auch Labelerkennung genannt – kann Tausende von gemeinsamen Objekten und Szenen in einem Video identifizieren sowie den Zeitstempel für jedes Label. Amazon Rekognition Video wurde aktualisiert, um eine deutlich verbesserte Genauigkeit für alle vorhandenen Labels in einer Vielzahl von Anwendungsfällen zu gewährleisten. Darüber hinaus kann die Labelerkennung nun die Position von Objekten wie Hunden, Personen und Autos in einem Video festlegen, indem sie für jedes Objekt einen Begrenzungsrahmen zurückgibt. Ein Begrenzungsrahmen ist ein Koordinatensatz, der genau eine bestimmte Objektposition in einem Videobild angibt. Kunden können die Begrenzungsrahmen-Dimensionen verwenden, um Objekte zu zählen („3 Autos“) und die Beziehung zwischen Objekten („Person neben einem Auto“) zu einem bestimmten Zeitpunkt in einem Video zu verstehen. Schließlich gibt Amazon Rekognition Video für jedes gefundene Label die übergeordneten Labels in einer hierarchischen Liste zurück. Zum Beispiel hat das Label „Hund“ die übergeordneten Bezeichnungen „Säugetier“, „Hund“ und „Tier“. Diese Metadaten ermöglichen es Kunden, Labels in Bezug auf Ihre „Parent-Child“-Beziehungen zu gruppieren, um die Kategorisierung zu verbessern und die Zuordnung zu internen Taxonomien zu erleichtern. Es sind keine Machine Learning-Kenntnisse erforderlich, um zu beginnen.
Quelle: aws.amazon.com

Published by