Lehrstuhl für
Multimediakommunikation und Signalverarbeitung
Prof. Dr.-Ing. André Kaup

Analyse und Optimierung der Bewegungsschätzung bei HEVC

Betreuer:M.Sc. Nils Genser (Raum 01.178)
Hochschullehrer:Prof. Dr.-Ing. André Kaup
Info:

Aufgrund der hohen anfallenden Datenmenge bei Videos ist es wichtig, diese verlustbehaftet zu komprimieren. Nur so wird es möglich Filme auf Datenträgern zu speichern oder sie im Internet zu streamen. Ein wichtiger Bestandteil um die Kompression in modernen Videocodecs zu erreichen, ist die Prädiktion. Hier wird versucht den gerade zu codierenden Bereich anhand von bereits übertragenen Gebieten darzustellen.


Üblicherweise führen Videocodecs die Prädiktion in zeitlicher oder in örtlicher Richtung durch. Bei der örtlichen Prädiktion werden die bereits übertragenen Bildbereiche geschickt in den zu codierenden Bereich fortgesetzt. Im Gegensatz dazu sucht man bei der zeitlichen Prädiktion, welche in dieser Arbeit näher betrachtet werden soll, in bereits übertragenen Bildern nach einem ähnlichem Gebiet (siehe Abbildung 1). So muss statt den Bildpunkten nur die Bewegungsinformation und ein Restfehler übertragen werden, wodurch die benötigte Datenrate absinkt.

Abbildung 1: Zeitlich-benachbartes und zu verarbeitendes Bild


High Efficiency Video Coding (HEVC) ist ein aktueller Videocodierungsstandard, welcher im Zuge dieser Arbeit benutzt werden soll. Bei aktuellen Voruntersuchungen hat sich gezeigt, dass die Bewegungsschätzung Schwächen aufweist, wenn sich unterschiedliche Objekte im zu verarbeitenden Block befinden. Bewegt sich zum Beispiel ein Objekt in eine Richtung und ein Weiteres in eine andere, so wird aus der Bildnachbarschaft das passendste Gebiet ausgewählt. Allerdings weist diese Entscheidung große Fehler aufgrund der unterschiedlichen Bewegungen auf (siehe zum Beispiel Abbildung 2).

Abbildung 2: (1) Originalblock. (2) Prädiktion aus Nachbarbild. (3) Resultierendes Residuum.


In diesem Forschungspraktikum soll untersucht werden, welche Parameter sich am Besten zur Detektion der Fehlentscheidungen eignen. Anschließend müssen die Blöcke in verschiedene Bereiche mit abweichender Bewegung segmentiert werden. Zum Schluss soll für jedes Element in den zeitlich-benachbarten Bildern der beste Treffer gesucht und der Bewegungsvektor berechnet werden.

Typ:Forschungspraktikum
Status:Angeboten