Banca de TCC – Luan Pizzamiglio Audibert

UNIVERSIDADE FEDERAL DE PELOTAS
CENTRO DE DESENVOLVIMENTO TECNOLÓGICO
TRABALHO DE CONCLUSÃO DE CURSO

Apresentações Finais (2017/1)

Arquitetura multi-modo para a predição Intraquadro de mapas de profundidade segundo a extensão 3D-HEVC
por
Luan Pizzamiglio Audibert

Curso:
Ciência da Computação

Banca:
Prof. Marcelo Schiavon Porto (orientador)
Prof. Vladimir Afonso (co-orientador)
MSc. Ruhan Avila da Conceição
Prof. Daniel Munari Palomino

Data: 09 de Agosto de 2017

Hora: 10:00h

Local: Sala 316

Resumo do Trabalho: A extensão 3D-HEVC adota o formato de dados Multi-View plus Depth (MVD), onde cada quadro de textura do vídeo é associado a um mapa de profundidade, utilizado para indicar a distância entre os objetos da cena e a câmera. Utilizando este formato, é possível gerar vistas sintetizadas, obtendo um número maior de vistas após o processo de decodificação do vídeo. Para a codificação de mapas de profundidade, a extensão herda todos os modos de predição do padrão HEVC, além de introduzir novos modos para lidar com suas características bem específicas. Para a predição Intraquadro, a extensão HEVC introduz três novos modos para lidar com mapas de profundidade: Depth Intra Skip (DIS), Depth Modelling Mode 1 (DMM1) e Depth Modelling Mode 4 (DMM4), totalizando 37 possíveis modos para a predição Intraquadro de mapas de profundidade. Neste contexto, este trabalho implementa uma arquitetura de hardware multi-modo que processa a etapa da predição Intraquadro para a extensão 3D-HEVC. Para isso, uma análise utilizando o software de referência 3D-HEVC Test Model (HTM) foi realizada para avaliar o impacto dos 37 possíveis modos na predição Intraquadro, com a finalidade de reduzir a complexidade desta etapa. Como resultado desta análise, foi destacado que os modos mais utilizados nesta etapa são os modos Planar, DC, Horizontal, Vertical, DIS, DMM1 e DMM4. Com isso, foi implementada uma arquitetura de hardware que processa todos os sete modos mais representativos, avaliados na análise. Uma estratégia de compartilhamento dos recursos foi utilizada para os modos de predição similares, reduzindo a área utilizada e a potência dissipada pela arquitetura. Além disso, uma nova estratégia para o processamento das wedgelets do modo DMM1 foi proposta, utilizando o algoritmo de Bresenham para definir as partições, evitando a necessidade de armazenar todas as possiveis combinações de wedgelet em uma memória externa. A arquitetura desenvolvida foi descrita em VHDL e sintetizada para um ASIC, considerando a biblioteca de células da Nangate, com tecnologia de 45nm, atingindo uma frequência máxima de 354MHz, ocupando uma área de 599.370 gates e tendo uma potência dissipada de 175,46mW. Com esta frequência, a arquitetura é capaz de processar vídeos 3D com resolução HD 1080p (1920×1080 pixels) a uma taxa de 30 quadros por segundo considerando cinco vistas.

Para mais informações acesse: http://wp.ufpel.edu.br/notcc/bancas/historico/2017_1/