Sumarização de vídeos de futebol com baixo custo computacional utilizando ritmo visual: descritores de cor e movimento de câmara [Digital]
Dissertação
Português
681.3
Fortaleza, 2006.
O crescimento da produção de conteúdo multimídia criou a necessidade de novas
técnicas para o armazenamento e recuperação eficiente desses conteúdos. A área de
recuperação de imagens baseada no conteúdo (CBIR) é um campo de pesquisa que objetiva
métodos baseados na visão computacional para indexar e... Ver mais
técnicas para o armazenamento e recuperação eficiente desses conteúdos. A área de
recuperação de imagens baseada no conteúdo (CBIR) é um campo de pesquisa que objetiva
métodos baseados na visão computacional para indexar e... Ver mais
O crescimento da produção de conteúdo multimídia criou a necessidade de novas
técnicas para o armazenamento e recuperação eficiente desses conteúdos. A área de
recuperação de imagens baseada no conteúdo (CBIR) é um campo de pesquisa que objetiva
métodos baseados na visão computacional para indexar e recuperar vídeos e imagens.
Características visuais, como cor, forma, textura e movimento, são usadas como descritores
computados diretamente de uma imagem ou vídeo em aplicações CBIR. Esses descritores são
usados em várias aplicações, tais como detecção de transições, classificação de tomadas,
reconhecimento de objetos, dentre outras. O ritmo visual é um exemplo de representação
espaço-temporal dos dados de um vídeo provendo informação compacta. Nós exploramos
essas propriedades no presente trabalho para propor dois novos descritores de baixo nível para
análise de vídeos de futebol computados diretamente do ritmo visual. Os descritores são
relacionados à cor dominante e à direção de movimento de câmera. Eles são aplicados em
diferentes tarefas, envolvendo a análise de vídeos de futebol, tais como detecção de
transições, classificação de tomadas e estimativas de direção de ataque. Nós também
apresentamos um exemplo simples de sumário automático de vídeos de futebol para ilustrar o
uso dos novos descritores. Ver menos
técnicas para o armazenamento e recuperação eficiente desses conteúdos. A área de
recuperação de imagens baseada no conteúdo (CBIR) é um campo de pesquisa que objetiva
métodos baseados na visão computacional para indexar e recuperar vídeos e imagens.
Características visuais, como cor, forma, textura e movimento, são usadas como descritores
computados diretamente de uma imagem ou vídeo em aplicações CBIR. Esses descritores são
usados em várias aplicações, tais como detecção de transições, classificação de tomadas,
reconhecimento de objetos, dentre outras. O ritmo visual é um exemplo de representação
espaço-temporal dos dados de um vídeo provendo informação compacta. Nós exploramos
essas propriedades no presente trabalho para propor dois novos descritores de baixo nível para
análise de vídeos de futebol computados diretamente do ritmo visual. Os descritores são
relacionados à cor dominante e à direção de movimento de câmera. Eles são aplicados em
diferentes tarefas, envolvendo a análise de vídeos de futebol, tais como detecção de
transições, classificação de tomadas e estimativas de direção de ataque. Nós também
apresentamos um exemplo simples de sumário automático de vídeos de futebol para ilustrar o
uso dos novos descritores. Ver menos
The growth of multimedia contents production has created the necessity of new techniques for efficient storage and retrieval of these contents. The area of Content Based Image Retrieval is a research field whose goal is to develop Computer Vision based methods for indexing and retrieval of images...
Ver mais
The growth of multimedia contents production has created the necessity of new techniques for efficient storage and retrieval of these contents. The area of Content Based Image Retrieval is a research field whose goal is to develop Computer Vision based methods for indexing and retrieval of images and videos. Visual features such as color, shape, texture and motion are used as descriptors computed directly from an image or video in CBIR applications. This descriptors are applied in different tasks such as shot transition detection, shot classification and objects recognition. The visual rhythm is a spatio-temporal sampled representation of video data providing compact information while preserving several types of video events. We exploit these properties in the current work to propose two new low level descriptors for the analysis of soccer videos computed directly from the visual rhythm. The descriptors are related to dominant color and camera motion estimation. The new descriptors are applied in different tasks aiming the analysis of soccer videos, such as shot transition detections, shots' classification and attack direction estimation. We also present a simple automated soccer summary application to illustrate the use of the new descriptors.
Keywords: low level video features, dominant color, motion estimation, soccer video analysis, mathematical morphology Ver menos
Keywords: low level video features, dominant color, motion estimation, soccer video analysis, mathematical morphology Ver menos
Disponibilidade forma física: Existe obra em CD-Rom de código: 72317
Disponibilidade forma física: Existe obra impressa de ´código : 72669
Lima, Elan Oliveira
Autor
Bezerra, Francisco Nivando
Orientador
Bezerra, Francisco Nivando
Banca examinadora
Rodrigues, Maria Andreia Formico
Banca examinadora
Leite, Neucimar Jerônimo
Banca examinadora
Universidade de Fortaleza. Programa de Pós-Graduação em Informática Aplicada
Dissertação (mestrado)