Cookies
O website necessita de alguns cookies e outros recursos semelhantes para funcionar. Caso o permita, o INESC TEC irá utilizar cookies para recolher dados sobre as suas visitas, contribuindo, assim, para estatísticas agregadas que permitem melhorar o nosso serviço. Ver mais
Aceitar Rejeitar
  • Menu
Sobre

Sobre

Sou Professora Coordenadora no Politécnico do Porto e Investigadora no INESC TEC, no Centro de Telecomunicações e Multimédia, onde lidero a área de Tecnologias de Comunicação Multimédia. Tenho um Doutoramento em Engenharia Electrotécnica e de Computadores pela Universidade do Porto, com um foco na àrea da Gestão de Conteúdos Audiovisuais. Enquanto investigadora do INESC TEC, tenho sido responsável por diversos projectos Europeus e Nacionais, envolvendo parceiros da área da indústria, media e academia. Autora de diversas publicações, sou também revisora activa de artigos submetidos a conferências e revistas, membro de comissões científicas e de organização de conferências. Recentemente, organizei a série de Workshops com o tema "Immersive Media Experiences" (2013-2015) na maior conferência na área de multimédia (ACM Multimedia). Participo frequentemente como perita da Comissão Europeia ou de organismos nacionais na avaliação de propostas de investigação. Os meus interesses de investigação centram-na na área dos sistema de comunicação multimedia, incluindo televisão e novos serviços, gestão de conteúdos, personalização e recomendação, novos formatos e conteúdos imersivos e interactivos.

Tópicos
de interesse
Detalhes

Detalhes

  • Nome

    Paula Viana
  • Cargo

    Responsável de Área
  • Desde

    01 janeiro 1993
023
Publicações

2025

Video Soundtrack Generation by Aligning Emotions and Temporal Boundaries

Autores
Sulun, S; Viana, P; Davies, MEP;

Publicação
CoRR

Abstract

2025

Converge: towards an efficient multi-modal sensing research infrastructure for next-generation 6 G networks

Autores
Filipe B. Teixeira; Manuel Ricardo; André Coelho; Hélder P. Oliveira; Paula Viana; Nuno Paulino; Helder Fontes; Paulo Marques; Rui Campos; Luís Pessoa;

Publicação
EURASIP Journal on Wireless Communications and Networking

Abstract

2025

A Survey of Recent Advances and Challenges in Deep Audio-Visual Correlation Learning

Autores
Vilaça, L; Yu, Y; Viana, P;

Publicação
ACM COMPUTING SURVEYS

Abstract
Audio-visual correlation learning aims at capturing and understanding natural phenomena between audio and visual data. The rapid growth of Deep Learning propelled the development of proposals that process audio-visual data and can be observed in the number of proposals in the past years. Thus encouraging the development of a comprehensive survey. Besides analyzing the models used in this context, we also discuss some tasks of definition and paradigm applied in AI multimedia. In addition, we investigate objective functions frequently used and discuss how audio-visual data is exploited in the optimization process, i.e., the different methodologies for representing knowledge in the audio-visual domain. In fact, we focus on how human-understandable mechanisms, i.e., structured knowledge that reflects comprehensible knowledge, can guide the learning process. Most importantly, we provide a summarization of the recent progress of Audio-Visual Correlation Learning (AVCL) and discuss the future research directions.

2025

Correction to: A Review of Recent Advances and Challenges in Grocery Label Detection and Recognition (Applied Sciences, (2023), 13, 5, (2871), 10.3390/app13052871)

Autores
Guimarães, V; Nascimento, J; Viana, P; Carvalho, P;

Publicação
Applied Sciences (Switzerland)

Abstract
There was an error in the original publication [1]. The statement in the Acknowledgments section is incorrect and should be removed because the official start of the project WATSON was after the paper’s publication date. The authors state that the scientific conclusions are unaffected. This correction was approved by the Academic Editor. The original publication has also been updated. © 2025 by the authors.

2024

VEMOCLAP: A video emotion classification web application

Autores
Sulun, S; Viana, P; Davies, MEP;

Publicação
IEEE International Symposium on Multimedia, ISM 2024, Tokyo, Japan, December 11-13, 2024

Abstract
We introduce VEMOCLAP: Video EMOtion Classifier using Pretrained features, the first readily available and open-source web application that analyzes the emotional content of any user-provided video. We improve our previous work, which exploits open-source pretrained models that work on video frames and audio, and then efficiently fuse the resulting pretrained features using multi-head cross-attention. Our approach increases the state-of-the-art classification accuracy on the Ekman-6 video emotion dataset by 4.3% and offers an online application for users to run our model on their own videos or YouTube videos. We invite the readers to try our application at serkansulun.com/app.