Sistemas Distribuídos
Descrição da Oportunidade
A crescente adoção de arquiteturas de espaços de dados (data spaces) em contextos industriais e científicos coloca novos desafios ao nível da interoperabilidade e do acesso eficiente a dados distribuídos por múltiplos participantes autónomos. Domínios como a saúde, a energia e a indústria transformadora geram volumes crescentes de dados heterogéneos, cuja partilha controlada entre organizações é essencial para viabilizar análises federadas, otimização de processos e tomada de decisão informada. Iniciativas como o International Data Spaces (IDS) e a GAIA-X têm vindo a estabelecer frameworks de referência para esta partilha soberana de dados, definindo modelos de conectores, controlo de acesso e gestão de metadados. Neste cenário, a utilização de SQL como linguagem de interrogação unificada sobre fontes de dados heterogéneas surge como uma abordagem promissora para simplificar o acesso federado à informação, mantendo as garantias de soberania e conformidade exigidas por estas arquiteturas. As atividades previstas incluem: - Estudo e prototipagem de camadas de abstração para a execução de consultas SQL federadas sobre fontes de dados heterogéneas interligadas por conectores IDS. - Análise das capacidades de execução distribuída de consultas, considerando os requisitos de soberania de dados e os modelos de controlo de acesso definidos pelos frameworks IDS e GAIA-X. - Exploração de estratégias de otimização de consultas em contextos onde os dados residem em nós autónomos com políticas de partilha distintas, minimizando a transferência de dados desnecessária e maximizando o processamento local (query pushdown). - Investigação de mecanismos de registo e publicação de metadados baseados no IDS Information Model e nos catálogos GAIA-X, no âmbito da problemática de data discovery. - Desenvolvimento de técnicas de descoberta automática de esquemas em representações heterogéneas de dados. - Estudo de abordagens para a inferência de capacidades de interrogação disponíveis em cada participante do espaço de dados, suportando a formulação dinâmica de consultas distribuídas. - Implementação de um protótipo funcional que integre um motor de execução de consultas SQL federadas com funcionalidades de descoberta de dados usando conectores IDS e/ou GAIA-X. - Avaliação do desempenho e escalabilidade do protótipo em cenários representativos de infraestruturas de dados industriais e científicas. - Disseminação dos resultados através de publicações em conferências e revistas científicas de referência nas áreas de bases de dados distribuídas, arquiteturas de dados e computação federada. - Escrever uma tese de doutoramento no contexto do trabalho desenvolvido. - Escrever o relatório de atividades da bolsa.
Habilitações Académicas
- Frequência de Doutoramento em Informática ou área afim.
Requisitos Mínimos
- Conhecimentos de Sistemas Distribuídos;- Conhecimento aprofundado dos ecossistemas IDS e GAIA-X, particularmente ao nível dos conectores, demonstrado em de projetos académicos ou profissionais;- 1 artigo publicado em conferência ou revista com revisão por pares.
Fatores de Preferência
- Conhecimento aprofundado de mecanismos de gestão de permissões como XACML; - Conhecimento aprofundado de gestão de permissões em ambientes distribuídos; - Experiência com motores ou frameworks de processamento de interrogações federadas.
Período de candidatura
Desde 21 May 2026 a 03 Jun 2026
Centro
Laboratório de Software Confiável