Defesa de dissertação de David Lino, 20/9 às 9h

postado em 20 de set de 2013 07:28 por Nazareno Ferreira de Andrade
Candidato: David Anderson Lino de Sousa
Título do trabalho: Replicação semi-coordenada em sistemas de processamento de fluxos de dados
Orientador(es): Andrey Elísio Monteiro Brito e Carlos E. S. Pires 

Data: 20/09/2013
Horário: 9h
Local: Auditório do CEEI

Banca examinadora: Edmar Candeia Gurjão (UFCG), Raquel V. Lopes (UFCG)

Resumo: O Processamento de Fluxos de Eventos (Event Stream Processing -- ESP) é um conjunto de técnicas para processar fluxos contínuos de dados em tempo quase real. Sistemas de ESP são comumente distribuídos e, seja por razões econômicas, confiabilidade, ou requisitos do problema, necessitam ser tolerantes a falhas. Nos sistemas ESP, este problema pode ser resolvido utilizando réplicas que trabalham paralelamente sem nenhuma coordenação. Porém, se o processamento dos dados exige que os operadores guardem estado, diferenças na ordem de chegada dos eventos nas réplicas podem causar uma divergência de estados, e, esta divergência, pode produzir resultados diferentes em cada réplica, o que pode não ser tolerado em algumas aplicações. Neste caso, a entrada dos dados nos operadores é ordenada usando alguma forma de difusão confiável, o que exige coordenação entre as réplicas. Neste trabalho, exploramos o fato de que, pequenas diferenças nos resultados podem ser tolerados em alguns cenários. Criamos uma abordagem, que chamamos de semi-coordenada, onde minimizamos a necessidade de coordenação entre as réplicas, estimando o comportamento das fontes e cada réplica utiliza esta estimativa para ordenar de forma determinística a entrada dos dados. A abordagem semi-coordenada é bastante útil quando operadores baseados em janelas de eventos são utilizados. Os resultados mostram que nossa abordagem oferece um opção intermediária entre a abordagem coordenada e a não coordenada. A abordagem proposta oferece níveis baixos de latência, próximos à abordagem não-coordenada, porém com maior consistência, se assemelhando à abordagem coordenada, com mínimo tempo de bloqueio e comunicação entre as réplicas.
Comments