SBBD'2014 > Minicursos

MINICURSOS

Minicurso 1

Big Social Data: Princípios sobre Coleta, Tratamento e Análise de Dados Sociais
Tiago Cruz França, Fabrício Firmino de Faria, Fabio Medeiros Rangel, Claudio Miceli de Farias e Jonice Oliveira

Minicurso 2

Estratégias para Proteção da Privacidade de Dados Armazenados na Nuvem
Eliseu C. Branco Jr., Javam C. Machado e José Maria da Silva Monteiro Filho

Minicurso 3

Otimização de Desempenho em Processamento de Consultas MapReduce
Ivan Luiz Picoli, Leandro Batista de Almeida e Eduardo Cunha de Almeida



Minicurso 1: Big Social Data: Princípios sobre Coleta, Tratamento e Análise de Dados Sociais

Resumo

As redes sociais online (como o Facebook, Twitter e Youtube) tornaram-se um meio popular de compartilhamento e disseminação de dados. A partir desses dados pode-se extrair informações sobre padrões de interações interpessoais e opiniões, auxiliando no entendimento de um fenômeno, previsão de um evento ou na tomada de decisão. Como exemplo do valor dessas informações, pode-se observar a possibilidade de: (1) cientistas estudarem aspectos, opiniões e comportamentos da sociedade, (2) prever a disseminação de doenças ou catástrofes ou (3) uma empresa avaliar o resultado de uma campanha de marketing. Diversos estudos e técnicas de análise de redes sociais estão sendo desenvolvidos, porém o aumento da variedade e volume dos dados produzidos nesses ambientes - bem como a necessidade de velocidade no seu processamento - exigem que sejam empregadas novas abordagens no tratamento dos dados. Aos dados que possuem tais características (volume, variedade e necessidade de velocidade em seu tratamento), chamamo-los de Big Data. Este minicurso visa apresentar uma abordagem de análise de Big Data em redes sociais online (Big Social Data), incluindo a coleta e tratamento de grande volume de dados sociais, mineração e princípios de análise de interações sociais.

Autores
Prof. Jonice Oliveira, D.Sc.: obteve o seu doutorado em 2007 em Engenharia de Sistemas e Computação, ênfase em Banco de Dados, pela COPPE/UFRJ. Durante o seu doutorado recebeu o prêmio IBM Ph.D. Fellowship Award. Na mesma instituição realizou o seu Pós-Doutorado, concluindo-o em 2008. Atualmente é professora adjunta do Departamento de Ciência da Computação da UFRJ, coordenadora do curso de Análise de Suporte à Decisão (habilitação do Bacharelado em Ciências da Matemática e da Terra) e atua no Programa de Pós-Graduação em Informática (PPGI-UFRJ). Em 2013 tornou-se Jovem Cientista do Nosso Estado pela FAPERJ. Suas principais áreas de pesquisa são Gestão do Conhecimento, Análise de Redes Sociais, Big Data e Computação Móvel. Já ministrou minicursos e proferiu palestras sobre Análise de Redes Sociais (ARS), além de ser responsável por disciplinas de mineração de dados e texto e ARS na graduação, mestrado e doutorado do PPGI/UFRJ. Maiores detalhes em: http://lattes.cnpq.br/0990344839864230

Prof. Claudio Miceli de Farias, D.Sc.: Possui graduação em Ciência da Computação pela Universidade Federal do Rio de Janeiro (2008), mestrado (2010) e doutorado (2014) em Informática pela Universidade Federal do Rio de Janeiro. Atuou como professor substituto no Departamento de Ciência da Computação da UFRJ durante o período de 2012 a 2014. Atualmente é professor do Colégio Pedro II e professor visitante no laboratório de Redes e Multimídia do iNCE-UFRJ. Atua como revisor no SBSEG e SBRC. É também membro do comitê de programa das conferências Wireless Days e IDCS. As principais áreas de atuação são: Redes de Sensores sem Fio, Redes de Sensores Compartilhadas, Fusão de Dados, Escalonamento de tarefas, Smart Grid, Análise de Dados e Segurança. Maiores detalhes em: http://lattes.cnpq.br/6243465206463403

Prof. Tiago Cruz França, M.Sc.: professor substituto da UFRJ e aluno de doutorado no programa de Pós-Graduação em Informática dessa instituição onde trabalha com análise de redes sociais e big data. Tem interesse na área de tecnologias Web, engenharia de software e análise de redes sociais. Nos últimos anos Tiago tem atuado nos seguintes temas: Serviços Web, Mashups Web, Web das Coisas, Análise de Sentimentos e fusão de dados Web e dados oriundos de dispositivos inteligentes. Maiores detalhes em: http://lattes.cnpq.br/9941773528712076

Prof. Fabrício Firmino de Faria, M.Sc.: possui mestrado em Informática pela Universidade Federal do Rio de Janeiro, atuando em pesquisas com Web Semântica, Data Warehousing, Análises de Redes Sociais e Big Data. Nos últimos anos trabalhou com processamento de linguagem natural para análise de dados textuais e com o desenvolvimento de plataformas para captura e armazenamento de dados produzidos por sensores. Maiores detalhes em: http://lattes.cnpq.br/9994062739448952

Fabio Medeiros Rangel: graduando da Universidade Federal do Rio de Janeiro, possui experiência em análise de Redes Sociais, com foco em visualização de dados e desenvolvimento de algoritmos para cálculo de métricas em ambientes distribuídos. Possui interesse nas áreas de Data Mining e Big Data. Maiores detalhes em: http://lattes.cnpq.br/2076459613085770



Minicurso 2: Estratégias para Proteção da Privacidade de Dados Armazenados na Nuvem

Resumo

Este minicurso descreve o problema da privacidade no ambiente de cloud computing e apresenta algumas técnicas para proteção da privacidade e segurança dos dados dos usuários neste ambiente. As principais estratégias para perservação da privacidade de dados são apresentadas. As vulnerabilidades e ameaças para infraestrutura, dados e controle de acesso na nuvem e os serviços de segurança de dados oferecidos como serviços de nuvem serão apresentados e discutidos. Por fim, será mostrada uma solução original para processamento e armazenamento de dados no ambiente de cloud.

Autores

Javam C. Machado: Professor Associado no Programa de Mestrado e Doutorado na Universidade Federal do Ceará. Doutor em Informática pela Universidade de Grenoble I e Pós-Doutor pelo Instituto National de Télécommunications. Mestre em Informática pela UFRGS. Tem orientado diversos trabalhos na área de Banco de Dados e Sistemas Distribuídos, especialmente na gestão de dados XML e Computação em Nuvem.

José Maria da Silva Monteiro Filho: Professor Adjunto do Programa de Mestrado e Doutorado da Universidade Federal do Ceará. Possui graduação em Bacharelado em Computação pela Universidade Federal do Ceará (1998), mestrado em Ciência da Computação pela Universidade Federal do Ceará (2001) e doutorado em Informática pela Pontifícia Universidade Católica do Rio de Janeiro - PUC-Rio (2008). Tem experiência na área de Ciência da Computação, com ênfase em Banco de Dados e Engenharia de Software, atuando principalmente nos seguintes temas: sintonia automática de bancos de dados, bancos de dados em nuvem, dados ligados na Web e qualidade de software.

Eliseu Castelo Branco Júnior: Doutorando em Ciência da Computação na Universidade Federal do Ceará (UFC). Obteve seu Mestrado em Informática Aplicada pela UNIFOR em 2000. Atualmente está envolvido na pesquisa de políticas e tecnologias para privacidade de dados para Computação em Nuvem, sendo este o tema de pesquisa do seu doutorado.



Minicurso 3: Otimização de Desempenho em Processamento de Consultas MapReduce

Resumo

O "tuning" de processadores de consulta MapReduce é um tópico de pesquisa bastante investigado atualmente. Soluções como o Starfish e AutoConf fornecem mecanismos para ajustar a execução de consultas MapReduce através da alteração de parâmetros de configuração. Neste minicurso serão apresentadas soluções de tuning para o processor de consultas Hadoop. Um dos principais objetivos do minicurso é mostrar como um sistema de aprendizado de máquina não supervisado pode ser aplicado para configurar os parâmetros do sistema.

Autores

Eduardo Almeida: Eduardo Cunha de Almeida is an Assistant Professor (Adjunto III) at the Federal University of Paraná (UFPR). His research interests are in database systems and datawarehousing, and in particular in automating and testing database management to support computationally-demanding distributed query processing. He earned his Ph.D. in Computer Science, with high honors (félicitations du jury), from the University of Nantes, France, in 2009. His PhD thesis was on testing distributed hash tables (DHT). From 1998 to 2005 he worked as an engineer in data warehouse technology at HSBC Bank, GVT Telecom, and UFPR Foundation. From 2010 to 2012 he has served as Deputy Head for the Graduate Program in Computer Science of the UFPR.

Leandro Batista de Almeida Leandro Batista de Almeida is a teacher of computer science at the Federal Technologich University of Paraná (UFPR) since 1994, where he teaches courses in database systems, mobile computing and programming languages. He earned his master degree in 2000, in telematics, and his main research interests are in social network analisys and big data.

Ivan Luiz Picoli Ivan Luiz Picoli was born in 1990, he is a current student of Master Degree at the Federal University of Paraná (UFPR) with full-time scholarship granted by Capes. His main research interests are in database systems based on MapReduce and data warehousing. His current master thesis is on query optimization in systems based on MapReduce using unsupervised learning and log analysis. He earned his degree in Analysis and Systems Development from Federal Technology University of Paraná (UTFPR), Brazil, in 2012. From 2012 to 2013 he worked as java developer at National Institute of Colonization and Agrarian Reform (INCRA), Brasília, Brazil.