MINICURSOS
Minicurso 1
Big Social Data: Princípios sobre Coleta, Tratamento e Análise de Dados Sociais
Tiago Cruz França, Fabrício Firmino de Faria, Fabio Medeiros Rangel,
Claudio Miceli de Farias e Jonice Oliveira
Minicurso 2
Estratégias para Proteção da Privacidade de Dados Armazenados na Nuvem
Eliseu C. Branco Jr., Javam C. Machado e José Maria da Silva Monteiro Filho
Minicurso 3
Otimização de Desempenho em Processamento de Consultas MapReduce
Ivan Luiz Picoli, Leandro Batista de Almeida e Eduardo Cunha de Almeida
Minicurso 1: Big Social Data: Princípios sobre Coleta, Tratamento e Análise de Dados Sociais
Resumo
As redes sociais online (como o Facebook, Twitter e Youtube) tornaram-se um meio
popular de compartilhamento e disseminação de dados. A partir desses dados pode-se extrair informações sobre padrões de interações interpessoais e opiniões, auxiliando no entendimento de um fenômeno, previsão de um evento ou na tomada de decisão. Como exemplo do valor dessas informações, pode-se observar a possibilidade de: (1) cientistas estudarem aspectos, opiniões e comportamentos da sociedade, (2) prever a disseminação de doenças ou catástrofes ou (3) uma empresa avaliar o resultado de uma campanha de marketing. Diversos estudos e técnicas de análise de redes sociais estão sendo desenvolvidos, porém o aumento da variedade e volume dos dados produzidos nesses ambientes - bem como a necessidade de velocidade no seu processamento - exigem que sejam empregadas novas abordagens no tratamento dos dados. Aos dados que possuem tais características (volume, variedade e necessidade de velocidade em seu tratamento), chamamo-los de Big Data. Este minicurso visa apresentar uma abordagem de análise de Big Data em redes sociais online (Big Social Data), incluindo a coleta e tratamento de grande volume de dados sociais, mineração e princípios de análise de interações sociais.
Autores
Prof. Jonice Oliveira, D.Sc.: obteve o seu doutorado em 2007 em Engenharia de
Sistemas e Computação, ênfase em Banco de Dados, pela COPPE/UFRJ. Durante o seu
doutorado recebeu o prêmio IBM Ph.D. Fellowship Award. Na mesma instituição
realizou o seu Pós-Doutorado, concluindo-o em 2008. Atualmente é professora adjunta
do Departamento de Ciência da Computação da UFRJ, coordenadora do curso de
Análise de Suporte à Decisão (habilitação do Bacharelado em Ciências da Matemática e
da Terra) e atua no Programa de Pós-Graduação em Informática (PPGI-UFRJ). Em 2013
tornou-se Jovem Cientista do Nosso Estado pela FAPERJ. Suas principais áreas de
pesquisa são Gestão do Conhecimento, Análise de Redes Sociais, Big Data e
Computação Móvel. Já ministrou minicursos e proferiu palestras sobre Análise de
Redes Sociais (ARS), além de ser responsável por disciplinas de mineração de dados e
texto e ARS na graduação, mestrado e doutorado do PPGI/UFRJ. Maiores detalhes em:
http://lattes.cnpq.br/0990344839864230
Prof. Claudio Miceli de Farias, D.Sc.: Possui graduação em Ciência da Computação
pela Universidade Federal do Rio de Janeiro (2008), mestrado (2010) e doutorado
(2014) em Informática pela Universidade Federal do Rio de Janeiro. Atuou como
professor substituto no Departamento de Ciência da Computação da UFRJ durante o
período de 2012 a 2014. Atualmente é professor do Colégio Pedro II e professor
visitante no laboratório de Redes e Multimídia do iNCE-UFRJ. Atua como revisor no
SBSEG e SBRC. É também membro do comitê de programa das conferências Wireless
Days e IDCS. As principais áreas de atuação são: Redes de Sensores sem Fio, Redes de
Sensores Compartilhadas, Fusão de Dados, Escalonamento de tarefas, Smart Grid,
Análise de Dados e Segurança. Maiores detalhes em:
http://lattes.cnpq.br/6243465206463403
Prof. Tiago Cruz França, M.Sc.: professor substituto da UFRJ e aluno de doutorado no programa de Pós-Graduação em Informática dessa instituição onde trabalha com análise de redes sociais e big data. Tem interesse na área de tecnologias Web, engenharia de software e análise de redes sociais. Nos últimos anos Tiago tem atuado nos seguintes temas: Serviços Web, Mashups Web, Web das Coisas, Análise de Sentimentos e fusão de dados Web e dados oriundos de dispositivos inteligentes. Maiores detalhes em: http://lattes.cnpq.br/9941773528712076
Prof. Fabrício Firmino de Faria, M.Sc.: possui mestrado em Informática pela Universidade Federal do Rio de Janeiro, atuando em pesquisas com Web Semântica, Data Warehousing, Análises de Redes Sociais e Big Data. Nos últimos anos trabalhou com processamento de linguagem natural para análise de dados textuais e com o desenvolvimento de plataformas para captura e armazenamento de dados produzidos por sensores. Maiores detalhes em: http://lattes.cnpq.br/9994062739448952
Fabio Medeiros Rangel: graduando da Universidade Federal do Rio de Janeiro, possui experiência em análise de Redes Sociais, com foco em visualização de dados e desenvolvimento de algoritmos para cálculo de métricas em ambientes distribuídos. Possui interesse nas áreas de Data Mining e Big Data. Maiores detalhes em: http://lattes.cnpq.br/2076459613085770
Minicurso 2: Estratégias para Proteção da Privacidade de Dados Armazenados na Nuvem
Resumo
Este minicurso descreve o problema da privacidade no ambiente de cloud computing e apresenta algumas técnicas para proteção da privacidade e segurança dos dados dos usuários neste ambiente. As principais estratégias para perservação da privacidade de dados são apresentadas. As vulnerabilidades e ameaças para infraestrutura, dados e controle de acesso na nuvem e os serviços de segurança de dados oferecidos como serviços de nuvem serão apresentados e discutidos. Por fim, será mostrada uma solução original para processamento e armazenamento de dados no ambiente de cloud.
Autores
Javam C. Machado: Professor Associado no Programa de Mestrado e Doutorado na Universidade Federal do Ceará. Doutor em Informática pela Universidade de Grenoble I e Pós-Doutor pelo Instituto National de Télécommunications. Mestre em Informática pela UFRGS. Tem orientado diversos trabalhos na área de Banco de Dados e Sistemas Distribuídos, especialmente na gestão de dados XML e Computação em Nuvem.
José Maria da Silva Monteiro Filho: Professor Adjunto do Programa de Mestrado e Doutorado da Universidade Federal do Ceará. Possui graduação em Bacharelado em Computação pela Universidade Federal do Ceará (1998), mestrado em Ciência da Computação pela Universidade Federal do Ceará (2001) e doutorado em Informática pela Pontifícia Universidade Católica do Rio de Janeiro - PUC-Rio (2008). Tem experiência na área de Ciência da Computação, com ênfase em Banco de Dados e Engenharia de Software, atuando principalmente nos seguintes temas: sintonia automática de bancos de dados, bancos de dados em nuvem, dados ligados na Web e qualidade de software.
Eliseu Castelo Branco Júnior: Doutorando em Ciência da Computação na Universidade Federal do Ceará (UFC). Obteve seu Mestrado em Informática Aplicada pela UNIFOR em 2000. Atualmente está envolvido na pesquisa de políticas e tecnologias para privacidade de dados para Computação em Nuvem, sendo este o tema de pesquisa do seu doutorado.
Minicurso 3: Otimização de Desempenho em Processamento de Consultas MapReduce
Resumo
O "tuning" de processadores de consulta MapReduce é um tópico de pesquisa bastante investigado atualmente. Soluções como o Starfish e AutoConf fornecem mecanismos para ajustar a execução de consultas MapReduce através da alteração de parâmetros de configuração. Neste minicurso serão apresentadas soluções de tuning para o processor de consultas Hadoop. Um dos principais objetivos do minicurso é mostrar como um sistema de aprendizado de máquina não supervisado pode ser aplicado para configurar os parâmetros do sistema.
Autores
Eduardo Almeida: Eduardo Cunha de Almeida is an Assistant Professor (Adjunto III) at the Federal University of Paraná (UFPR). His research interests are in database systems and datawarehousing, and in particular in automating and testing database management to support computationally-demanding distributed query processing. He earned his Ph.D. in Computer Science, with high honors (félicitations du jury), from the University of Nantes, France, in 2009. His PhD thesis was on testing distributed hash tables (DHT). From 1998 to 2005 he worked as an engineer in data warehouse technology at HSBC Bank, GVT Telecom, and UFPR Foundation. From 2010 to 2012 he has served as Deputy Head for the Graduate Program in Computer Science of the UFPR.
Leandro Batista de Almeida Leandro Batista de Almeida is a teacher of computer science at the Federal Technologich University of Paraná (UFPR) since 1994, where he teaches courses in database systems, mobile computing and programming languages. He earned his master degree in 2000, in telematics, and his main research interests are in social network analisys and big data.
Ivan Luiz Picoli
Ivan Luiz Picoli was born in 1990, he is a current student of Master Degree at the
Federal University of Paraná (UFPR) with full-time scholarship granted by Capes. His
main research interests are in database systems based on MapReduce and data
warehousing. His current master thesis is on query optimization in systems based on
MapReduce using unsupervised learning and log analysis. He earned his degree in
Analysis and Systems Development from Federal Technology University of Paraná
(UTFPR), Brazil, in 2012. From 2012 to 2013 he worked as java developer at National
Institute of Colonization and Agrarian Reform (INCRA), Brasília, Brazil.