[Home]
CI087 - Tópicos em Banco de Dados/Gerenciamento de Dados Distribuiídos
Objetivos:
Estudar técnicas de gerenciamento de dados distribuídos e BigData. Discutir os diferentes métodos de acesso e processamento distribuído de dados, a influência das diferentes cargas de trabalho (ex., leitura e escrita de dados), as diferentes tecnologias (ex., SGBD-R, NoSQL, P2P, Modelos de Armazenamento, MapReduce), dentre outros.
Programa:
- Caracterização de Banco de Dados Distribuídos
- Tabelas de dispersão distribuídas (DHT) e Peer-to-peer (P2P)
- Modelos de Armazenamento
- MapReduce e MPP-SQL
- NewSQL e NoSQL
- Validação de Gerenciamento de Dados Distribuídos
Cálculo da nota:
(Trabalhos + Apresentação) / 2
Horários e ensalamento:
- Aulas entre 22/Março e 23/Junho
- 4as-17:30 e 6as-17:30
- O ensalamento deve ser verificado no mural na entrada do Dinf.
Trabalhos:
- Teste de seriabilidade quanto ao conflito e visao. Entrega:
- Roteamento e armazenamento em DHT. Entrega:
Bibliografia:
Livros
- M. Tamer Ozsu, Patrick Valduriez: Principles of Distributed Database Systems, Second Edition Prentice-Hall 1999
- Hector Garcia-Molina, Jeffrey D. Ullman, Jennifer Widom: Database systems - the complete book (2. ed.). Pearson Education 2009
- Sistemas de Banco de Dados - Fundamentos e Aplicacoes, Ramez Elmasri, Shamkant B. Navathe, Editora Pearson, Quarta Edicao, 2005
- Sistemas de Gerenciamento de Banco de Dados, Raghu Ramakrishnan, Johannes Gehrke, Ed. McGraw-Hill, 2007
- Sistema de Banco de Dados, Abraham Silberschatz, Henry F. Korth, S. Sudarshan, Quinta Edicao, Editora Campus, 2006
- Artigos científicos citados em sala de aula.
Artigos:
Modelos de Armazenamento
- I. Alagiannis, et al., H2O: A Hands-free Adaptive Store, in SIGMOD, 2014
- D. Abadi, et al., Column-Stores vs. Row-Stores: How Different Are They, in SIGMOD, 2008 (Jomaro Rodrigues, 06/06)
- Neumann et al., Fast Serializable Multi-Version Concurrency Control for Main-Memory Database Systems,in SIGMOD, 2015 (Ana Basilio, 30/05)
- Valduriez et al., A query processing strategy for the decomposed storage model, in ICDE, 1987 (Leandro Nagano, 30/05)
- Schuhknecht et al. The Uncracked Pieces in Database Cracking, in VLDB, 2014 (Diego Tomé, 23/05)
- O'Neil et al., The log-structured merge-tree (LSM-tree), Acta Informatica, 1996 (Luiz Brito, 04/05)
Gerenciamento de Dados Distribuídos
- Spanner: Google’s Globally-Distributed Database, in OSDI, 2012 (Guilherme Machado, 06/06)
- Abiteboul et al. The DataRing Community Content Sharing, in CIDR, 2007 (Jamilson Bini, 08/06)
- Ng et al. PeerDB: A P2P-based System for Distributed Data Sharing, in ICDE, 2003 (Henrique Hepp, 27/04)
- Huebsch et al. Querying the Internet with PIER, in VLDB, 2003 (Giovanni Venancio, 27/04)
NoSQL e OO-DBMS
- Aggregation Query Models for OODBMS, in TOOLS, 2001 (Eduardo Buratti, 04/05)
- Type-safe relaxing of schema consistency rules for flexible modelling in OODBMS, in VLDBJ, 1996
- Wang et al. Schema Management for Document Stores, in VLDB, 2015 (Eduardo Pena, 02/05)
- Cerqueus et al. Safely Managing Data Variety in Big Data Software Development, in ICSE Workshop, 2015 (Angela Pereira, 25/05)
- Scherzinger et al. ControVol: A Framework for Controlled Schema Evolution in NoSQL Application Development, in ICDE, 2015 (Leandro Batista, 13/04)
- Andany et al. Management of Schema Evolution in Databases, in VLDB, 1991
MapReduce, MPP-SQL e BigData
- Kornacker et al. Impala: A Modern, Open-Source SQL Engine for Hadoop, in CIDR, 2015 (Rodrigo Aires, 25/05)
- Floratou et al. SQL-on_Hadoop: Full circle back to shared-nothing database architectures, in VLDB, 2014
- Shi et al. MRTuner: A Toolkit to Enable Holistic Optimization for MapReduce Jobs, in VLDB, 2014
- Herodotou and S. Babu. Profiling, what-if analysis, and cost-based optimization of mapreduce programs, in VLDB, 2011
- Arasu et al., Transformation-based Framework for Record Matching, in ICDE, 2008 (Rhuan Lima, 23/05)
Validação de Gerenciamento de Dados Distribuídos