SBBD'2014 > Tutoriais

TUTORIAIS

Tutorial Nacional

Métodos Automáticos para Desambiguação de Nomes de Autores em Repositórios de Dados Bibliográficos
Anderson Almeida Ferreira (UFOP), Alberto H. F. Laender (UFMG) e Marcos André Gonçalves (UFMG)

Slides do Tutorial

Tutorial Internacional (ministrado em inglês)

Human-Powered Database Operations
Dongwon Lee (Penn State University)

** Slides Tutotial - Parte I **

** Slides Tutotial - Parte II **



Métodos Automáticos para Desambiguação de Nomes de Autores em Repositórios de Dados Bibliográficos

Resumo

Ambiguidade de nomes de autores é um problema que ocorre quando um conjunto de registros de citações bibliográficas contém nomes de autores ambíguos, ou seja, quando um mesmo autor aparece com nomes distintos em suas publicações ou quando diferentes autores possuem o mesmo nome (ou a mesma variação de nome) em suas publicações. O desafio envolvido na resolução deste problema tem levado ao desenvolvimento de inúmeros métodos de desambiguação. O objetivo deste tutorial é dar uma visão geral dos principais métodos de desambiguação de nomes de autores propostos na literatura e apresentar os principais desafios deste problema.

Autores

Alberto H. F. Laender é Engenheiro Eletricista (1974) e mestre em Ciência da Computação (1979) pela UFMG, e doutor em Computação (1984) pela University of East Anglia, Inglaterra. É Professor Titular do Departamento de Ciência da Computação da UFMG e bolsista de Produtividade em Pesquisa 1A do CNPq. Atua nas áreas de bancos de dados, gerência de dados da Web, bibliotecas digitais e sistemas de informação para a Web, tendo sido coordenador ou membro do comitê de programa de importantes conferências e workshops como SBBD, ER, CIKM, SPIRE, SIGMOD, WWW, VLDB, TPDL, JCDL, AMW e WIDM. Atualmente é membro da Comissão de Avaliação da Área de Ciência da Computação da CAPES e coordenador da linha de pesquisa em Gerência de Dados da Web do Instituto Nacional de Ciência e Tecnologia para a Web. Foi um dos fundadores da Akwan Information Technologies, empresa de tecnologia de busca na Web adquirida pela Google Inc. em julho de 2005. Em 2010 foi eleito Membro Titular da Academia Brasileira de Ciências e agraciado com a Ordem Nacional do Mérito Científico na classe Comendador.

Marcos André Gonçalves possui graduação em Ciência da Computação pela Universidade Federal do Ceara (1995), mestrado em Ciência da Computação pela Universidade Estadual de Campinas (1997), doutorado em Computer Science pela Virginia Polytechnic Institute and State University (Virginia Tech) e pós-doutorado pela Universidade Federal de Minas Gerais (2006). Atualmente é professor Adjunto da Universidade Federal de Minas Gerais. Recebeu diversos prêmios e homenagens ao longo de sua carreira. Atua na área de Ciência da Computação com ênfase em Recuperação de Informação, Bibliotecas Digitais e Banco de Dados. É atualmente Membro Afiliado da Academia Brasileira de Ciências, Bolsista de Produtividade do CNPq (nível 1-D) e Bolsista do Programa Pesquisador Mineiro da Fapemig.

Anderson Almeida Ferreira é bacharel em Informática pela Universidade Federal de Viçosa e mestre e doutor em Ciência da Computação pela Universidade Federal de Minas Gerais. Enquanto aluno de doutorado do Programa de Pós-Graduação em Ciência da Computação da Universidade Federal de Minas Gerais, participou de vários projetos de pesquisa desenvolvidos no Laboratório de Bancos de Dados (LBD) e integrou a equipe do Instituto Nacional de Ciência e Tecnologia para a Web - InWeb. Tem diversos trabalhos publicados nas principais conferências e periódicos de Bibliotecas Digitais e Banco de Dados, tais como, JCDL, SBBD/JIDM, JASIST, IPM e SIGMOD Record. Atualmente, é professor do Departamento de Computação da Universidade Federal de Ouro Preto e integrante do grupo de pesquisa Gerência e Análise Inteligente de Dados - GAID.



Human-Powered Database Operations

Abstract

As a novel computation paradigm, crowdsourcing is being actively pursued in diverse academic disciplines. Within computer science, many sub-fields have embraced the concept of crowdsourcing with open arms and applied the concept to solve diverse challenging problems. Database community is no exception to this phenomenon and there have been many exciting new results using crowdsourcing appearing in recent database literature. In addition to recent tutorials by other scholars that covered broad issues of crowdsourcing in general and contributed to the increased interests in the community, this tutorial seeks to cover more narrow topics with the focus of database, covering state-of-the-art human-powered algorithms in data management. After gentle introduction on the concept of crowdsourcing, this tutorial will provide the overall landscape of crowdsourced database research, with the focus on some of latest human-powered database operations that extend conventional ones (e.g., crowdsourced counting, aggregation, sorting, join, top-k, skyline, search, entity resolution).

Short Bio:

Dongwon Lee is an associate professor of the Pennsylvania State University, College of Information Sciences and Technology, USA. I obtained my Ph.D. in Computer Science from UCLA in 2002. From 1995 to 1997, I have also worked at AT&T Bell Labs. Working mostly on the issues arising in the management and mining of data, I have (co-)authored over 110+ scholarly articles in selective publication outlets in Databases and Data Mining fields.