XML é hoje o padrão para a representação e troca de
dados na Internet. Dado o seu modelo de dados semi-estruturado,
ele também é adequado para ser usado na integração de dados. A
crescente cooperação entre instituições de uma mesma
área, ou mesmo de áreas distintas, para a criação de
bases de dados que possuam a maior quantidade possível de dados de
um determinado assunto, aumenta a necessidade de bases de dados
secundárias, ou de ``valor agregado'' . Essas bases de dados são
conhecidas como datawarehouse , ou visões materializadas,
devido ao fato de extraírem e integrarem dados de outras bases de
dados existentes. À medida que novas versões dos documentos XML
armazenados são geradas e disponibilizadas é desejável a
existência de um sistema que detecte as diferenças entre os dados
armazenados e a nova versão e que gere os comandos de
atualização necessários para manter o warehouse atualizado.
Alguns dos desafios na automatização deste processo são o registro
do processo de limpeza pelo qual as fontes de dados foram
submetidas, a forma de realizar a integração propriamente dita,
a detecção de diferenças semanticamente corretas e a
identificação correta dos elementos do datawarehouse que são
afetados pelas alterações. Este projeto propõe a
utilização do conceito de chaves XML para orientar
estes processos.