O Grupo de Trabalho do W3C de Troca de Conjunto de Dados, em inglês Dataset Exchange (DXWG) — publicou a segunda versão do vocabulário do Catálogo de Dados, em inglês Data Catalog vocabulary “(DCAT)como uma “Recomendação” do W3C. O DCAT fornece às pessoas e às máquinas uma abordagem específica e independente de domínio para criar catálogos que expressam os principais elementos de uma descrição de conjunto de dados de maneira padronizada, adequada para publicação na Web, e permite a interoperabilidade entre domínios, sendo usada por conta própria ou ao lado, como complemento de outros padrões de catálogo de dados.
Assim, o DCAT facilita a pesquisa e a recuperação efetivas e permite o fácil aprimoramento do processo de consulta por meio da agregação “sem atrito” de descrições de conjuntos de dados e registros de catálogo de várias fontes e domínios diferentes, ou aplicando a mesma consulta em vários catálogos e agregando os resultados. Esses padrões também podem variar, de modo a fornecer às comunidades abordagens personalizadas do catálogo de conjuntos de dados que respeitam as nuances específicas de um determinado tipo de dados.
A versão 2 do DCAT baseia-se no trabalho inicial publicado em 2014, fornecendo, entre outras coisas, classes de descritores que podem ser usados para serviços de dados e um conjunto mais amplo de relacionamentos que caracterizam conjuntos de dados e seus aspectos temporais e espaciais. Remove as restrições inerentes ao uso prescrito de alguns termos de vocabulário para relacionamentos (propriedades) presentes em sua versão original, tornando seu padrão de uso mais flexível.
Embora a expectativa seja de que os editores de conjuntos de dados revisem seus catálogos existentes, de acordo com suas atividades gerais de curadoria e atualização para usar os recursos adicionais disponíveis na versão 2, a compatibilidade entre a nova versão e a versão anterior do vocabulário DCAT foi preservada.
O Grupo de Trabalho (GT) também se esforçou em (i) fornecer descrições multilíngues dos diferentes termos e propriedades, facilitando sua aplicação em todo o mundo; e (ii) explicar o alinhamento ao vocabulário Schema.org, que é o conjunto de metadados mais amplamente usado pelos mecanismos de pesquisa para otimizar a indexação do conteúdo da Web, e agora cada vez mais adotado também em catálogos de dados.
Apenas alguns anos após seu primeiro lançamento em 2014, o DCAT tornou-se reconhecido como um padrão de interoperabilidade essencial para catálogos de dados em muitos países e organizações. Os fornecedores de mecanismos de pesquisa estão usando para identificar ativos de dados para catalogar, e os editores estão usando para tornar seus materiais mais acessíveis. No futuro, o GT espera que a incorporação de classes para descrever os serviços de dados no modelo torne o DCAT uma ferramenta cada vez mais útil na ciência de dados e forneça um caminho bem trilhado para aqueles que implementarem os Princípios FAIR.
O DXWG aprecia ouvir sobre qualquer implementação de catálogos usando o DCAT v2. Também gostaríamos de saber sobre os erros ou problemas encontrados, para que possam ser inseridos no gerenciamento contínuo da versão 2 e influenciar potencialmente as alterações a serem feitas na versão 3, cujo trabalho está apenas começando. Você pode enviar comentários sobre erros ou dificuldades que enfrenta com o DCAT v2 para o WG por e-mail para public-dxwg-comments@w3.org ou através da página de erratas. Para novos casos de uso e outros problemas, entre em contato conosco por e-mail ou enviando um problema no repositório do GitHub. Esperamos que você ache esse padrão uma adição útil às suas publicações de dados.
*Tradução do post publicado no Blog do W3C feita por Caroline Burle.