Audiologia Computacional no Wikidata: laboratório de qualidade de dados

Translate this post
WikiLab Saúde Auditiva organizado com apoio do WikiApoia 2025. CorraleH, CC BY-SA 4.0. Wikimedia Commons.

Avaliar a qualidade constitui uma etapa essencial e negligenciada em iniciativas de dados abertos. Essa avaliação envolve ao menos quatro dimensões fundamentais: i) Completude, que verifica a presença de propriedades essenciais; ii) Verificabilidade, que examina a existência de fontes confiáveis nas referências; iii) Coerência, que identifica contradições ou valores impossíveis; e iv) Atualidade, que avalia a revisão ou atualização periódica dos dados.1

Diferentes ferramentas desenvolvidas pela comunidade permitem a avaliação da qualidade dos dados no Wikidata. Exemplos de aplicações: ProVe, que verifica automaticamente se referências citadas em itens correspondem textualmente com as fontes; ORESLiftWing, que prediz classes de qualidade baseado em modelos de aprendizado de máquina; Recoin, que sugere propriedades ausentes com base em padrões de completude.

Modelos de qualidade beneficiam diretamente as comunidades do Wikidata. Iniciativas de integridade informacional em educação (WikiProjeto Brasil Escolas) e saúde (WikiProjeto Saúde Auditiva) dependem dessa análise multidimensional. A qualidade de dados viabiliza a interoperabilidade (princípios FAIR) e a integridade (modelo ALCOA+).2 Essa operacionalização pode ser utilizada em outros contextos de ciência aberta e parcerias culturais (GLAM).

Curadoria e Difusão Científica 

Abordagens computacionais orientadas em metaciência favorecem a reprodutibilidade e a transparência nos processos de curadoria e análise de dados científicos e bibliográficos. Nesse ecossistema, o Wikidata Query Service (SPARQL) e ferramentas como o Scholia transformam itens no Wikidata em conhecimento visual. Essas aplicações mapeiam redes semânticas, coautorias e conexões temáticas, revelando o impacto da produção científica.

Difundir metodologias de avaliação de qualidade no Wikidata impulsiona o letramento computacional. Essa competência fundamenta o desenvolvimento de pesquisas bibliométricas e aplicações em dados abertos no Wikidata; fomentando também a comunidade sociotécnica no Sul Global e em contextos não anglófonos. 

Laboratório de Qualidade de Dados no Wikidata

Este relato apresenta o desenvolvimento de um laboratório de dados no Wikidata para ampliar experiências em qualidade de dados em saúde auditiva na comunidade brasileira e Lusófona. A experiência apresentada foi organizada no contexto do programa de financiamento WikiApoia 2025 da Wikimedia Brasil nomeado “WikiLab Saúde Auditiva: qualidade e visualização de dados da produção científica brasileira em saúde auditiva no Wikidata“. O projeto inova ao integrar o ecossistema Wikimedia à pesquisa e difusão científica temática emergentes como a audiologia computacional.

O laboratório teve como temática dados em saúde auditiva no Wikidata. A atividade aconteceu em formato virtual em 22 de agosto. A atividade contou com a participação de 12 estudantes e profissionais de ciências da audição, além de wikimedistas. O público-alvo da atividade foram grupos de pesquisa da Universidade de São Paulo, Campus Bauru, e da Universidade Federal de Santa Catarina; também sendo aberta à participação da comunidade Lusófona.

O modelo da atividade teve como estrutura o treinamento e uso de implementações de programação em Python para análise de dados do Wikidata. Essa iniciativa favoreceu o letramento computacional por meio da iniciação em competências de pesquisa orientada aos projetos Wikimedia. A atividade capacitou os participantes em exploração e análise para validar dados em saúde auditiva no Wikidata e desenvolver competências computacionais.

O WikiLabs Saúde Auditiva foi criado como uma iniciativa do WikiProjeto Saúde Auditiva e do Centro de Pesquisas Audiológicas (USP-CNPq). Membros do WikiProjeto Saúde Auditiva e WikiProject Reference Verification atuaram como voluntários na organização e suporte das atividades propostas.

As bibliotecas RequestspyWikibot e pandas foram utilizadas para extração e organização de dados do Wikidata. APIs (Interfaces de Programação de Aplicações) da Wikimedia e das ferramentas LiftWing e ProVe avaliaram os índices de completude e verificabilidade de exemplos recuperados do Wikidata. Os participantes aplicaram modelos de qualidade e executaram códigos no PAWS Notebook. A execução em Python gerou visualizações e índices/classificação de qualidade de dados no Wikidata.

Resultados e Perspectivas

Os participantes demonstraram a aplicabilidade da proposta do laboratório para iniciação em práticas de qualidade de dados. Esse processo é potencialmente benéfico para integridade informacional em saúde auditiva; assim como em outros contextos de uso do Wikidata. Desta forma, a iniciativa demonstra um exemplo de formação em dados (em audiologia computacional) baseada no Wikidata. O modelo será replicado pelo WikiProjeto Saúde Auditiva em atividades temáticas em integridade de dados e reprodutibilidade em contextos educacionais e de pesquisa.

Os exemplos de código desenvolvidos estão documentados e disponíveis no GitHub. Documentação complementar sobre a iniciativa de treinamento pode ser encontrada na Wikiversidade em Visualização e Qualidade de Dados no Wikidata.

Apoio

Essa atividade foi organizada com o apoio da Wikimedia Brasil, por meio do programa WikiApoia 2025.

O projeto WikiLabs Saúde Auditiva é organizado pelo WikiProjeto Saúde Auditiva, e parte de seus participantes possui vínculo com a Fundação de Amparo à Pesquisa do Estado de São Paulo (processo nº 2024/05572-7) e com o Centro de Pesquisas Audiológicas (USP-CNPq).

Notas:

1. Ramasamy, A., & Chowdhury, S. (2020). Big Data Quality Dimensions: A Systematic Literature Review. Journal of Information Systems and Technology Management, 17. https://doi.org/10.4301/S1807-1775202017003

2. TRS 1033 – Annex 4: WHO Guideline on data integrity. (2025, November 19). https://www.who.int/publications/m/item/annex-4-trs-1033

Can you help us translate this article?

In order for this article to reach as many people as possible we would like your help. Can you translate this article to get the message out?