Schweizer Server hilft bei der Wikidata-Optimierung im Bereich Medizin

Translate this post

Die Förderleistungen von Wikimedia CH beschränken sich nicht nur auf die Schweiz. Dieses Mal führte ein Projekt bis nach Tunesien. Ein Medizinstudent hatte dort die spannende Idee, das freie Wissen über Krankheiten, Symptome, Arzneimittel, deren Wechselwirkungen mit anderen Medikamenten und vieles mehr zu optimieren. Mit Hilfe von künstlicher Intelligenz und unendlich vielen Testläufen arbeitet er daran, dass Wikidata-Abfragen auf dem medizinischen Sektor künftig wesentlich effizienter werden. Ziel ist es, Wikidata in eine gross angelegte biomedizinische semantische Ressource zu verwandeln, welche die meisten Aspekte der klinischen Praxis signifikant abdeckt.

Dieser Medizinstudent ist Houcemeddine Turki (User:Csisc). Wer das Profil des 30-Jährigen liest, merkt schnell, woher die Inspiration für ein solches Mammut-Projekt stammt: Houcemeddine Turki ist ehemaliges Vorstandsmitglied der Wikimedia TN User Group und der Wikimedia and Libraries User Group, Mitglied des Wiki Project Med, aktiver Mitwirkender bei Wikipedia und Wikidata und ehemaliger Test-Wiki-Administrator im Wikimedia Incubator. Er war an der Schaffung der ersten Wikimedia-bezogenen Forschungsstruktur in seinem Land mit dem Namen Data Engineering and Semantics beteiligt und gehörte zum Kernteam mehrerer Wikimedia-Konferenzen, darunter Wikimania, WikiIndaba und WikiConvention Francophone. 2015 kandidierte er für den Vorstand der Wikimedia Foundation. Sein Vorschlag, emeritierte Professoren einzuladen, einen Beitrag zu Wikipedia zu leisten, wurde beim Wettbewerb der IdeaLab Inspire-Kampagne 2017 mit dem ersten Platz gewürdigt.

Mit diesen Erfahrungen aus der Wikiwelt und dem wachsenden medizinischen Hintergrund reifte in ihm die Erkenntnis, dass strukturierte Datenbanken auch im Gesundheitswesen eine bedeutende Ressource darstellen. Sie bieten detaillierte Informationen über Krankheiten, Medikamente, Gene oder Proteine, und vereinfachen so die Verarbeitung und Darstellung klinischer Informationen aller Art. Allerdings ist die Einführung solcher Ressourcen speziell im Globalen Süden schwierig. Oft fehlen die nötigen finanziellen Mittel und das Know-how.

Offene Wissensplattformen wie Wikidata könnten helfen, diese Hürden zu meistern. Wikidata weist jedoch einige Mängel auf: Die biomedizinische Informatik ist unzureichend repräsentiert. Den vorhandenen Daten diagnostizieren Experten eine kritische Inkonsistenzen. Hier will Houcemeddine Turki mit seinem Projekt für Heilung sorgen.  

Mit seinem Projekt will er nicht nur Wikidata in eine biomedizinische semantische Ressource verwandeln. Es sollen auch die in Wikidata frei verfügbaren biomedizinischen Informationen validiert werden. Ausserdem geht es darum, Wikidata für die Nutzung von biomedizinischen Daten im globalen Süden bekannt zu machen.

Die Wikimedia Foundation hat für Erarbeitung des Projekt eine finanziellen Beitrag bereitgestellt. Für die umfangreichen Testläufe, die eine enorme Menge an Rechnerleistung in Anspruch nimmt, hat das Innovation Programm von Wikimedia CH einen seiner rund 20 Server zur Verfügung gestellt.  Was auf diesem Server geschieht, ist eine weitere Ebene des Projekts, um die biomedizinischen Informationen in Wikidata noch zuverlässiger zu machen.

Voller Leidenschaft erklärt der Medizinstudent alle technischen Prozesse, die notwendig sind, um die Informationsvernetzung zu optimieren, und die Datenauswertung, maschinelles Lernen und das Gebiet der generativen künstlichen Intelligenz miteinander zu kombinieren. Für Nichtexperten wird diese komplexe Materie schnell zu einem undurchdringlichen Dschungel an Fachausdrücken, Formeln und Algorithmen. Am Ende steht dann aber die Erkenntnis, dass durch die Arbeit von Houcemeddine Turki die Welt des frei zugänglichen medizinischen Wissens einen grossen Schritt vorwärts kommen wird. Wikimedia CH ist durchaus stolz, einen kleinen Beitrag dazu leisten zu können. 

Im Dezember 2024 teilte Houcemeddine Turki einige Erkenntnisse mit uns:

  • Wir haben eine neue Methode gefunden, um die Vertrauenswürdigkeit von LLM-Antworten auf wahr-falsch-Fragen zu überprüfen.
  • Wir haben unsere Methode verwendet, um die Ergebnisse der Extraktion biomedizinischer Informationen aus PubMed zu überprüfen, bevor sie zu Wikidata hinzugefügt werden.
  • Mit Hilfe von Information-Retrieval-Techniken lassen sich Tausende von fehlenden Wikidata-Relationen identifizieren. Wir versuchen herauszufinden, wie LLMs verwendet werden können, um solch riesige Daten zu durchforsten, so dass die Arbeitsbelastung im Zusammenhang mit der Datenvalidierung erheblich reduziert werden kann.

Mehr dazu:

Can you help us translate this article?

In order for this article to reach as many people as possible we would like your help. Can you translate this article to get the message out?