dennis croon
werk

Masterscriptie — Vision AI voor medische beeldclassificatie

Onderzoek waarin de Semantic Learning Machine (SLM) vergeleken werd met klassieke ML-algoritmes op binary en multi-class classificatie van pneumonia X-ray beelden.

rol
Student / onderzoeker
periode
2020/01 → 2020/07
"Een methode die theoretisch elegant is moet zich nog steeds bewijzen tegen brute-force baselines."

Masterscriptie aan NOVA IMS — Universidade Nova de Lisboa, juli 2020. Master Data Science & Advanced Analytics. Begeleid door prof. Mauro Castelli en dr. Ivo Gonçalves. Open access, CC-BY-4.0.

Volledige titel: "The outperformance of the semantic learning machine, against commonly used algorithms, for binary and multi-class medical image classification"run.unl.pt

Het probleem

Pneumonia detecteren op röntgenfoto's — en binnen die positieve gevallen onderscheiden tussen bacteriële en virale infectie. Klinisch relevant omdat de behandeling verschilt: antibiotica werken niet tegen viraal.

De methodologische vraag erachter: presteert de Semantic Learning Machine (SLM) — een relatief nieuwe geometrische semantische hill climber voor feedforward neural networks — beter dan klassieke ML-algoritmes op deze taak?

De aanpak

Feature extraction via transfer learning

Beelden zijn rijk, ML-modellen zoals SVM of Random Forest werken op feature-vectoren. Brug daartussen: meerdere ImageNet pre-trained CNNs als feature-extractor inzetten. Elke X-ray wordt zo omgezet naar een numerieke representatie die de structurele info uit het beeld behoudt.

Dit is dezelfde transfer-learning aanpak die je in 2024 nog steeds tegenkomt in zonnepaneeldetectie en vele andere CV-pipelines.

Modelvergelijking

Vijf algoritmes vergeleken op zowel binary (pneumonia ja/nee) als multi-class taak (gezond / bacterieel / viraal):

| Algoritme | Type | |-----------|------| | Semantic Learning Machine (SLM) | Geometrische semantische methode | | Random Forest | Ensemble van decision trees | | Support Vector Machine | Margin-based classifier | | K-Nearest Neighbors | Instance-based | | Klassieke Neural Network | MLP baseline |

Volledige hyperparameter-optimalisatie op elk model — geen handicap voor de baselines. Dat maakt de vergelijking eerlijk.

Wat het opleverde

Resultaten gepubliceerd via NOVA IMS' open-access repository (CC-BY-4.0). Bijdrage aan de literatuur over geometrische semantische methodes in medische beeldclassificatie. Specifieke onderbouwing van wanneer SLM wel/niet uitperformt op deze taak.

Wat ik specifiek deed

Volledig zelfstandig onderzoek — experimenten draaien, modellen vergelijken, schrijfwerk. Begeleid op methodologie door prof. Castelli en dr. Gonçalves.

Wat ik ervan heb meegenomen

  • Een theoretisch elegante methode (SLM met geometrische semantiek) moet zich nog steeds bewijzen tegen brute-force baselines. Niet vanzelfsprekend.
  • Hyperparameter-optimalisatie is structureel ondergewaardeerd — een correct geoptimaliseerd Random Forest is verrassend sterk. Wie z'n baselines slordig tunet, "wint" makkelijk met de favoriete nieuwe methode.
  • Transfer learning is een werkpaard. ImageNet pre-train → fine-tune op kleine gelabelde dataset werkt al jaren onverminderd goed, in compleet andere domeinen — zie ook Rotterdam zonnepanelen-detectie.

Sleutelwoorden

Pneumonia · Semantic Learning Machine (SLM) · Convolutional Neural Networks (CNN) · Multi-Class Image Predictions · Image Classification · Geometric Semantic · GSGP · Genetic Programming

Gerelateerd

Skills, topics & tech

Gerelateerd werk