Il modello di intelligenza artificiale generativa rileva le anomalie delle cellule del sangue / Generative AI model detects blood cell abnormalities
Il modello di intelligenza artificiale generativa rileva le anomalie delle cellule del sangue. Il procedimento del brevetto ENEA RM2012A000637 è molto utile in questo tipo di applicazione. / Generative AI model detects blood cell abnormalities. The procedure of the ENEA patent RM2012A000637 is very useful in this type of application.
Segnalato dal Dott. Giuseppe Cotellessa / Reported by Dr. Giuseppe Cotellessa
Classificazione generativa Il classificatore CytoDiffusion identifica accuratamente un'ampia gamma di aspetti delle cellule del sangue e rileva cellule del sangue insolite o rare che potrebbero indicare una patologia. Gli elementi della griglia diagonale mostrano immagini originali di ciascun tipo di cellula, mentre gli elementi fuori diagonale mostrano mappe di calore che forniscono informazioni sulla logica decisionale del modello. / Generative classification The CytoDiffusion classifier accurately identifies a wide range of blood cell appearances and detects unusual or rare blood cells that may indicate disease. The diagonal grid elements display original images of each cell type, while the off-diagonal elements show heat maps that provide insight into the model’s decision-making rationale.
La forma e la struttura delle cellule del sangue forniscono indicatori vitali per la diagnosi e la gestione di malattie e disturbi del sangue. Riconoscere sottili differenze nell'aspetto delle cellule al microscopio, tuttavia, richiede le competenze di esperti con anni di formazione, motivando i ricercatori ad indagare se l'intelligenza artificiale (IA) possa contribuire ad automatizzare questo compito gravoso. Un gruppo di ricerca guidato dal Regno Unito ha ora sviluppato un modello generativo basato sull'IA, noto come CytoDiffusion, che caratterizza la morfologia delle cellule del sangue con maggiore accuratezza ed affidabilità rispetto agli esperti umani.
I modelli convenzionali di apprendimento automatico discriminativo possono eguagliare le prestazioni umane nel classificare le cellule nei campioni di sangue in classi predefinite. Tuttavia, i modelli discriminativi, che imparano a riconoscere le immagini cellulari basandosi su etichette specifiche, hanno difficoltà a gestire tipi cellulari mai visti prima ed immagini provenienti da microscopi e tecniche di colorazione diversi.
Per colmare queste lacune, il gruppo – guidato dall'Università di Cambridge, dall'University College di Londra e dalla Queen Mary University di Londra – ha creato CytoDiffusion, basato su un classificatore di intelligenza artificiale generativa basato sulla diffusione. Invece di imparare semplicemente a separare le categorie cellulari, CytoDiffusion modella l'intera gamma di morfologie delle cellule del sangue per fornire una classificazione accurata con un rilevamento affidabile delle anomalie.
"Il nostro approccio è motivato dal desiderio di realizzare un modello dotato di fedeltà, flessibilità e consapevolezza metacognitiva sovrumane, in grado di catturare la distribuzione di tutti i possibili aspetti morfologici", scrivono i ricercatori.
Autenticità ed accuratezza
Affinché l'analisi basata sull'intelligenza artificiale possa essere adottata in ambito clinico, è essenziale che gli utenti si fidino delle rappresentazioni apprese da un modello. Per valutare se CytoDiffusion potesse catturare efficacemente la distribuzione delle immagini delle cellule del sangue, il gruppo l'ha utilizzata per generare immagini sintetiche delle cellule del sangue. L'analisi condotta da ematologi esperti ha rivelato che queste immagini sintetiche erano quasi indistinguibili dalle immagini reali, dimostrando che CytoDiffusion apprende realmente la distribuzione morfologica delle cellule del sangue, anziché utilizzare scorciatoie artefatte.
I ricercatori hanno utilizzato diversi set di dati per sviluppare e valutare il loro classificatore di diffusione, tra cui CytoData, un set di dati personalizzato contenente oltre mezzo milione di immagini cellulari anonimizzate provenienti da quasi 3000 vetrini di strisci di sangue. Nelle attività di classificazione standard su questi set di dati, CytoDiffusion ha raggiunto prestazioni all'avanguardia, eguagliando o superando le capacità dei tradizionali modelli discriminativi.
Una diagnosi efficace a partire da campioni di striscio di sangue richiede anche la capacità di rilevare tipi cellulari rari o precedentemente non osservati. I ricercatori hanno valutato la capacità di CytoDiffusion di rilevare i blasti (cellule del sangue immature) nei set di dati del test. I blasti sono associati a neoplasie del sangue come la leucemia, ed un'elevata sensibilità di rilevamento è essenziale per ridurre al minimo i falsi negativi.
In un set di dati, CytoDiffusion ha rilevato cellule blastiche con sensibilità e specificità rispettivamente di 0,905 e 0,962. Al contrario, un modello discriminativo ha mostrato una scarsa sensibilità, pari a 0,281. Nei set di dati con eritroblasti come cellule anomale, CytoDiffusion ha nuovamente superato il modello discriminativo, dimostrando di poter rilevare tipi cellulari anomali non presenti nei suoi dati di training, con l'elevata sensibilità richiesta per le applicazioni cliniche.
Modello robusto
È importante che un modello di classificazione sia robusto in diverse condizioni di imaging e possa funzionare con dati di addestramento sparsi, come comunemente accade nelle applicazioni cliniche. Quando addestrato e testato su diversi set di dati di immagini (diversi ospedali, microscopi e procedure di colorazione), CytoDiffusion ha raggiunto un'accuratezza all'avanguardia in tutti i casi. Allo stesso modo, dopo l'addestramento su sottoinsiemi limitati di 10, 20 e 50 immagini per classe, CytoDiffusion ha costantemente superato i modelli discriminativi, in particolare nelle condizioni di dati più scarsi.
Un'altra caratteristica essenziale delle attività di classificazione clinica, siano esse eseguite da un essere umano o da un algoritmo, è la conoscenza dell'incertezza nella decisione finale. I ricercatori hanno sviluppato un framework per la valutazione dell'incertezza e hanno dimostrato che CytoDiffusion produceva stime di incertezza superiori a quelle degli esperti umani. Con l'incertezza quantificata, i casi con elevata certezza potevano essere elaborati automaticamente, ed i casi incerti potevano essere segnalati per la revisione umana.
"Quando ne abbiamo testato l'accuratezza, il sistema si è dimostrato leggermente migliore degli esseri umani", afferma il primo autore Simon Deltadahl dell'Università di Cambridge in un comunicato stampa. "Ma ciò che lo ha davvero distinto è stato il fatto di saper riconoscere quando era incerto. Il nostro modello non avrebbe mai affermato di essere certo per poi sbagliarsi, ma è qualcosa che a volte accade agli esseri umani".
Infine, il gruppo ha dimostrato la capacità di CytoDiffusion di creare mappe di calore che evidenziano le regioni che dovrebbero essere modificate affinché un'immagine possa essere riclassificata. Questa funzionalità fornisce informazioni sul processo decisionale del modello e dimostra che comprende sottili differenze tra tipi cellulari simili. Tale trasparenza è essenziale per l'implementazione clinica dell'intelligenza artificiale, rendendo i modelli più affidabili poiché i medici possono verificare che le classificazioni si basino su caratteristiche morfologiche legittime.
"Il vero valore dell'intelligenza artificiale in ambito sanitario non risiede nell'approssimare le competenze umane a costi inferiori, ma nel consentire un potere diagnostico, prognostico e prescrittivo maggiore di quello che possono ottenere sia gli esperti che i semplici modelli statistici", aggiunge Parashkev Nachev, coautore senior dell'University College di Londra.
La tecnica CytoDiffusion è descritta in Nature Machine Intelligence.
ENGLISH
The shape and structure of blood cells provide vital indicators for diagnosis and management of blood disease and disorders. Recognizing subtle differences in the appearance of cells under a microscope, however, requires the skills of experts with years of training, motivating researchers to investigate whether artificial intelligence (AI) could help automate this onerous task. A UK-led research team has now developed a generative AI-based model, known as CytoDiffusion, that characterizes blood cell morphology with greater accuracy and reliability than human experts.
Conventional discriminative machine learning models can match human performance at classifying cells in blood samples into predefined classes. But discriminative models, which learn to recognise cell images based on expert labels, struggle with never-before-seen cell types and images from differing microscopes and staining techniques.
To address these shortfalls, the team – headed up at the University of Cambridge, University College London and Queen Mary University of London – created CytoDiffusion around a diffusion-based generative AI classifier. Rather than just learning to separate cell categories, CytoDiffusion models the full range of blood cell morphologies to provide accurate classification with robust anomaly detection.
“Our approach is motivated by the desire to achieve a model with superhuman fidelity, flexibility and metacognitive awareness that can capture the distribution of all possible morphological appearances,” the researchers write.
Authenticity and accuracy
For AI-based analysis to be adopted in the clinic, it’s essential that users trust a model’s learned representations. To assess whether CytoDiffusion could effectively capture the distribution of blood cell images, the team used it to generate synthetic blood cell images. Analysis by experienced haematologists revealed that these synthetic images were near-indistinguishable from genuine images, showing that CytoDiffusion genuinely learns the morphological distribution of blood cells rather than using artefactual shortcuts.
The researchers used multiple datasets to develop and evaluate their diffusion classifier, including CytoData, a custom dataset containing more than half a million anonymized cell images from almost 3000 blood smear slides. In standard classification tasks across these datasets, CytoDiffusion achieved state-of-the-art performance, matching or exceeding the capabilities of traditional discriminative models.
Effective diagnosis from blood smear samples also requires the ability to detect rare or previously unseen cell types. The researchers evaluated CytoDiffusion’s ability to detect blast cells (immature blood cells) in the test datasets. Blast cells are associated with blood malignancies such as leukaemia, and high detection sensitivity is essential to minimize false negatives.
In one dataset, CytoDiffusion detected blast cells with sensitivity and specificity of 0.905 and 0.962, respectively. In contrast, a discriminative model exhibited a poor sensitivity of 0.281. In datasets with erythroblasts as the abnormal cells, CytoDiffusion again outperformed the discriminative model, demonstrating that it can detect abnormal cell types not present in its training data, with the high sensitivity required for clinical applications.
Robust model
It’s important that a classification model is robust to different imaging conditions and can function with sparse training data, as commonly found in clinical applications. When trained and tested on diverse image datasets (different hospitals, microscopes and staining procedures), CytoDiffusion achieved state-of-the-art accuracy in all cases. Likewise, after training on limited subsets of 10, 20 and 50 images per class, CytoDiffusion consistently outperformed discriminative models, particularly in the most data-scarce conditions.
Another essential feature of clinical classification tasks, whether performed by a human or an algorithm, is knowing the uncertainty in the final decision. The researchers developed a framework for evaluating uncertainty and showed that CytoDiffusion produced superior uncertainty estimates to human experts. With uncertainty quantified, cases with high certainty could be processed automatically, with uncertain cases flagged for human review.
“When we tested its accuracy, the system was slightly better than humans,” says first author Simon Deltadahl from the University of Cambridge in a press statement. “But where it really stood out was in knowing when it was uncertain. Our model would never say it was certain and then be wrong, but that is something that humans sometimes do.”
Finally, the team demonstrated CytoDiffusion’s ability to create heat maps highlighting regions that would need to change for an image to be reclassified. This feature provides insight into the model’s decision-making process and shows that it understands subtle differences between similar cell types. Such transparency is essential for clinical deployment of AI, making models more trustworthy as practitioners can verify that classifications are based on legitimate morphological features.
“The true value of healthcare AI lies not in approximating human expertise at lower cost, but in enabling greater diagnostic, prognostic and prescriptive power than either experts or simple statistical models can achieve,” adds co-senior author Parashkev Nachev from University College London.
CytoDiffusion is described in Nature Machine Intelligence.
Da:
https://physicsworld.com/a/generative-ai-model-detects-blood-cell-abnormalities/
Commenti
Posta un commento