Elizabeth Bik è una microbiologa che ha deciso di dedicarsi ad una speciale attività investigativa: analizza prevalentemente le immagini pubblicate in articoli scientifici alla ricerca di eventuali “ritocchi” o duplicazioni. In una bella intervista pubblicata su El Paìs la studiosa racconta gli inizi di questa sua specifica attività scientifica, gli effetti della denuncia di più di 800 lavori con immagini duplicate o modificate (tanti erano i casi nella sua prima analisi compiuta su 20000 articoli), la reazione spesso molto lenta del sistema, impreparato a reagire a denunce di scientific misconduct e comunque le difficoltà che i journal si trovano ad affrontare in un processo di verifica che può durare anni. Per ora circa il 50% degli articoli segnalati sono stati oggetti di retraction.
La modifica delle immagini o la loro duplicazione non è sempre intenzionale o espressione di frode scientifica, possono esserci errori casuali o piccole modifiche fatte in buona fede, ma alcune azioni, come la rotazione delle foto o la duplicazione dell’immagine di una cellula con photoshop non accadono per caso.
Le segnalazioni di Bik, iniziate nel 2015, all’inizio sono state considerate infondate, solo col tempo non solo ne è stata verificata la fondatezza, ma anche l’estensione del fenomeno denunciato.
Alla domanda se sia preoccupata per il crescente uso della intelligenza artificiale Bik risponde in modo molto chiro:
I’m not completely worried about fake text; scientific data fraud worries me more than text generation. You can ask it to generate a fake set of patients, split them into two groups and do some experiment with them. It is so good that we can no longer distinguish those sets from real data sets.
Un capitolo specifico dell’intervista è dedicato al tema dell’uso di indicatori quantitativi per la valutazione della ricerca, dello sviluppo di imprese volte a fornire articoli falsi o plagiati (paper mills), insomma agli effetti di quello che in letteratura è chiamato publish or perish.
Il sistema è in grado di autocorreggersi anche se con estrema lentezza. E’ necessario che si torni a pubblicare con i tempi e i modi adeguati ad una ricerca che sia trasparente e riproducibile.
Journals are starting to set up safeguards like image duplication detection by screening for ChatGPT-generated language, and in the meantime, fraudsters know we’re going to screen for these things. It’s a rat race where the fraudsters will always win, but we can make it harder for them. We need to slow down scientific publishing.