Бъгове в софтуера на магнитно-резонансните томографи компроментират 40 000 изследвания

share

Едно ново изследване на методологията на проучванията, използващи магнитен резонанс обезсилва резултатите на цял клон на науката. В продължение на няколко десетилетия, невролози и когнитивните психолози са използвали за анализ данни от статистически програми за магнитен резонанс AFNI, SPM и FSL.

Оказа се, че поради некоректни алгоритми, тези програми могат да показват до 70% неверни положителни резултати, вместо прогнозните 5%. Изследването е публикувано в PNAS, пише nauka.offnews.bg.

Тези резултати поставят под въпрос валидността на около 40 000 научни статии, публикувани през последното десетилетие въз основа на данни от магнитен резонанс. Освен това, новата оценка може да окаже силно влияние върху тълкуването на резултатите от невроизобразяващата диагностика.

Функционален магнитен резонанс се използва в медицината повече от 25 години и е изненадващо, че досега най-често използваните статистически техники, които се прилагат в софтуера за MRI, не са потвърдени от реални данни, пишат авторите на изследването.

Статистическите методи са в основата на интерпретацията на резултатите от магнитния резонанс. Този метод позволява да се определи образно активирането на определени области на мозъка по време на нормалното му функциониране под влияние на различни физични фактори (напр, движение на тялото) и в различни патологични състояния.

В процеса на визуализиране по резултатите от сканиране с магнитен резонанс, получените резултати с висока разделителна способност се делят на малки участъци (воксели). След това софтуерът сканира вокселите и ги обединява в "активни" клъстери, които отговарят на активирането на определена област на мозъка.

Проблемът е, че тази статистическа процедура се извършва неправилно и, както се оказа, не отговаря на научните изисквания за максимална статистическа грешка. Авторите пишат: "Нашите резултати показват, че основната причина за неправилна клъстеризация са функциите за пространствени автокорелации, които не съответстват на предполагаемото разпределение по Гаус".

Например, бъг в софтуера 3dClustSim (част от пакета AFNI) е присъствал в продължение на 15 години и се оправя едва през май 2015 г. по време на подготовката на това проучване, отбелязват авторите на научната работа от университета в Линкьопинг (Швеция) и Университета на Уоруик (Великобритания).

По време на проверката на резултатите на работата на програмите се сравняват данните от функционален магнитен резонанс в покой на 499 здрави лица от контролна група като са получени 3 милиона томографии. Установено било, че процентът на фалшиви положителни резултати е много по-висок от очакваните 5% и достига до 70%. Изследователите заключават, че параметричните статистически методи, които се използват в популярните софтуерни пакети SPM, FSL и Afni, всъщност са неподходящи за клъстерен анализ на резултатите от магнитния резонанс, защото резултатите не отговарят на нормалното разпределение.

Ето какво се случва, когато изследванията се извършват без проверка на коректността на медицинските инструменти за спазването на научните статистически стандарти.

Авторите на научните статии от областта на медицината сега вероятно ще трябва да извършат анализите си отново, за да повторят резултатите си, този път получени с помощта на валидни статистически методи.

Водещи новини

Още новини