影像组学学习笔记(37)-机器学习模型判断脑卒中发病时间(文献报告)

本笔记来源于B站Up主: 有Li 的影像组学系列教学视频
本节(37)主要介绍一篇文献,关于 机器学习模型判断脑卒中发病时间

文献题目:Machine Learning Approach to Identify Stroke Within 4.5 Hours, 2019年12月发表在 Stoke 上。

研究的目的为:

to investigate the ability of machine learning techniques analyzing diffusion weighted imaging (DWI) and fluid-attenuated inversion recovery (FLAIR) MRI to identify patients within the recommended time window for thrombolysis.

由于专业的不同,重点学习一下这篇文献的方法学部分及相应的结果描述吧!

方法(Methods)
  1. 首先是研究的整体流程图


    literature_1.png
  2. 图像主要处理流程为:
    A. Infarct regions were automatically segmented on the ADC maps by applying normalized absolute thresholding.
    B. A quantile curve of ADC intensities within the brain mask was constructed for each ADC map of each subject, and an intersection point between 2 tangent lines with maximum and minimum differential coeffcients was identifed on each quantile-intensity curve. (这句没有看懂,大概意思是交代自动分割阈值是如何选择的)
    C. The ADC maps were normalized
    D. Each normalized ADC map was thresholded at the optimal absolute value of 0.845.
    E. FLAIR images were coregistered onto ADC maps.


    image.png
  3. Generation of Ratio Maps

Ratio maps were constructed by reflecting the image around the ftted midsagittal plane, resulting in quantitative comparisons of the relative signals of the infarct regions and the contralateral side.

  1. Extraction of Imaging Features

... extracted from the registered FLAIR images and FLAIR ratio maps included intensity, gradient, and texture information...

image.png
  1. Machine Learning
    交代了使用的机器学习算法,以及它们各自的特点。

...cluster analysis including LR, and modern classifcation theories including SVM which
needs feature selection and RF which needs not feature selection

  1. Human Visual Assessment of DWI-FLAIR Mismatch
    描述了人类视觉评价的过程,以及mismatch的定义

A DWI-FLAIR mismatch was defned as the presence of a visible acute ischemic lesion on DWI but no traceable parenchymal hyperintensity in the corresponding region on FLAIR imaging

7.统计方法描述:
A. 研究者使用了单因素t检验对89个特征进行筛选,并使用了Bonferroni correction对p值进行了校正。(这里研究者把p值设在了0.2,如果是常规的0.05,然后再除以89,会非常小);如果校正后特征数目小于5个,则根据p值排序,选择前5个。
B. 机器学习模型和人类视觉的表现差异。
C. Youden index来决定cutoff 值(但是后文好像没有交代结果)。

结果(Results):
  1. 首先对分组情况(training set, test set)进行了描述,基线资料、target的分布等。自然,两组之间没有什么统计学差异。
  2. 单因素分析进行特征筛选,共筛选到34个特征用于ML建模(LR, SVM,RF)。
  3. 每个类别中表现最优的用于测试集中进行评价。尽管RF的AUROC最大,但是三者之间并没有统计学差异(如图)


    image.png

    和人类视觉判断相比,ML模型在sensitivity和NPV上表现优良,但在specificity和PPV上略逊一筹。


    image.png

拓展:
在仔细研读文献的统计方法部分时,发现在机器学习领域,有很多统计方法和我们平时用的不太一样。

The Bonferroni correction compensates for that increase by testing each individual hypothesis at a significance level of α/m, where α is the desired overall alpha level and m is the number of hypotheses. For example, if a trial is testing m=20 hypotheses with a desired α=0.05, then the Bonferroni correction would test each individual hypothesis at α=0.05/20=0.0025.(from wikipedia)

  1. Bonferroni correction 可以称作是“最简单粗暴有效”的校正方法,它拒绝了所有的假阳性结果发生的可能性,通过对p值的阈值进行校正来实现消除假阳性结果,但是该方法比较保守,容易错误地接受零假设。用的更多的是Holm's-Bonferroni,比前者要更容易发现显著差异。(知乎@123456@Sichao Song)

Sensitivity and specifcity were compared using McNemar tests, and positive predictive value and negative predictive value were compared using the Generalized Score Statistics method, as appropriate.

  1. McNemar test 和卡方检验的区别:
  • The McNemar is not testing for independence, but consistency in responses across two variables.
  • Although Chi-Square tests can be used for larger tables, McNemar tests can only be used for a 2×2 table.
  1. 这里的the Generalized Score Statistics method应该和 Generalized score tests 是一回事(没有找到相应的中文名)。它属于半参数方法,不受总体分布影响;最常用于重复测量数据。

Positive and negative predictive values are important measures of a medical diagnostic test performance. We consider testing equality of two positive or two negative predictive values within a paired design in which all patients receive two diagnostic tests. The existing statistical tests for testing equality of predictive values are either Wald tests based on the multinomial distribution or the empirical Wald and generalized score tests within the generalized estimating equations (GEE) framework. As presented in the literature, these test statistics have considerably complex formulas without clear intuitive insight. (ResearchGate@Andrzej S Kosinski)

参考资料:
如何计算McNemar检验,比较两种机器学习分类器
The Difference Between a Chi-Square Test and a McNemar Test

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,001评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,210评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,874评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,001评论 1 291
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,022评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,005评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,929评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,742评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,193评论 1 309
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,427评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,583评论 1 346
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,305评论 5 342
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,911评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,564评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,731评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,581评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,478评论 2 352

推荐阅读更多精彩内容

  • 夜莺2517阅读 127,718评论 1 9
  • 版本:ios 1.2.1 亮点: 1.app角标可以实时更新天气温度或选择空气质量,建议处女座就不要选了,不然老想...
    我就是沉沉阅读 6,887评论 1 6
  • 我是一名过去式的高三狗,很可悲,在这三年里我没有恋爱,看着同龄的小伙伴们一对儿一对儿的,我的心不好受。怎么说呢,高...
    小娘纸阅读 3,387评论 4 7
  • 这些日子就像是一天一天在倒计时 一想到他走了 心里就是说不出的滋味 从几个月前认识他开始 就意识到终究会发生的 只...
    栗子a阅读 1,620评论 1 3