StatQuest——生物信息相关原理的入门系列(一)

想学生信原理但是数学不好?不想看一串串公式也想明白各种分析的原理?StatQuest会是一个非常不错的选择!

StatQuest: 该系列视频是北卡罗来纳大学教堂山分校制作的(相当牛的学校了)。视频长度不长,基本上都是十几分钟,而且语速也不快,如果还是觉得有困难可以调整语速或打开字幕,一般6级过了的人基本上都没什么问题。视频链接都是youtube上的(可能需要fq?)。这是我看过的最好的视频系列(没有之一),主要是因为他把非常难懂的东西,用很简单的例子让你明白。这是很不容易的(说“人话”,适合初学者看)。有的视频看一遍就可以完全理解了,有的视频(比如某个算法的例子)看两遍也能理解个90%以上了。之前因为对于生信的原理没有关注,这个系列的视频可以作为很好的入门教程来看。
“墙裂”推荐!!

这个系列的笔记我不打算用截屏+翻译这样的方式来记录了,因为视频里展示的PPT很多都是动画,如果截屏的话要上百张的图片,有点本末倒置了。我认为如果想学,就要自己亲自去看一遍视频(视频又不长,十几分钟就当消遣了,还练习了英语)。

推荐视频:

以下推荐的视频都是我亲自看过的,而且最好按顺序观看,因为都是在前一个视频的基础上进行讲解的:
(1)初学者不理解RNA-seq测序到底是怎么测的?看文献也找不到头绪?读综述太抽象?这个视频讲解的非常简单明了:
StatQuest: A gentle introduction to RNA-seq
(2)是不是不太理解为什么RNA-seq里生物学重复比技术重复更重要?你知道生物学重复/技术重复/mix重复对结果的影响吗?下面这个视频用了很简单的例子来解释了这个困惑:
StatQuest: RNA-seq - the problem with technical replicates
(3)你也许知道RPKM, FPKM, TPM都是什么,但是你知道其中的计算过程吗?也许你知道哪一个方法更好,但是你知道背后的原因么?这里你只需10分钟的时间就可以弄明白:
StatQuest: RPKM, FPKM and TPM, Clearly Explained!!!
(4)edgeR是一个很常用的RNA-seq分析软件,但是你知道它是怎么进行normalization的吗?你知道edgeR是如何计算scaling factor的吗?可能很多教程里会用一大堆公式来说明,但是如果你数学不好(像我一样),估计看都看不下去。可是你又想了解一下怎么办?看视频:
StatQuest: edgeR, part 1, Library Normalization
(5)同样的,DESeq2你肯定不陌生,但是你知道它是怎么normalize你的counts吗?不用看很多很长的公式,你也可以理解其中的原理(这个视频看一遍可能会跟不上,看个两三遍就能明白了~):
StatQuest: DESeq2, part 1, Library Normalization
(6)在我们分析RNA-seq或其他的测序数据过程里,经常会看到p-value这个值。我们通常还会利用p-value挑选变化显著的基因,比如p-value<0.05或者p-value<0.01。但是当你说p<0.05/p<0.01代表变化很显著的时候,你知道它真正的意思是什么吗?一个10分钟的小视频为你解释p-value到底是什么:
StatQuest: p-values: What they are and how to interpret them
(7)知道了p-value代表的真正含义以后,你知道p-value分几种吗?它是怎么被计算出来的呢?你知道p-value由哪几个部分组成吗?
StatQuest: How to calculate p-values
(8)学习了p-value以后,这有一个新名词(不新了,只是我不知道而已。。。),叫p-hacking。你了解什么是p-hacking吗?知道它是怎么产生的吗?p-hacking在我们的实验分析中是很不好的,那么如何避免它?
StatQuest: p-hacking: What it is and how to avoid it!
(9)上面学习了p-hacking以后,如何能减少假阳性的存在呢(事实不显著,但是p<0.05)?FDR可以帮助我们做这件事情。
StatQuest: False Discovery Rates, FDR, clearly explained

以上的视频笔记,我是用OneNote记录的,以下就是笔记内容,有的视频我只记录了一两句话,有的视频我就记录的多一些。想系统学习的同学还需要自己去看视频。毕竟每人的知识点掌握的不一样,我的查漏补缺不一定适合每个人。

©著作权归作者所有,转载或内容合作请联系作者
禁止转载,如需转载请通过简信或评论联系作者。
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,682评论 6 507
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,277评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 165,083评论 0 355
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,763评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,785评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,624评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,358评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,261评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,722评论 1 315
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,900评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,030评论 1 350
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,737评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,360评论 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,941评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,057评论 1 270
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,237评论 3 371
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,976评论 2 355

推荐阅读更多精彩内容

  • 刘小泽写于19.4.27聚类分析的基础就是PCA,掌握这个对以后那么这次就先跟着statquest来学习一下,视频...
    刘小泽阅读 1,719评论 1 10
  • 前言 ROC和AUC,作为一个重要的分类器的评价指标,起初是为了增进军事雷达的敌我侦测能力而发展的。举例而言:雷达...
    安哥生个信阅读 1,142评论 0 1
  • Go 语言教程 Go 是一个开源的编程语言,它能让构造简单、可靠且高效的软件变得容易。 Go是从2007年末由Ro...
    雪域迷影阅读 332评论 0 0
  • 前言 K-Means 是聚类算法中的最常用的一种,算法最大的特点是简单,好理解,运算速度快,但是只能应用于连续型的...
    安哥生个信阅读 2,188评论 2 8
  • 本文翻译自原文地址:Animation deep dive[https://medium.com/flutter/...
    whqfor阅读 976评论 0 1