R语言生物信息大数据分析与深度挖掘及论文呈现实践技术
各企事业单位:
随着高通量测序以及生物信息学的发展,R语言在生物大数据分析以及数据挖掘中发挥着越来越重要的作用。想要成为一名优秀的生物数据分析者与科研团队不可或缺的人才,除了掌握对生物大数据挖掘与分析技能之外,还要具备一定的统计分析能力与SCI论文质量绘图能力。因此,为辅助提高生命科学研究工作者的生物数据可视化与深度挖掘技能,我们举办了本次R语言与生物信息学培训班,本次会议我们精选大量生物数据分析案例,包括利用R语言绘制SCI高质量图片、利用R语言分析生物学数据的案例。通过本次培训,使学员能够掌握利用R科学文献图的绘制技巧、完整的利用R分析生物数据,提高学员数据分析技能、领会高水平SCI论文撰写思路,助力科研。现将有关事宜通知如下:
一、主办单位:北京中科资环信息技术研究院教育中心
会议指定协办单位:北京中科硕博研计算技术中心
二、时间地点:2019年3月28日—3月31日 地点:湖北-武汉
(时间安排:第一天报到、授课三天)
三、培训目标:
1. 掌握R语言在生物信息学中的统计学方法;
2. 掌握各种R语言绘图包;
3. 掌握R语言的数据可视化方法;
4. 通过手把手的实操指导,掌握R语言数据处理方法与编程技术;
5. 通过不同的实际案例讲解与模拟操作掌握R语言实施生物学数据科学项目的方法;
6. 掌握编程语言自主学习实践的方法与技巧;
7. 以自身研究经历分享高水平SCI论文分析撰写思路(Plant Cell、Plos Genetics、New Phytologist)与绘图技巧。
四、主讲专家:
主讲专家来自重点高校及科研院所一线科研人员,长期从事生物数据分析与挖掘,基因测序等领域工作研究工作,以第一作者发表过多篇生物学SCI高水平论文(如:Plant Cell、Plos genetics; New Phytologist; Journal of Experimental Botany等)。精通R语言、python语言等分析工具,具有丰富的科研及测序数据分析经验。
五、培训对象:
各省市、自治区从事生物、遗传、基因、农业、医药、生态、林业、微生物等行业数据统计分析岗位的技术骨干、科研院所研究人员和大专院校相关专业教学人员及在校研究生、硕士、博士等相关人员,以及广大R爱好者。
六、培训方式: 1、课程讲座; 2、专题小组研讨与案例讲解分析结合; 3、上机操作。
七、培训费用:
3900元(报名费、培训费(会议费)、资料费、午餐费)住宿可统一安排,费用自理。
(发票可开具:培训费、会议费、资料费等,会场发放红头文件,用于参会人员报销使用)
八、颁发证书:
参加会议的学员可以获得《生物信息分析工程师》专业技术培训证书。此证书作为个人学习和知
识更新、专业技能提升、单位人才聘用的参考依据。
注:办理证书提交资料:请学员提交电子版2寸蓝底证件照片,照片名称标记为:真实姓名+身份证号,报名同时提交给会务联系人。
九、报名方式:
请各有关部门统一组织本地区行政、企事业单位报名参加培训,各单位也可直接报名参加。
报名回执表请传真至会务组010-53853500 或发E_mail:1561702198@qq.com ,会务组收到
回执后通知报到相关事项。
十、联系方法:
电话/传真;010-53853500 R语言生物信息应用qq群 641871657 加群请备注:王进邀请
联系人:王进 18510371091 (微信同号) QQ咨询:1561702198
课程内容简要:
时 间
授课方 式
课 程
主 要 内 容
第一天
8:30~10:00
(2课时)
知识梳理
与经验分享
R语言与数据科学
n R语言发展脉络
n R语言数据操作技巧
n Linux服务器架构及基本操作
n R 语言在linux服务器中的使用方法
n R语言在生物信息学中的应用
10:10~11:40
(2课时)
讲授
与实操相结合
R语言编程技巧数据操作
n R与工作目录
(工作目录,切换工作目录)
n R的数据类型及结构 (数值型、逻辑型、字符型、向量、列表、数据框、矩阵)
n R中各数据类型的赋值与操作
(针对不同数据类型进行赋值、批量读取数据、通过循环对数据进行计算、差异分析)
n 各种数据格式的读写及操作 (Excel、TXT、CSV、TSV)
14:00~15:30
(2课时)
讲授
与实操相结合
R展示生物学数据
n R统计方法概述
n 如何使SCI论文更具科学性
(Cover letter 如何写作、摘要、Introduction、Results、Discussion如何写作才可以使审稿人眼前 一亮)
n 基本绘图命令概述
n 高级绘图命令概述
15:40~17:10
(2课时)
讲授
与实操相结合
n 基因组大小与基因含量的散点图
n 绘制基因长度分布直方图
n 绘制基因长度分布的频率分布密度曲线
n 向图中添加数学公式
第二天
8:30~10:00
(2课时)
讲授
与实例相结合
统计编程R实现
n 相关性分析及共表达网络构建
n 方差分析
n 回归分析
n 多元线性回归
n Logistic回归
n Genome Research文章逻辑回归实例操作
10:10~11:40
(2课时)
讲授
与案例相结合
14:00~15:30
(2课时)
实例演示
与讲解相结合
R语言在RNAseq分析中的应用
n RNA-Seq前沿动态
n RNA-Seq实验设计
n 非编码RNA (lncRNA、miRNA) 分析手段、研究策略解析
n RNA-Seq数据如何发表高分SCI论文
(讲解如何从取样、建库、上机测序到数据如何分析,让学员了解目前转录组学哪些内容可以深度挖掘、哪些建库方式对应哪些分析内容、让学员掌握如何根据自己的实验目的选择合适的建库方式和分析手段)
15:40~17:10
(2课时)
讲授
与课堂练习
第三天
8:30~10:00
(2课时)
知识点梳理与实操相结合
数据可视化R实现
n R绘图的实例演示
n 演示中涉及的各种绘图功能的讲解与R实现,包括:绘图区域分割、二维图形、交互绘图
n 数据绘图强化武器
1. 采样点地图、热力图、气泡图
2. 维恩图、PCA图、关联分析曼哈顿图
3. 小提琴图、盒型图、饼图
n 多种作图方式结合
(综合利用R、PPT等绘图工具拼接完成论文图片)
n 高分辨率SCI论文图片生成
(综合利用AI、pdfviewer生成高质量论文图片)
10:10~11:40
(2课时)
案例讲解与实操相结合
14:00~15:30
(2课时)
讲授
与实操相结合
R语言二代测序数据深度挖掘
n 数据重复性评估
(如何在文中体现出不同重复的RNA-SEQ结果、Realtime PCR结果与RNA-SEQ结果如何对用)
n 基因共表达网络构建与Cytoscape展示
n 多组数据表达趋势聚类及深度解析策略
(转录组学数据泛滥的时代,如何才能找到数据中的亮点,如何深度挖掘数据中隐藏的创新点,让学员掌握几种深度解析组学数据的方法)
15:40~17:10
(2课时)
讲授
与实操相结合
R语言在其他生物数据分析中的案例
n WGCNA方法寻找表型关联基因模块
n 自带组学分析项目交流及解答