第一章 绪论
生物信息学的定义
生物信息学是bioinformatics的翻译;
组织数据、并从数据中提取生物学新知识;
狭义的生物信息学:专指应用信息技术存储和分析基因组测序所产生的分子序列及其相关数据,也成分子生物信息学。
广义的生物信息学:生命科学与数学、计算机科学和信息科学交汇融合的交叉学科。
应用数据管理技术、数学分析模型和计算机软件对各种生物信息进行提取、存储、处理和分析,得到生命现象的形成模式和演化规律。
生物信息学及分支学科
计算机生物学
分子计算
PCR技术:聚合酶链式反应,节约时间
归入生物信息学领域的几个方面
1.各种生物数据库的建立和管理
2.数据库接口和检索工具的研制
3.人类基因组计划的实施
4.从海量数据中提取知识
5.DNA芯片和微阵列的发展,基因时空表达
生物信息学与生物实验的关系
1.核算和蛋白质序列来自实验
2.借助计算机对新序列的分析筛选
3.技术的发展使生物信息研究转向使得手工分析不现实
4.实验还是决定性作用,但是有新的工具就要正确使用,明智判断。
生物学发展和计算机应用
1.之前的工作产生了巨量的数据,必须得到应用
2.计算机信息科学和生物学结合能发挥重要作用,有广阔前景
生物信息学发展阶段和研究方向
发展阶段:
1.前基因组时代
2.基因组时代
3.后基因组时代
研究方向:
1.可互操作的生物信息系统及相关数据挖掘技术。
2.需要能揭示大规模数据集合不同组分之间关系的统计分析方法及优化算法。
3.需要开发各种类型的数据转换工具,建立预测模型
4.需要开发适用于微阵列和基因芯片等新技术的数据分析工具。
我国生物信息学发展方向;
1.建立国家生物医学数据库和服务系统
2.人类基因组的信息结构分析
3.功能基因组相关信息分析
4.研究遗传密码起源与生物进化过程和机制
生物吸吸血基本方法和前沿技术
基本方法:
1.建立生物数据库
2.数据库检索
3.序列分析
4.统计模型:隐马尔可夫模型HMM,最大似然模型MLM
5.算法:自动序列拼接、外显子预测、同源比较算法;遗传算法、人工神经网络
前沿技术
1.数据管理技术:集中式大型分子数据库、应用互操作、数字图书馆-->异构数据库集成
2.数据仓库、数据挖掘、数据库知识发现技术:专家系统、数据挖掘工具、本体论
3.图像处理和可视化技术:数字图像处理和模式(识别)匹配
生物信息学应用: 基因组分析、基因芯片、药物开发、其他领域
基因组分析
将序列和功能联系在一起:基因分类、基因致病机制、功能基因组、蛋白质组、预测三级结构和功能
基因组:人整遗传密码
蛋白质组:蛋白质整体表达状况
人类基因组计划:HGP:找到人类基因组的所有基因,除功能克隆和定位克隆外,生物信息学是另一条寻找和研究新基因的思路。
1.建立高分辨力的人类基因组图谱
2.建立选择性模型集体的DNA和人体染色体的基因物质图谱
3.测定人体和选择性集体的DNA序列
4.建立软件和数据库
5.发明有关创新技术
6.建立HGP的伦理学、法律、社会参与程序
自动和数字化实现::
1.高度自动化,将生物学信息转换位数字信息,(自动化分子生物学仪器)
2.大规模EST测序、DNA物理图谱构建-->高度自动化的机器人系统
序列片段的拼接:
基因区域的预测:
1.序列同源比较
2.寻找蛋白质家族保守顺序
3.蛋白质结构的预测
功能克隆:利用疾病一直的遗传损伤引起的生化功能信息进行基因定位,从而克隆该致病基因。
定位克隆:根据遗传连锁分析,染色体步移将基因定位到染色体的一个具体位置不断缩小范围再克隆,研究该基因的功能或抗性的生化机制。
分子进化的研究:
探究隐藏在生物数据后面的生物学知识
分子序列的进化
进化树的构建
基因芯片
原理:将几万个寡核苷酸或DNA做探针,杂交,确定靶DNA的表达情况和突变与多态性
药物开发
其他
基因组信息学的首要任务
发现新的基因和新的功能,30亿对核苷酸,10万个功能基因,EST表达序列标签
生物信息学的商业价值
巨大的商业价值使得 成立各种生物信息机构,建立生物信息集成系统,软件。缩短药物开发周期,抢注基因专利