上一篇推文主要介绍了一下Multi-omicsHammer软件具有哪些功能,本篇就从菜单上的第一个功能开始介绍吧。
先介绍一下开发这个比对(Aligment)功能的初衷吧。还记得刚开始进行数据分析,经常会出现这样一些情况。比如,通过某项分析得出了大约几百个差异基因,而这几百个差异基因的信息包含在另外上千个基因的数据库中。那么,如何快速有效的找出这几百个差异基因的信息呢?是通过excel一个个的检索,还是通过写命令去查找呢?首先,通过excel一个个去检索也不失为一条可行的方法,但是会消耗大量的时间,可能还会导致疏漏。其次,写命令去查找,这条途径无疑是最快的,也是最直接的。但是这一过程需要有一定的编程基础(一些简单的命令)。另外,也需要在命令行下操作,不够方便。因此,针对这一现象,本软件主要开发了Aligment菜单,用来这一过程简化。下面,便介绍如何使用这一软件进行比对(Aligment)分析。
一、我们需要先打开‘Daily work’选项,选择其中Aligment菜单,如图1所示。
那么,我们就可以看见我们的Aligment对话框了(图2)。这一对话框运算部分提供了三个选项。首先是‘is save’选项,这个选项是用来表明是否保存数据;其次是‘simple alig?’选项,这一选项则表明是否仅用对话框中呈现的数据进行运算(如果不勾选,则使用拖入到比对文件对话框的文件内容进行运算)。需要注意的是对于一些用户而言,可能只是简单看一下结果,没有必要特意生成两个文件(比对文件和背景文件)。因此,仅使用这个‘simple alig?’选项,我们可以将数据直接输入到比对文件对话框和背景文件对话框中即可。注意:这两个对话框如果直接将文件拖入,则会直接读取文件的内容,并展示前100行的数据。而结果文件对话框则只会显示文件的路径。因为,已经提供了结果预览部分。最后,最重要的选项就是‘alig’选项了,点击后即可直接进行运算。除了上述选项外,本对话框的其他部分也将以行为主进行简单介绍。
Alig方法:可以选择自动比对(Automatic_aligment)或者扣除(Deduction)的方法。
比对文件:需要获得信息的几百个差异基因。
比对文件用于比对的列:这些差异基因的ID号(或者其他唯一特征)。
比对文件用于不同列之间分割符号:怎么分割每一行不同的数据。
背景文件:数据框中几千个基因的信息。
背景文件用于比对的列:与比对文件对等的唯一特质。
背景文件用于不同列之间分割符号:怎么分割每一行不同的数据。
结果预览:预览输出结果。
结果文件输出:输出结果的文件。
没有比对上填充空值的数量:如果这些基因没有在数据框中检索到,需要使用填空多少个‘no hit’值。因为大多数同学应该都是用excel进行数据排序,如果行与行之间出现缺失值,可能到时数据排序出现错误,或者其他什么问题(本人的经验教训)。
了解完对话框各个部分的含义后,下面将以示例文件为开头介绍如何进行操作。
二、为了方便用户了解这一功能,本软件也提供了示例文件,通过点击图3的方框3的‘load test’选项即可加载示例数据,如方框4和方框5,均为加载示例文件的数据。随后,点击‘alig’即可得出结果。
考虑到图片中无法展示加载数据的全貌,本推文在下面的代码块中展示了相关的数据,方便用户了解
其中比对文件对话框中的数据为:
背景文件对话框中的数据为:
当然,用户也可以直接将文件拖入进入相应的为对话框(比对文件对话框和背景文件对话框)。如图4所示,读者可以直接将文件分别拖入到对话框中。软件会自动识别并加载数据。
三、比对(Aligment)功能对了提供自动比对(Automatic_aligment)这一方法外,也提供了扣除(Deduction)的方法。因为有时除了数据比对外,用户还可能需要对结果进行筛除。因此,本软件考虑到这一现象,就提供了相应的功能,即通过背景文件对结果进行筛选,筛选的操作与自动比对的操作一致。
为方便用户了解产生的结果文件,下面将通过代码块展示两个方法的结果比对
自动比对(Automatic_aligment)的结果:
扣除(Deduction)方法的结果:
通过上述步骤,即可实现通过指定数据库对分析内容进行进一步的信息获得或者筛选。如果读者觉得还有什么功能需要实现,也可直接通过公众号留言。不过还是那句话,改进的进度可能要全凭本人时间安排,无法强求(因为主业更重要)。最后的最后,欢迎大家多用Multi-omics Hammer软件,多提宝贵建议。