今天给小朋友数据可视化工具时候,发现国内很多人开发出来数据可视化平台,可以满足许多数据可视化需要。想着干脆整了一个目录贴。简单记录下来,几个我不时会看到的,都是非常漂亮的工作,相信也解决了非常多人的数据可视化问题。值得好好学习一波。
Visual Omics
Visual Omics: a web-based platform for omics data analysis and visualization with rich graph-tuning capabilities
发表在 Bioinformatics 期刊上,2023年见刊,约等于新鲜出炉~
解决的问题:R包输出的图片都是静态的,固定的,不可编辑的,为此作者团队开发了一个用于组学数据分析和科学图表编辑的在线工具。集成了多种组学分析,包括差异表达分析、富集分析、蛋白结构域预测和蛋白质相互作用分析,并提供了丰富的图形展示。它还可以独立绘制和自定义在组学分析中常见的基础图表,如各种PCA/PCoA图、条形图、箱线图、热力图、集合交集图、气泡图和火山图等。
从实现逻辑来猜测,重点使用了 ggplot2 进行数据可视化。是一个不错的工作,支持了大量分析,开放了许多参数。
Image GP
ImageGP: An easy‐to‐use data visualization web server for scientific researchers
ImageGP 发表在 iMeta 期刊,相信在发表之前就很多人了解过这个平台。目前发表一年多,积累引用>100次,实际被引不确定。
解决的问题:ImageGP是一个专为生物学和化学数据可视化而设计的专业平台。ImageGP可以在用户友好的界面中生成常见的线条、柱状图、散点图、箱线图、集合图、热力图和直方图等广义图表,以最常见的输入内容为基础。
ImageGP提供了高达26个参数,以满足定制化需求。ImageGP还包含了专门的图表,如火山图、功能富集图,用于大多数组学数据分析,以及其他四个专门用于微生物组分析的功能。
文稿介绍相对简单,不过不影响这个平台被广泛使用。
Hiplot
Hiplot: a comprehensive and easy-to-use web service for boosting publication-ready biomedical data visualization
Hiplot 发表于 Briefings in Bioinformatics,是我了解到做得比较成熟,目前也广为人知的平台。由于这个平台是社区驱动,文稿上标注了 Hiplot Consortium。这个比较有意思。
图稿显示很详细,后台主要以 R shiny 为主。我与剑锋有聊过两三句话(当时我正好在做 TBtools-II 的插件模式,在健明的引荐下微信认识)。Hiplot 这个平台做得非常成功,当然投稿不顺利确实复杂。不过,就我个人的认知而言,这个平台可能是最为成熟,或许支持的数据可视化类型也最多。此外,Hiplot 有企业支持,这或许是一个小小助力。相比于单打独斗,没有物质支持的平台,有得到支持的工作,往往会更为成熟,同时也好用。或许有必要再贴一张图。
还是必须再说一句,做得真是精巧~ 非常值得学习。
OmicsSuite
OmicsSuite: a customized and pipelined suite for analysis and visualization of multi-omics big data
OmicsSuite 发表于 Horticulture Research 期刊。事实上如果发表在其他期刊可能我就看不到,毕竟是园艺方向期刊。
解决的问题:文稿中强调了本地化的意义,这个我个人完全赞同。整体功能接近 Hiplot 的 stand-alone 版,类似的支持了大量数据可视化。
我觉得这对于网络环境不太好的朋友,值得关注下子。Hiplot 我记得也有本地版本,不过我个人认知 Hiplot 的本地版主要指作为一个浏览器替代。留意到作者列表,Hiplot 和 OmicsSuite 的作者列表有重叠。这个比较有趣。
OmicsStudio
OmicStudio: A composable bioinformatics cloud platform with real‐time feedback that can generate high‐quality graphs for publication
解决的问题:一个词组:云平台。与 Visual Omics 属于一类。发表单位是“联川生物”。事实上,这个平台我记得起步比较晚,不过现在用户相信也很多,同时也发表出来了。支持了许多分析,我没有使用过。不过相信有公司经费支持,一般都可以维护得相对较好。
SangerBox
Sangerbox: A comprehensive, interaction‐friendly clinical bioinformatics analysis platform
解决的问题:同样是一个词组:云平台。SangerBox 我有大体了解。早期与 TBtools 类似,开发的是本地软件,重点关注了医学方面数据分析,印象还组织过一些培训。我与开发团队中的某一两人有聊过两三句。后来似乎就全部上云了。相信现在做得也很好。发表了这份工作。
写在最后
或许有时间的话,我会一个一个体验一波。不过我们已经可以发现,现在的生物信息学数据可视化,重度依赖 R 语言。换句话说,要做好数据分析可视化,必须学好 R 语言,至于后续开发平台,大多数时候,可以直接写 R ShinyApp。至于 Python,在统计数据可视化上,距离 R 语言还是有一些距离。
有个事情说来有趣,我翻了下作者团队列表,发现我跟每一个工作中至少一个作者都有聊过(第一个无法确定),当然都只是说过一两句话的状态。类似的工作,我审过不少,其中大多数是见刊的,毕竟我知道,真的不容易,所以要么给大修,要么就小修。
开发数据分析平台,并非一个简单的整合过程。
「好的工具解决我们眼前的问题,不然我们根本没时间想以后得问题」。