最近想将单细胞数据从Seurat转还到H5AD格式,但发现Seurat V5直接转换会报错。这里记录一下解决的方案。 直接转换会报错 Error in assay.group...
最近想将单细胞数据从Seurat转还到H5AD格式,但发现Seurat V5直接转换会报错。这里记录一下解决的方案。 直接转换会报错 Error in assay.group...
常用的细胞通讯软件:CellphoneDB[//www.greatytc.com/p/38a9376f5286]:是公开的人工校正的,储存受体、配体以及两种相互作用...
最近开发了一个R包,enONE(https://github.com/thereallda/enONE[https://github.com/thereallda/enONE...
有可能是前面Normalize问题。
R-Seurat单细胞数据分析流程Seurat standard pipeline[#seurat-standard-pipeline]创建Seurat对象[#%E5%88%9B%E5%BB%BAseurat...
关于非模式物种的基因组相关文件我没有处理过,不是很了解。这里分别提供不同的bed文件是为了分别计算19号和X染色体的信号。
使用deeptools生成ChIP-seq信号热图与谱图整理ChIP-seq / CUT & Tag 分析时用到的工具。本文只对使用的工具用法进行简单介绍。 deeptools 提供了computeMatrix命令以计算特定基因组...
总的来说是需要将raw counts转换成tokenized data。首先是要在loom文件加上一些metadata,这个你可以参考我上一篇关于scanpy的(//www.greatytc.com/p/499048a34fdb)文章总结部分后面写到。接着要用Geneformer提供的tokenizer进行处理
```
# applying fine-tuned model on new datasets
# using the 3k PBMCs dataset
# 1. transform scRNA-seq expression data to rank value .dataset format
from geneformer import TranscriptomeTokenizer
tk = TranscriptomeTokenizer({"cell_type": "cell_type", "organ_major": "organ_major"}, nproc=4)
tk.tokenize_data("D:/jupyterNote/pySC/output/", output_directory="token_data/", output_prefix="tk_pbmc3k")
```
这篇文章里的这一段就是进行tokenize的,`tk.tokenize_data`输入的第一个参数提供的是包含了loom文件的路径。从这里接着下去应该就可以了。
Geneformer | 细胞注释Geneformer 是一个基于30M scRNA-seq data训练的Transformer模型,训练数据包括人类的多种组织器官。Geneformer可以用于细胞水平的分...
@洪晓龄 大家共同学习
R-Seurat单细胞数据分析流程Seurat standard pipeline[#seurat-standard-pipeline]创建Seurat对象[#%E5%88%9B%E5%BB%BAseurat...
大家一起学习😄in_silico_perturbation我机器不知道为啥带不动了,所以就没跑了。但我都是跟着他们官方教程做的(https://huggingface.co/ctheodoris/Geneformer/blob/main/examples/in_silico_perturbation.ipynb),你也可以试着看看。
Geneformer | 基因分类预测Gene Classification 上一篇文章写了用Geneformer如何做细胞分类[https://thereallda.github.io/2023/08/02/g...
Gene Classification 上一篇文章写了用Geneformer如何做细胞分类[https://thereallda.github.io/2023/08/02/g...
Geneformer 是一个基于30M scRNA-seq data训练的Transformer模型,训练数据包括人类的多种组织器官。Geneformer可以用于细胞水平的分...
scanpy | Preprocessing and clustering 3k PBMCs 本文记录使用scanpy处理3k PBMCs scRNA-seq数据的流程。 环...
一、 简述 为了从基因的表达水平中得到更加具体直观的生物学功能变化的信息,多种基于已知的基因集的分析方法应运而生。其中,基因集分析(Gene Set Analysis...
@e98fb4d676c8 是的,这里应该是`deid`。感谢指正,文章已经修改了。
R实战 | TCGA数据挖掘复现--BRCA篇本文写于观看生信技能树公众号(vx: biotrainee)的七步走纯R代码通过数据挖掘复现一篇实验文章(第1到6步)[https://mp.weixin.qq.com/s/...
这个情况我好像没有遇到过。你可以看看”/etc/rstudio/rsession.conf“这个文件是不是有什么可以调整的设置。我的只有以下这些内容:
# R Session Configuration File
# user's package library path
r-libs-user=~/R/packages
# CRAN Repository
r-cran-repos=https://cran.r-project.org/
R | RStudio-server 配置RStudio-server合集R | RStudio-server 安装[//www.greatytc.com/p/fc944bd4e925]R | RStudi...
关于sva包 sva的用户说明:http://www.bioconductor.org/packages/release/bioc/vignettes/sva/inst/do...
本文简单介绍几种重抽样方法 (in R)。 Permutation[#permutation] Bootstrap[#bootstrap] Jackknife[#jackkn...
本文简单记录R包开发的流程 准备 创建R包需要用到 devtools,以及usethis 创建Git repo (可选) 如果需要使用Git管理R包,我们先要在GitHub上...
@efdc8593f87f 解决就好😄主要是看“argument ".f" is missing”,一般是purrr包里的reduce才要`.f`这个参数,IRanges包里的reduce是不用那个参数的。这种就是引用特定包里的函数就可以了。
R-获取基因长度通常,在计算TPM或RPKM/FPKM等基因表达量时,除了基因的counts信息外,我们还需要知道基因的长度。这里所用到的基因长度并不是某个基因在基因组上的完整长度。在基因表...
这有可能是reduce的问题,要用IRanges::reduce。sum(width(IRanges::reduce(exons.list.per.gene))) 试试吧,我跑这段是没问题的。
R-获取基因长度通常,在计算TPM或RPKM/FPKM等基因表达量时,除了基因的counts信息外,我们还需要知道基因的长度。这里所用到的基因长度并不是某个基因在基因组上的完整长度。在基因表...
文章接受,终于有空再发点笔记了😃 SCENIC_Tutorial[#scenic_tutorial]Setup[#setup]Load Packages[#load-pack...