生信入门-单细胞分析 A-6:参考名词索引
#生信 #细胞 #单细胞分析 #预处理 #文库 #测序 #数据库 #数据分析 #索引 #参考
一、安装与开发环境
- RandRstudio. zip:R 和 RStudio 的安装包。R 是编程语言,RStudio 是集成开发环境(IDE),用于进行数据分析和可视化。
- Rpackage. zip:包含多个 R 软件包。其中一些常用的包用于单细胞 RNA 测序分析,例如 Seurat、Scater 和 SingleCellExperiment。
二、数据集
- TCGA. zip:癌症基因组图谱(The Cancer Genome Atlas)的数据集,提供了广泛的癌症相关数据,包括基因表达、突变和临床数据。
- Clinical. zip:临床数据文件,包含患者的临床特征信息,如年龄、性别、病程等。
- MicroRNA. zip:微小 RNA(microRNA)数据,用于研究基因调控网络。
- GEO. zip:基因表达综合数据库(Gene Expression Omnibus)的数据,包含来自各种生物学实验的高通量基因表达数据集。
- ICGC:国际癌症基因组联盟数据集,提供癌症相关基因组数据。
- GTEX:Genotype-Tissue Expression 项目的数据,提供正常人类组织的基因表达信息。
三、数据整合与预处理
- Merge. zip:整合不同数据源的工具或脚本,确保多种数据类型可以结合使用。
- three:可能表示三个数据集或三个步骤。
四、差异表达分析
- DEG. zip:差异表达基因(Differentially Expressed Genes)分析工具,用于识别在不同条件下显著表达差异的基因。
- GEO_DEG:基于 GEO 数据进行差异表达基因分析。
- diff:差异基因表达分析。
- pairDEG. zip:成对比较差异表达基因分析工具,用于两个条件下的基因表达差异分析。
- pandiff:差异分析工具,可能用于多种组间差异识别。
五、生存分析
- uniCox. zip:单变量 Cox 回归分析包,用于评估单个变量对生存概率的影响。
- multiCox:多变量 Cox 回归分析,评估多个变量对生存的联合影响。
- survival:生存分析工具或 R 包,如 survival,用于分析生存数据。
- Survivalanalysis. zip:生存分析工具包,用于分析基因表达或其他变量对生存率的影响。
- cox:Cox 回归分析功能或工具,用于生存分析。
六、功能与通路分析
- GOKEGG. zip:用于 GO(基因本体)和 KEGG(京都基因和基因组百科全书)通路分析,帮助解释基因功能和生物路径。
- GSEA. zip:基因集富集分析(Gene Set Enrichment Analysis),用于确定预定义基因集在两种生物状态中的显著差异。
- ssGSEAGSVA. zip:单样品基因集变异分析(ssGSEA 和 GSVA),用于计算单个样本中的通路活性评分。
- ssGSEA:单样品基因集富集分析,用于计算单样本内的基因集富集。
七、网络与相互作用
- PPI. zip:蛋白质-蛋白质相互作用(Protein-Protein Interaction)的数据和分析工具,用于绘制和分析蛋白质相互作用网络。
- WGCNA:加权基因共表达网络分析,用于识别基因模块和其相关性。
八、机器学习与模型构建
- LASSO. zip:套索回归(Lasso Regression),用于特征选择和模型构建。
- RF:随机森林(Random Forest),一种机器学习算法,用于特征选择和分类。
- SVM:支持向量机(Support Vector Machine),一种用于分类和回归的机器学习算法。
九、聚类与分类
- ConsensusClusterPlus:共识聚类工具,用于确定样本的最佳聚类数和聚类效果。
- ROC:接受者工作特性曲线(Receiver Operating Characteristic),用于评估分类模型的性能。
十、可视化工具
- Veen:维恩图(Venn),用于展示集合间的交集和差异。
- Nomogram:列线图,用于生存预测模型,提供个体化的预后预测。
- Heatmap:热图,用于展示基因表达或其他数据的可视化。
- Boxplot:箱线图,用于展示数据分布和差异。
- Plot:绘图工具或命令,用于生成各种图表。
- PCA:主成分分析,用于数据降维和可视化高维数据。
十一、免疫与治疗分析
- HPA:人类蛋白质图谱(Human Protein Atlas),提供人类蛋白质的表达和分布信息。
- CIBERSORT:计算方法,用于估计基于 RNA-Seq 数据的细胞组成比例。
- Immune:免疫数据或分析工具,用于研究免疫细胞浸润和免疫反应。
- TIDE:肿瘤免疫功能障碍和排斥分析,用于评估免疫治疗的潜在疗效。
- IPS1,IPS2:可能是免疫原性评分,用于评估肿瘤免疫原性。
十二、突变与表观遗传
- mutation:突变数据或分析工具,用于研究基因突变及其功能影响。
- CNV. frequency:拷贝数变异(Copy Number Variation)频率分析。
- methylation:甲基化数据或分析工具,用于研究基因甲基化状态。
十三、预测工具
- oncoPredict:用于预测肿瘤治疗反应的工具。
- pRRophetic:用于预测患者对化疗药物敏感性的工具。
- estimate:用于估计肿瘤样本中的肿瘤纯度和细胞组成。
十四、其他分析
- cor:相关性分析。
- Location:空间定位数据或工具,用于单细胞空间转录组学分析。