生信入门-单细胞分析 A-6:参考名词索引

#生信 #细胞 #单细胞分析 #预处理 #文库 #测序 #数据库 #数据分析 #索引 #参考

一、安装与开发环境

  • RandRstudio. zip:R 和 RStudio 的安装包。R 是编程语言,RStudio 是集成开发环境(IDE),用于进行数据分析和可视化。
  • Rpackage. zip:包含多个 R 软件包。其中一些常用的包用于单细胞 RNA 测序分析,例如 Seurat、Scater 和 SingleCellExperiment。

二、数据集

  • TCGA. zip:癌症基因组图谱(The Cancer Genome Atlas)的数据集,提供了广泛的癌症相关数据,包括基因表达、突变和临床数据。
  • Clinical. zip:临床数据文件,包含患者的临床特征信息,如年龄、性别、病程等。
  • MicroRNA. zip:微小 RNA(microRNA)数据,用于研究基因调控网络。
  • GEO. zip:基因表达综合数据库(Gene Expression Omnibus)的数据,包含来自各种生物学实验的高通量基因表达数据集。
  • ICGC:国际癌症基因组联盟数据集,提供癌症相关基因组数据。
  • GTEX:Genotype-Tissue Expression 项目的数据,提供正常人类组织的基因表达信息。

三、数据整合与预处理

  • Merge. zip:整合不同数据源的工具或脚本,确保多种数据类型可以结合使用。
  • three:可能表示三个数据集或三个步骤。

四、差异表达分析

  • DEG. zip:差异表达基因(Differentially Expressed Genes)分析工具,用于识别在不同条件下显著表达差异的基因。
  • GEO_DEG:基于 GEO 数据进行差异表达基因分析。
  • diff:差异基因表达分析。
  • pairDEG. zip:成对比较差异表达基因分析工具,用于两个条件下的基因表达差异分析。
  • pandiff:差异分析工具,可能用于多种组间差异识别。

五、生存分析

  • uniCox. zip:单变量 Cox 回归分析包,用于评估单个变量对生存概率的影响。
  • multiCox:多变量 Cox 回归分析,评估多个变量对生存的联合影响。
  • survival:生存分析工具或 R 包,如 survival,用于分析生存数据。
  • Survivalanalysis. zip:生存分析工具包,用于分析基因表达或其他变量对生存率的影响。
  • cox:Cox 回归分析功能或工具,用于生存分析。

六、功能与通路分析

  • GOKEGG. zip:用于 GO(基因本体)和 KEGG(京都基因和基因组百科全书)通路分析,帮助解释基因功能和生物路径。
  • GSEA. zip:基因集富集分析(Gene Set Enrichment Analysis),用于确定预定义基因集在两种生物状态中的显著差异。
  • ssGSEAGSVA. zip:单样品基因集变异分析(ssGSEA 和 GSVA),用于计算单个样本中的通路活性评分。
  • ssGSEA:单样品基因集富集分析,用于计算单样本内的基因集富集。

七、网络与相互作用

  • PPI. zip:蛋白质-蛋白质相互作用(Protein-Protein Interaction)的数据和分析工具,用于绘制和分析蛋白质相互作用网络。
  • WGCNA:加权基因共表达网络分析,用于识别基因模块和其相关性。

八、机器学习与模型构建

  • LASSO. zip:套索回归(Lasso Regression),用于特征选择和模型构建。
  • RF:随机森林(Random Forest),一种机器学习算法,用于特征选择和分类。
  • SVM:支持向量机(Support Vector Machine),一种用于分类和回归的机器学习算法。

九、聚类与分类

  • ConsensusClusterPlus:共识聚类工具,用于确定样本的最佳聚类数和聚类效果。
  • ROC:接受者工作特性曲线(Receiver Operating Characteristic),用于评估分类模型的性能。

十、可视化工具

  • Veen:维恩图(Venn),用于展示集合间的交集和差异。
  • Nomogram:列线图,用于生存预测模型,提供个体化的预后预测。
  • Heatmap:热图,用于展示基因表达或其他数据的可视化。
  • Boxplot:箱线图,用于展示数据分布和差异。
  • Plot:绘图工具或命令,用于生成各种图表。
  • PCA:主成分分析,用于数据降维和可视化高维数据。

十一、免疫与治疗分析

  • HPA:人类蛋白质图谱(Human Protein Atlas),提供人类蛋白质的表达和分布信息。
  • CIBERSORT:计算方法,用于估计基于 RNA-Seq 数据的细胞组成比例。
  • Immune:免疫数据或分析工具,用于研究免疫细胞浸润和免疫反应。
  • TIDE:肿瘤免疫功能障碍和排斥分析,用于评估免疫治疗的潜在疗效。
  • IPS1,IPS2:可能是免疫原性评分,用于评估肿瘤免疫原性。

十二、突变与表观遗传

  • mutation:突变数据或分析工具,用于研究基因突变及其功能影响。
  • CNV. frequency:拷贝数变异(Copy Number Variation)频率分析。
  • methylation:甲基化数据或分析工具,用于研究基因甲基化状态。

十三、预测工具

  • oncoPredict:用于预测肿瘤治疗反应的工具。
  • pRRophetic:用于预测患者对化疗药物敏感性的工具。
  • estimate:用于估计肿瘤样本中的肿瘤纯度和细胞组成。

十四、其他分析

  • cor:相关性分析。
  • Location:空间定位数据或工具,用于单细胞空间转录组学分析。