泛癌异常戏剧分析(PAPAA)免费

jsaifc 167 2021-08-27 医疗图像

资源介绍

有关数据集文件的信息:

1) pancan_rnaseq_freeze.tsv.gz:TCGA Pan-cancer 数据集的公开基因表达数据。文件:PanCanAtlas EBPlusPlusAdjustPANCAN_IlluminaHiSeq_RNASeqV2.geneExp.tsv 由 Gregory Way 等人使用脚本 process_sample_freeze.py 处理,如 https://github.com/greenelab/pancancer/ 数据处理和初始化步骤中所述。[http://api.gdc.cancer.gov/data/3586c0da-64d0-4b74-a449-5ff4d9136611] [ https://doi.org/10.1016/j.celrep.2018.03.046 ]

2) pancan_mutation_freeze.tsv.gz:TCGA泛癌数据集的公开突变信息。文件:mc3.v0.2.8.PUBLIC.maf.gz 由 Gregory Way 等人使用脚本 process_sample_freeze.py 处理,如 https://github.com/greenelab/pancancer/ 数据处理和初始化步骤中所述。[http://api.gdc.cancer.gov/data/1c8cfe5f-e52d-41ba-94da-f15ea1337efc] [https://doi.org/10.1016/j.celrep.2018.03.046] 

3) pancan_GISTIC_threshold.tsv.gz:TCGA泛癌数据集的公开基因级拷贝数信息。该文件由 Gregory Way 等人使用脚本 process_copynumber.py 处理,如 https://github.com/greenelab/pancancer/ 数据处理和初始化步骤中所述。根据这些数据生成的文件 copy_number_loss_status.tsv.gz 和 copy_number_gain_status.tsv.gz 用作我们 Galaxy 管道的输入。[https://xenabrowser.net/datapages/?cohort=TCGA%20Pan-Cancer%20(PANCAN)&removeHub=https%3A%2F%2Fxena.treehouse.gi.ucsc.edu%3A443] [ https://doi .org/10.1016/j.celrep.2018.03.046 ]

4)mutation_burden_freeze.tsv.gz:TCGA泛癌数据集mc3.v0.2.8.PUBLIC.maf.gz的公开突变信息由Gregory Way等人使用脚本process_sample_freeze.py处理,如https://github中所述。 com/greenelab/pancancer/ 数据处理和初始化步骤。[https://github.com/greenelab/pancancer/][http://api.gdc.cancer.gov/data/1c8cfe5f-e52d-41ba-94da-f15ea1337efc] [https://doi.org/10.1016/ j.celrep.2018.03.046]

5) sample_freeze.tsv 或 sample_freeze_version4_modify.tsv:该文件列出了由 TCGA PanCancer Atlas 联盟确定的冷冻样本以及原始 RNAseq 和突变数据。这些先前已确定并包含在所有下游分析中 所有其他数据集均根据冷冻样本进行处理和子集。[https://github.com/greenelab/pancancer/]

6) cosmic_cancer_classification.tsv:用于分析的OG和TSG纲要。将宇宙数据库中的其他基因添加到 volgelstein_cancer_classification.tsv [https://github.com/greenelab/pancancer/]

7) CCLE_DepMap_18Q1_maf_20180207.txt.gz 来自 Broad Institute Cancer Cell Line Encyclopedia (CCLE) / DepMap Portal 的 CCLE 细胞系的公开突变数据。[https://depmap.org/portal/download/api/download/external?file_name=ccle%2FCCLE_DepMap_18Q1_maf_20180207.txt]

8) ccle_rnaseq_genes_rpkm_20180929_mod.tsv.gz:来自 Broad Institute Cancer Cell Line Encyclopedia (CCLE) / DepMap Portal 的 1019 个细胞系 (RPKM) 的公开表达数据。[https://depmap.org/portal/download/api/download/external?file_name=ccle%2Fccle_2019%2FCCLE_RNAseq_genes_rpkm_20180929.gct.gz]

9) CCLE_MUT_CNA_AMP_DEL_binary_Revealer.tsv:公开可用的合并突变和拷贝数改变,包括 CCLE 细胞系的基因扩增和缺失。该数据以二进制格式表示,并由 Broad Institute Cancer Cell Line Encyclopedia (CCLE) / DepMap Portal 提供。[https://data.broadinstitute.org/ccle_legacy_data/binary_calls_for_copy_number_and_mutation_data/CCLE_MUT_CNA_AMP_DEL_binary_Revealer.gct]

10) GDSC_cell_lines_EXP_CCLE_names.tsv.gz 癌症药物敏感性基因组学 (GDSC) 细胞系的公开 RMA 标准化表达数据。文件 gdsc_cell_line_RMA_proc_basalExp.csv 已下载。该数据被细分为 CCLE 和 GDSC 中常见的 389 个细胞系。所有 GDSC 细胞系名称都替换为 CCLE 细胞系名称以进行进一步处理。[https://www.cancerrxgene.org/gdsc1000/GDSC1000_WebResources//Data/preprocessed/Cell_line_RMA_proc_basalExp.txt.zip]

11) GDSC_CCLE_common_mut_cnv_binary.tsv.gz:合并的突变和拷贝数改变的子集,包括 GDSC 和 CCLE 之间常见细胞系的基因扩增和缺失。该文件是使用 CCLE_MUT_CNA_AMP_DEL_binary_Revealer.tsv 和常见细胞系列表生成的。 

12) gdsc1_ccle_pharm_fitted_dose_data.txt.gz:GDSC1 细胞系的药理学数据。[ftp://ftp.sanger.ac.uk/pub/project/cancerrxgene/releases/current_release/GDSC1_fitted_dose_response_15Oct19.xlsx]

13) gdsc2_ccle_pharm_fitted_dose_data.txt.gz:GDSC2 细胞系的药理学数据。[ftp://ftp.sanger.ac.uk/pub/project/cancerrxgene/releases/current_release/GDSC2_fitted_dose_response_15Oct19.xlsx]

14)化合物_of_interest.txt:为我们的分析测试的药理化合物列表,取自ftp://ftp.sanger.ac.uk/pub4/cancerrxgene/releases/release-8.1/screened_compounds_rel_8.1.csv。  

15) tcga_dictonary.tsv:分析中使用的癌症类型列表。 

16) seg_based_scores.tsv:总拷贝数负担的测量,拷贝数改变改变的基因组百分比。该文件被 Gregory Way 等人用作 Pancancer 分析的一部分,如 https://github.com/greenelab/pancancer/ 数据处理和初始化步骤中所述。[https://github.com/greenelab/pancancer/]

17) GSE69822_pi3k_sign.txt:在给定的外部样本中为肿瘤 [1] 或正常 [-1] 分配值的文件 (GSE69822)

18) vlog_trans.csv:给定外部样本中变体稳定的对数转换表达值 (GSE69822)

19) path_rtk_ras_pi3k_genes.txt:包含分析中使用的 ERK/RAS/PI3K 通路基因列表的文件。 

20) path_myc_genes.txt:包含分析中使用的 Myc 通路基因列表的文件。(桑切斯-维加、弗朗西斯科等人)

21) path_ras_genes.txt:包含分析中使用的 RAS 通路基因列表的文件。(桑切斯-维加、弗朗西斯科等人)

22) path_cell_cycle_genes.txt:包含分析中使用的细胞周期通路基因列表的文件。(桑切斯-维加、弗朗西斯科等人)

23) path_wnt_genes.txt:包含分析中使用的 WNT 通路基因列表的文件。(桑切斯-维加、弗朗西斯科等人)

24) GSE94937_rpkm_kras.csv:给定外部样本中的表达值 (GSE94937)

25) GSE94937_kras_sign.txt:在给定的外部样本中为 KRAS 突变体 [1] 或 WT [-1] 分配值的文件 (GSE94937)

END
下一篇

发表评论