TCGA 作为大规模癌症临床数据收集社区,提供丰富的开源数据以供训练及验证。但其复杂的下载体系总是令人望而却步。以下提供教程
1、启动 TCGA 官网 。

2、TCGA 的数据选择 主要分为 Projects、Cohort Builder、Repository 三个递进选项。根据个人所需选择数据。通常来讲,在Cohort Builder 可以进行比较全面的选择,选择结束后,在Repository内进行最后的数据确定。

3、此处以 TCGA-KRIC (Kidney renal clear cell carcinoma,肾透明细胞癌)病理切片数据 为例。
首先,确定你要使用哪一个数据,在Cohort Builder 进行Project选择。

选择这个数据项目里所关注的数据对象。如果是 病理图像,则选择Diagnostic Slide(福尔马林固定石蜡包埋玻片(FFPE),是金标准)。(如果想使用快速冷冻切片,可选择Tissue Slide)

下载Manifest文件


以上内容为主要数据部分,为了进行数据实验,还需要下载临床信息