0
点赞
收藏
分享

微信扫一扫

单细胞论文记录(part11)--ClusterMap for multi-scale clustering analysis of spatial gene expression

学习笔记,仅供参考,有错必纠

阅读状态:略读
Journal:Nature Communications
Year:2021
Authors:He Yichun,Tang Xin

ClusterMap for multi-scale clustering analysis of spatial gene expression

abstract

在空间背景下量化RNA是了解复杂组织中基因表达和调节的关键. In situ transcriptomic methods在完整的组织中产生空间分辨率的RNA谱. 然而,目前还缺乏一个统一的计算框架来综合分析in situ transcriptomic data. 在这里,我们引入了一个无监督框架,称为ClusterMap,它结合了RNA的physical location 和 gene identity of RNAs,将任务制定为一个point模式分析问题,并通过密度峰聚类(DPC)识别有生物学意义的结构. 具体来说,ClusterMap在二维和三维空间中将RNA精确地聚类到亚细胞结构、细胞体和组织区域,并在不同的组织类型中表现稳定,包括小鼠大脑、胎盘、肠道和人类心脏器官. 我们证明ClusterMap广泛适用于各种in situ transcriptomic measurements,从具有高维转录组图谱的图像中发现gene expression patterns, cell niche, 和 tissue organization principles.

Introduction

组织功能产生于多种细胞类型的协调互动,而这种互动是由三维(3D)空间中不同的基因表达形成的. 为了描绘细胞和组织中基因表达的空间异质性,人们开发了大量image-based的in situ transcriptomics methods(如STARmap、FISSEQ、ISS、MERFISH、seqFISH、osmFISH等),提供完整组织中亚细胞RNA定位的图谱. 然而,从高维空间转录组数据中直接提取生物模式的低维表示是具有挑战性的.

一个主要的挑战是实现accurate and automatic cell segmentation,将RNA准确地分配到单个细胞中进行单细胞分析. 最常见的细胞分割策略是通过荧光染色(如DAPI、Nissl、WGA等)标记细胞核或细胞体,然后通过传统或基于机器学习(ML)的方法分割连续的荧光信号. 然而,传统的方法,如distance-transformed watershed,需要人工整理以达到最佳但仍不令人满意的分割结果. 另一方面,虽然基于ML的方法可以自动检测荧光染色中的目标(cell),但它们仍然需要手动注释的数据集来进行模型训练,并且对其他数据集的概括能力较差.

为了应对这些挑战,需要一种根本不同的方法,绕过辅助细胞染色、超参数调整和人工标记. 在这里,我们没有使用荧光染色,而是直接利用了空间分辨率的RNA的模式,这些模式内在地编码了高维基因表达信息,用于亚细胞和细胞分割,然后进行细胞类型的空间映射. 为了利用RNA定义的细胞类型的空间异质性,我们应用同样的策略将离散的细胞聚集到组织区域. 我们共同证明了这个计算框架(ClusterMap)可以识别subcellular structures, cells 和 tissue regions (Fig. 1).

单细胞论文记录(part11)--ClusterMap for multi-scale clustering analysis of spatial gene expression_聚类

单细胞论文记录(part11)--ClusterMap for multi-scale clustering analysis of spatial gene expression_数据集_02


举报

相关推荐

0 条评论