我们合成了一个高复杂性的宽松病毒条形码库,该库编码约60-70万个不同的寡核苷酸RNA序列(StiCR条形码)。STICR条形码包含三个不同的寡核苷酸片段依次克隆的绿色荧光蛋白(EGFP)转基因的3'UTR中的多次隆隆位点,这些转基因控制在无处不在的cag促进剂中,在修饰的烟丝溶液中(psicio,psiciCo,添加量,#11578)。每个条形码片段均来自包含500个不同序列的三个寡核苷酸池之一,允许多达1.25亿个独特的组合条形码序列(5003)。在将每个寡核苷酸片段连接到多隆岩位点之后,将质粒文库电饰成电位的电位MEGAX DH10B细胞(Fisher,#C640003),并在LB琼脂板上在37°C下在37°C下过夜(Fisher,BP1425-500),用Carbrin(Fisher)(Fisher)生长。刮擦所得的菌落,并使用MIDI-PREP试剂盒进行质粒提取(Macherey Nagel,740412.5)。重复此过程,直到添加所有三个条形码片段。
通过首先将HEK293细胞与条形码库以及慢病毒辅助质粒PMDLG/PRRE(Addgene,#12253),PRSV-REV(AddGene,#12253)和Insein protein vsv-gsv-G(Addgene,addgene,protgene,propgene,prs revene,prs revene,prs reve(Addgene),使用lentivirus产生的产生。转染后24小时更换HEK293培养基,并用35 ml超养殖培养基(Lonza BE12-725F)代替350 µl丙酮酸钠(11 mg/ml Stock,Thermo Fisher,11360070),11360070),350 µl butyrate(0.5 m butyrate(0.5 m)(0.5 m stock,0.5 m stock,sigma,sigma,sigma,sigma,b5887)和抗生素/抗菌毛(Thermo,15-240-062)(http://syntheticneurobiology.org/protocols/protocoldetail/31/12)。额外48小时后,收集培养基,用超速离心浓缩,然后重悬于50-100 µL的无菌PBS中。
为了确认可以使用SCRNA-SEQ准确恢复转录的Sticr条形码,我们进行了“ Barnyard实验”,其中我们用不同的STICR文库感染了人类皮质细胞(GW18样品)和小鼠3T3细胞(ATCC)的单独培养物。这些库可以通过每个库独有的恒定序列(“病毒索引”)彼此区分。3天后,我们将培养基与帕帕因和FACS分离的EGFP+细胞解离。然后将来自两个物种的EGFP+细胞混合在一起,并加载到10倍基因组学铬单细胞’3素盒(10x Genomics,PN-100007)中。测序后,将成绩单库与CellRanger(版本3.0.2)对准杂种小鼠/人类基因组,并确定液滴为小鼠细胞,人类细胞或多重组。回收了Sticr条形码(见下文),并使用恢复的病毒指数序列将回收的条形码与最初用于感染每个实验的条形码匹配。最后,我们量化了小鼠,人和多重液滴的恢复病毒指数。
为了测量sticr质粒库条形码多样性,我们首先用XHOI消化了1 µg的1 µg,然后连接一个含有唯一分子标识符(UMI)的PCR适配器。Ligation products were amplified by PCR using Q5 Hot Start High Fidelity 2x Master Mix (NEB, #M0494) using primers targeting the STICR sequencing primer site and the adapter sequence using the following program: (1) 98 °C for 30 s, (2) 98 °C for 10 s, (3) 62 °C for 20 s, (4) 72 °C for 10 s, (5) repeat steps 2–4 15时间,(6)72°C持续2分钟,(7)4°C保持。PCR扩增后,使用Ampure XP珠(Beckman Coulter,#A63881)进行了0.8–0.6倍双面尺寸选择。由此产生的库被对约3000万读的深度进行了测序。使用UMI删除PCR重复读取的自定义脚本提取Sticr条形码序列(有关一般描述,请参见“ SCRNA-SEQ Analysis和STICR条形码分析”中的下文)。由于将库定为饱和非常昂贵,因此我们使用PRESEQ48命令LC_EXTRAP和默认设置来说明唯一的Sticr条形码的总数。与测量的相对条形码丰度一起,我们使用了推断的sticr条形码库大小,使用R(v4.0.1)编程语言对条形码碰撞进行建模。使用基本R函数,我们模拟了从101到106的大小范围的启动细胞种群的标记,并重复每个模拟20,000次。然后,我们量化了每个起始细胞种群大小选择的唯一条形码的平均数量。起始细胞种群大小和存在的独特条形码数量之间的差异表示在人群大小时发生的碰撞数量。
TrackerSeq是一个基于Piggybac Transposon的34库,开发为与10倍单细胞转录组平台兼容。它通过将多个寡核苷酸序列整合到小鼠基因组中来记录单细胞的体内谱系历史。这些单独的谱系条形码都是37 bp长的合成核苷酸,由固定核苷酸桥接的短随机核苷酸组成。该设计导致一个库的理论复杂性约为430万个谱系条形码(168),每个条形码与另一个条形码的不同至少为5 bp。
为了构建库,对PiggyBac供体质粒(Addgene#40973)进行了更改,以包括许多修改。将读取2部分引物序列克隆到EGFP的3'UTR中,以通过10X平台检索。将蔗糖基因克隆到载体中,因此去除克隆过程中未掺入谱系条形码的空质粒被去除。用BSTXI消化以去除蔗糖基因后,将质粒在凝胶上运行,并纯化柱。如前所述49,通过多个Gibson组装反应将纯化的供体质粒中的Read2部分引物序列的下游克隆到纯化的供体质粒中的下游。然后将Gibson组装反应(NEB,#E2611s)合并并用0.025μmMCE膜(Millipore,#VSWP02500)脱水40分钟,最后使用SpeedVac浓缩。将3μl纯化的组件与50μlNeb10-β竞争力的大肠杆菌细胞(NEB,#C3019H)在4°C下孵育30分钟,然后在2.0 kV,200Ω,25 µF(25 µF)(Bio-Rad,gene Pulser Xcell XCELL XCELL XCELL XCELL Electoporation Systems)下进行电穿孔。将电穿孔的大肠杆菌在37°C播放90分钟,然后将其镀入预热的蔗糖/氨苄青霉素板中。8小时后,将菌落从板上刮下,并在氨苄西林的LB培养基中生长至OD = 0.5。使用柱纯化试剂盒(Zymo Pure II质粒Maxiprep套件,#D4202)纯化质粒文库。我们首先通过对库进行测序到约4200万个读取的深度,以测试是否有任何条形码过度代表来评估TrackerSeq条形码库的完整性。使用Bartender50从R2 FastQ文件中提取了大约360万个有效的谱系条形码,其质量得分为30或更高。将一千个条形码从提取的谱系条形码中随机采样,以评估锤距。将类似的提取条形码分组为推定的条形码, 调酒师为每个条形码读取一个UMI,以处理PCR累积累积错误,并将其截留。群集距离设置为3,以便在彼此3 bp之内提取的条形码有可能聚集在一起。总共确定了2×105个条形码簇,这表明条形码库的多样性至少在105范围内。
所有小鼠菌落均根据巴伐利亚政府在Max Planck神经生物学研究所或NYU Grossman医学院的IACUC批准的方案进行维护。使用了瑞士韦伯斯特和C57BL/6野生型雌性,并在天堂后的几天进行了胚胎,E0.5定义为当天的12:00,在一夜之间交配后检测到阴道塞。用异氟烷(手术期间5%诱导,2.5%)对定时怀孕小鼠进行麻醉,并用镇痛性元唑(WDT)治疗。如前所述51,在E10.5 – e14.5处的胚胎小鼠前脑外侧心室中的sticr慢病毒文库注射在子宫手术和注射中。每胚胎中,每个胚胎的Microsyringe泵(Nanoject III可编程纳米仪注射器(100/240V)(100/240V)(#Drum3-000-207))注入约0.5 µL的Sticr库。对于在E10.5注射的胚胎,使用超声反向散射显微镜(UBM)允许进行图像引导的注射。对于TrackerSeq库的子宫内电穿孔,将E12.5胚胎单方面注入700 NL的DNA质粒溶液,由0.5 µg/µl PEF1A-Pbase(PiggyBac-transposase; piggybac-transposase; r. platt fif R. platt)和TrackerSeq Library 0.5 µg/µg/0.-00 µl,lcf buffer and fasterffife,(Sigma),通过微刺泵进入侧心。然后通过将每个头握在铂金镀肽电极之间(直径为5 mm,BTX,#45-0489)之间,将胚胎伸入子宫壁,而5个电脉冲(35 V,1 Hz时50 ms)用方波电器(BTX,ECM 830)进行输送。根据标准的12:12-h浅色树木循环,将孕妇的大坝保存在单个笼子里,并与母亲保持在机构动物设施中,室温为72°F±2°F,湿度为30-70%。
从年龄在产后第5天到第15天(P5 – P15)之间的小鼠幼崽中收集了病毒注射的大脑(补充数据1)。将大脑在冰冷的预浸出的人工脑脊液(ACSF)中解剖,并在Leica VT1200S振动器上分为400 µm冠状切片。然后解剖冠状脑切片,以便收集前脑,从而不包括丘脑,下丘脑,脑干和小脑。另外,从切成薄片的大脑中手动剖析了OBS,杏仁核和纹状体,并分别处理。然后根据制造商的协议,将收集的组织与Miltenyi Biotech神经组织解离试剂盒(P)(P)(P)(P)(#130-092-628)分离。为了隔离和收集病毒感染的细胞,使用SY3200细胞分系程序(软件获奖列表3D版本8.0。)或BD FACSARIA III Cell Sorter(BD FACSDIVA软件,8.0.0.2版)进行流式细胞仪。首先根据EGFP表达在该群体内对细胞悬浮液进行门控。在批量上收集了表达EGFP的细胞,以在10倍基因组铬平台上进行下游加工。
根据以下方案从E13.5和E15.5处的小鼠胚胎(补充数据1)收集神经节em,从野生型瑞士韦伯斯特女性的子宫中除去胚胎,并存储在冰冷的L-15培养基中。从胚胎头骨中除去大脑,并剖析了MGE,CGE和LGE。然后将MGE,CGE和LGE从多个胚胎组合在一起,以便独立处理每种杰出类型,并与Miltenyi Biotech神经组织解离试剂盒(P)(P)(#130-092-628)在Gentlemacs上根据制造商的协议解散。
对于胚胎谱系追踪,我们在E16.5(补充数据1)的Leibowitz培养基中收集了小鼠胚胎的电穿孔大脑,含5%FBS。根据建议的方案(Wortington,#LK003150)进行木瓜蛋白酶解离系统,并使用BD FACSARIA III III细胞分类器(BD FACSDIVA软件,版本8.0.2)进行流式细胞仪,以100-µm µm的喷嘴进行流式细胞仪。对于所有FACS实验,非表达EGFP的脑组织被用作排除背景荧光的阴性对照。
E14.5和P10小鼠用4%PFA灌注,并在4%PFA下在4°C下固定过夜。使用振动的微型组进行冠状切片(60 µm)。进行免疫荧光染色如下:在室温下在阻塞溶液中(5%BSA和0.3%Triton-X100在PBS中)在室温下孵育1小时,然后在4°C下用原代抗体过夜。将切片在PBS 1X中冲洗3次,并在室温下与相应的二级抗体(1:500,Life Technologies)孵育1小时。在使用Hoechst染色溶液(1:10,000,PBS 1X,Invitrogen中的1:10,000)进行标记核之前,将三个用PBS 1倍洗涤,然后用荧光素-G(Invitrogen)在幻灯片上进行干燥。为了进行成像,将主要的体感区域用作研究区域。图像是在Leica SP8共聚焦激光扫描显微镜上获取的。
所使用的主要抗体包括:兔抗Cux1 1:500(Santa Cruz,#sc13024),兔子抗Gaba 1:2,000(默克,#A2052),兔子抗GFP 1:1,000(Invitrogen,Invitrogen,#A11122),#A11122),Rabbit Anti-iba1 1:500(wako,wako,wako,wako,wako,#0191)。1:500(默克,#AB9610),兔子抗S100β1:500(默克,#S2644)和大鼠抗CTIP2 [25B6] 1:500(ABCAM,#ABCAM,#AB18465)。
使用的第二抗体是:647 Alexa Fluor Plus Goat抗兔(Invitrogen,#A32733),555 Alexa Fluor Goat抗鼠(Invitrogen,#A21434)和555 Alexa Fluor Goat Anti-Goat抗rabbit(Invitrogen,Invitrogen,#A211428)。
为了利用10倍基因组学平台的实验,使用了以下试剂:铬单细胞3'库和凝胶珠珠Kit Kit V2(PN-12237),铬单细胞3''CHIP KIT V2(PN-12236)(PN-12236)和Chromium i7多重套件(PN-122262)均使用了Mandudurer的指令,套件V2用户指南;铬单细胞3'图书馆和凝胶珠套件V3(PN-1000075),铬单细胞3'芯片套件V3(PN-1000073)和铬i7多路复用试剂盒(PN-12262),根据制造商在Chromium Single 3'Chromium Single 3'''Reegent v3 unegent v3 unegens kit kit kit kit kit kit kit kit kit kit kit kit kit kit v3 sel kit kit kit(pn-12262)使用;铬单细胞3'库和凝胶珠套件V3.1(PN-1000268),铬单细胞3'芯片盒v3.1(PN-1000127)和双索引套件TT tt集A(PN-1000215)(PN-1000215)根据制造商的指导在铬单元格3''3''ectent''Inecents underec v3.1 Inecers v.1 v.1 v.1 varmium tt seet a(pn-1000215)中使用。
使用10 µL的cDNA作为模板,使用50 µL反应中的Q5热启动高保真2x主混合(#M094S)的标准NEB协议(#M094S)放大了从RNA中获取的谱系条形码库。具体而言,每个PCR都包含:25 µL Q5高效2倍主混合物,2.5 µl 10 µm P7_Indexed反向引物,2.5 µl 10 µM i5_Indexed正向线晶,10 µL分子级H20,10 µL H20,10 µL CDNA(对于启动序列序列和指数和指数和指数,请参见补充数据1)。放大Sticr谱系库的PCR方案是:(1)98°C 30 s,(2)98°C 10 s,(3)62°C持续20 s,(4)72°C,10 s,(5)重复步骤2-4 11-18次2-4 11-18次,(6)72°C,(6)72°C,持续2分钟,(7),和(7)4°°C。用于扩增TrackerSeq谱系库的PCR协议是:(1)98°C 30 s,(2)98°C 10 s,(3)63°C持续20 s,(4)72°C,为10 s,10 s,(5)重复步骤2-4 11-18次2-4 11-18次,(6)72°C,(6)72°C,持续2分钟,(7)4°C,(7)4°°C。使用Beckman Coulter Agencourt rnaclean XP(A63987)将库纯化,并使用双面SPRI选择,并用安捷伦生物分析仪进行量化。一些sticr库(di_t_199,di_t_203,di_t_211,di_t_222,di_t_233,di_t_238,di_t_238,di_t_239,di_t_240构建并测序了两次DI_T_304和DI_T_305),以实现更高的分辨率。
在Max Planck生物化学研究所的下一代测序设施的Illumina NextSeq 500上,在Max Planck Institute的下一代测序设施上对转录组和条形码库进行了测序,位于慕尼黑的Helmholtz中心的Genomics Core设施,或在广泛研究所的Novaseq。有关每个数据集的详细报告,请参见补充数据1。将FASTQ文件中的测序读取与参考转录组(MM10-2.1.0)对齐,并使用10X Genomics Cell Ranger软件(版本3.0.2或5.0.1)折叠成UMI计数。
使用自定义脚本进行Sticr条形码分析。首先,使用bbmap(bbmap-bushnell b。; sourceforge.net/projects/bbmap/)用于删除低质量读取,然后提取包含sticr条形码序列的读取。然后,使用bbmap提取单个sticr条形码片段,然后将其与我们的预定义片段参考集对齐,使用bowtie(v5.2.1)53,允许每个片段最多两次不匹配。将对齐的sticr条形码汇编成一个文件,该文件包含其相应的10X单元格编码和使用尴尬的10x UMI序列。最后,使用UMI-Tools(V.0.5.1)54来删除UMI读取重复的Sticr条形码或细胞条形码读取,允许UMI中的1 bp不匹配。与至少五个不同UMI的sticr条形码– CBC配对保留了克隆分析。在通过这些标准的多个sticr条形码的细胞中,我们试图找到一个“主导”的sticr条形码,我们将其定义为包含大于或等于UMI计数数量的五倍,而不是下一个最丰富的sticr条形码。符合这些标准的主要sticr条形码被认为是其各自细胞的克隆条形码,并保留以进行进一步分析。在元数据文件中,这些CBC – StICR条形码配对被称为第2层,而CBC – -Sincr条形码对只有单个sticr条形码会议阈值标准为1层。仅与单个Strist striie tier the Extier -obiemen -obiemen -obiemen -obiemen -obiment in -obiment in -obiement -Amight -nifegion fornion -obiment in -obiement-数据图8,其中使用了第2层。最后,我们在Sticr条形码上应用了一个额外的UMI阈值,要求所有用于克隆分析的StiCR条形码– CBC配对至少具有9个不同的UMIS。Three STICR barcodes (Index1_Bit1_F_083-Bit2_F_060-Bit3_F_055,_Bit1_F_057-Bit2_F_103-Bit3_F_244 and IndexE_Bit1_F_246-Bit2_F_178-Bit3_F_497) were removed from downstream analyses, 因为它们存在于多个数据集中。总共21个Sticr数据集(CA199和CA233)中的两个仅包含单细胞克隆。保留这些数据集以支持单细胞群集分析和克隆大小定量。
R2 FASTQ文件中的读取已预处理,以便修剪谱系条形码(BC)的左右序列。丢弃了比37 bp的谱系条形码。从数据集的相应Seurat对象中提取细胞条形码(单元格),以生成细胞条形码白色。将提取的小区条形码和UMIS添加到谱系条形码FASTQ文件的读取名称中。处理所得的FASTQ文件以输出CSV格式的稀疏矩阵,其中行是通过单个细胞条形码鉴定的单元格,列是谱系条形码。仅考虑至少有10次读取和至少6个UMI的细胞– BC对支持的细胞-UMI – BC三元组,以进行进一步分析。通过使用JACCARD相似性和平均链接聚类,将克隆人分配给细胞条形码24。将所得的树状图切在0.999的高度上以获得克隆分组。克隆分组表明,在总数据集中有4,282个条形码分布在2370个单元格上,其中56.0%的标记为2个或更多的条形码集成,其中8.4%的标记为总数据集中的5个或更多集成。在图3中介绍的抑制性神经元中,这些数字分别为85.7%和9.5%。
Seurat工作流(版本3.1.4)用于SCRNA-SEQ数据集中的单元格过滤,数据归一化和集群识别。将数据读为R(版本3.6.0)作为计数矩阵。每个数据集用截止值进行过滤:最大和最小基因表达,最大NCOUNT_RNA以及与线粒体基因组对齐的总读数百分比(有关应用的截止值,请参见补充数据1)。然后将过滤的数据用于使用Seurat的标准处理。除非另有说明,否则将每个细胞的基因表达值除以转录本的总数,并乘以10,000。然后通过归一化函数使用log1p对这些值进行对数转换。使用Scaledata()函数对基因进行缩放并集中。我们在Seurat工作流程中使用Harmony(V1.0)28,其中默认参数(Theta = 2,Lambda = 1,Sigma = 0.1)整合了不同的Sticr数据集。我们使用了前35个Harmony Embeddings进行UMAP(https://github.com/lmcinnes/umap)和聚类分析。
要将单元格分为簇,我们通过FindNeighbors()函数构建了一个基于和谐嵌入的共享近邻域图,以用作SLM算法的输入,该函数通过Seurat中的FindClusers()函数实现(dimensions = 35,res = 1)。通过将每个簇的细胞与来自所有其他簇的细胞进行比较来鉴定簇特异性标记基因。基因根据折叠变化,最小表达和调整后的P值截断(补充数据3)考虑差异表达。Wilcoxon秩和测试是通过Seurat函数FindAllmarkers()实现的。
根据标记基因表达,空间转录组映射以及公开可用的数据库手动注释簇,主要是Dropviz(Dropviz.org)55和Mouse Brain Atlas(http://mousebrain.org/genesearch.htmlas)eartlas。在41个无监督的sticr簇中,将9个集群重新聚集以获得更高的细节(例如,群集7分为7a和7b;图3A)。更具体地说,使用子集()分离簇,并使用FindClusters()再次聚类。无法分配给细胞类型的子群体被分配为“未知”,并将其排除在谱系分析中(占总细胞的0.76%)。22集群包含不同类别的子群体,被标记为“混合”。除了说明空间分析的面板外,所有分析均根据精制簇进行。
为了量化细胞类别之间的克隆关系,基于多个标记基因的共表达(神经元(TUBB3和MEF2C);神经元前体(GAD1和NEUROD2),将Seurat簇合并为细胞类别(图1D);(olig1和plp1);克隆被归类为仅包含胶质细胞(星形胶质细胞,OPC和少突胶质细胞类),仅神经元,或神经胶质和神经元混合物(神经元,星形胶质细胞,OPC和少突胶质细胞类),以及这些三个类别的克隆数量相对于每个clones的总数量化。
根据Wagner和同事24概述的方法,计算了每对单元状态的共享克隆的数量以及谱系耦合z得分和相关性:如下:
代表转录组关系的树状图与Seurat中的BuildClusterTree()函数生成,该函数构建了一个从每个身份群集中的“平均”细胞的系统发育树。基于基因表达空间中构建的距离矩阵估算树。使用平均链接聚类和欧几里得距离度量标准的HCLUST()和DIST()函数生成代表谱系关系的树状图。细胞类型之间的相互关系只能在分层树状图中粗略表示。树状图代表了总体转录组相似性和差异性,但它们无法捕获其他不同细胞类型之间的明显相似性。同样,树状图可能代表克隆关系的一般联系,但忽略了很少的关系。
使用ISTRISTR Library57在R中创建了不适的阴谋。对于设定的大小,我们使用了每个群集的单元格数。
如上所述,对Amygdala,OB和Striatum数据集进行了预处理。手动注释细胞类型,并通过子集()分配神经元类型。使用基于Spearman相关的距离度量()函数中的基于Spearman相关的距离度量,并使用R f textoextra v1.0.7的fviz_dist()可视化,并使用基于Spearman相关的距离度量计算对数差异的平均簇基因表达之间的距离。
Seurat管道(版本3.1.4)用于在SCRNA-SEQ数据集中进行集群识别。胚胎转录组数据集(MUC28072,CA303,CA300,CA302,CA299,CA301和CA298)被读取为R(版本3.6.0)作为计数矩阵。每个数据集用截止值进行过滤:最大或最小基因表达,最大NCOUNT_RNA以及与线粒体基因组对齐的总读数百分比(有关应用的截止值,请参见补充数据1)。此外,用DoubleTfinder版本2.0.3(参考文献58)过滤胚胎数据集。
我们使用正规化的负二项式回归59来使所有胚胎数据集的UMI计数数据归一化。除去了神经轨道2> 2和NeuroD6> 2的UMI计数的细胞,它们是兴奋性神经元的标记。使用SEURAT标准程序聚集了TrackerSeq数据集,并去除表达兴奋性神经元标记基因的簇。我们创建了一个“集成”数据分析,包括所有胚胎数据集,用于下游分析,如Stuart和同事60所述。通过共享的基于共享的邻居模块化优化算法鉴定细胞簇。将均匀的歧管近似值和投影(UMAP)维数(https://github.com/lmcinnes/umap)应用于可视化的集成数据测定。
使用MonoCle3进行轨迹推理和伪次计算(Ref.35)。使用R库Velocyto.R36估算RNA速度。使用Velocyto,版本0.17.17(https://velocyto.org)使用命令velocyto run10x预处理10x输出文件。Velocyto.r包装“ Velocyto.r” 0.6版用于RNA速度估计。
To map cells from embryonic trajectories to postnatal cell types, we first selected the five embryonic Seurat clusters from the ‘integrated’ data assay that were located at the tip of the Monocle trajectories, as well as Seurat clusters from the postnatal STICR dataset that were identified and annotated as subpallial GABAergic neuron types.我们专注于1,855个基因,这些基因在两个发育阶段都使用seurat findVariableFeatures()函数确定为可变特征。对于这些基因,我们将产后簇中的对数差异表达平均以创建产后细胞类型模型向量。然后,我们计算了胚胎簇的所有单个细胞与Mayer等人1所述的模型向量之间的Pearson相关性。我们将每个细胞分配给具有最高相关性的产后群集,但还计算了经验P值,以通过在随机背景中置换单细胞数据来确定分配的重要性。我们使模型向量保持不变,但将单细胞表达数据置于100次。对于每个置换和每个单元,我们通过计算群集分配的最大Pearson相关性与模型向量的最大相关性,并计算了群集分配的P值,该相关分数比用于群集分配的相关得分大。在最后一步中,我们将所有P值变成了错误的发现率(FDR),并仅将FDR <0.1的单元映射到产后簇。
为了推断簇的空间位置,将Sticr数据集与visious空间转录组数据集集成在一起,以用于10x基因组学提供的小鼠脑的矢状和冠状段(https://support.10xgenomics.com/spatial-gene-gene-eppression/datasets)。我们在Seurat V3中应用了基于“锚”的集成工作流,该工作流可以使注释从参考查询集进行概率转移。使用sctransform()函数对空间参考数据集和谱系数据集进行了归一化,该函数构建了基因表达的正则负二项式模型,并使用RunPCA()函数进行了尺寸降低,然后使用函数FindTransFeranchors()和TranscerData()和TranscerData()()进行了标签传输。对于每个空间位置,该过程输出了每个SCRNA-Seq衍生的细胞状态的概率分类。我们在Seurat对象中添加了这些预测作为新测定,以使用函数quadialFeaturePlot()可视化。
使用seurat函数Findmarkers()计算了前100个标记基因,以分别在产后sticr数据集中选择GABA能簇和合并后的胚胎数据集(后产后:“ 2:2抑制性神经元ob Meis2”,'6抑制神经元ob synpr','7 d1 d2 d2 d2 d2 d2 d2 d2 d2 d2ITC Amygdala,“ 34抑制性PN腹纹状体/中央延伸杏仁核(EAC)”;“ I_EBF1/ISL1”,“ I_PHLDA1/ISL1”,“ I_NR2F2”,“ I_NXPH1”)。根据胚胎细胞基于相关的映射到产后簇(请参阅上一段),我们选择了散射图的胚胎和成人簇对。我们绘制了从每个阶段的前100个标记基因的SCT标准化平均簇基因表达。
有关研究设计的更多信息可在与本文有关的自然研究报告摘要中获得。

