农民田地的谷物和土壤采样于2017年11月至12月(对于阿姆哈拉地区的大部分地区)和2018年11月至2019年1月(Amhara,Oromia and Tigray地区),以及2018年4月至6月在马拉维。这项工作包括在农民的知情同意书中对农民田地和谷物商店的谷物和土壤取样。这项工作是在诺丁汉大学,社会学与社会政策研究伦理委员会(REC)的道德批准下进行的;Bio-1718-0004和Bio-1819-001分别用于埃塞俄比亚和马拉维。这些REC批准得到了亚的斯亚贝巴大学(埃塞俄比亚)和莉隆威农业与自然资源大学(马拉维)的研究董事的正式认可,他们还审查了研究方案。
这项研究的目的是支持谷物Ca,Fe,Se和Zn浓度的谷物作物的空间图。我们在目标样品框架上寻求合理的空间覆盖范围,并使用“主站点”和“近对”采样来支持空间线性混合模型(LMM)22,43的参数的估计。
在埃塞俄比亚(Amhara,Oromia和Tigray区域),目标样品框架被限制在基于在250米网格上产生的预测,该地点占作物产量≥0.9的位置。这些预测来自对高分辨率卫星图像的解释,并通过训练有素的观察者以及应用于从遥感数据和数字高程模型中得出的多个协变量的机器学习方法44,45。将样品框架进一步限制为仅包括从已知道路2.5公里以内的250米网格中的那些位置。在250米网格上指示节点的地图(与农业土地使用网格相同的原点)已准备好了。这些约束可能会将可能的偏差引入到设计样品框架之外的位置的预测中,但是,否则就无法在可用时间访问所有示例位置。有关道路分布的信息是从OpenStreetMap(www.openstreetmap.org)中获取的。在埃塞俄比亚约110万公里的土地总面积中,耕地总面罩代表354,325 km2,其中220,467 km2在已知道路的2.5公里以内。在马拉维,农田地区是由欧洲航天局气候变化倡议确定的46。所使用的农业区域被定义为包括所有在描述中包括“农田”类别的栅格细胞。在马拉维,通往裁剪地区的道路通常比埃塞俄比亚更好的地方,在样本位置对道路距离没有限制。图1显示了绘图的农田区域。
在埃塞俄比亚,总共选择了1,825个主要样本位置作为先验的样本位置,在采样框架内,每个250 m网格节点分配了相等的先验纳入概率。这是使用R Platform 47,48的平衡采样库中的LCUBE函数完成的。LCUBE函数实现了立方体方法,以根据指定的包含概率进行随机取样,同时旨在平衡和相对于指定的协变量49。在这里,在样品框架中选择了纳入概率,并选择样品位置以进行空间平衡,这需要样品位置的平均坐标接近样品框架中所有点的平均坐标和空间扩散,从而确保观察值分散而不是与空间协调相关。选择了其中175个位置的子集作为近对地点,在该站点附近,以支持空间LMM43参数的估计。
在马拉维,使用另一种抽样方法来实现总计1,710个主站点的良好空间覆盖范围。其中包括2015/16 Malawi24,51的人口统计和健康调查中的820个固定样本。R Platform52中SPCOSA库中的分层函数将采样域分配为以固定点和剩余的多边形质心为中心的Delaunay多边形,以将域分配给大约相等的区域区域。选择多边形的质心作为样品点。除820个固定功能外,还发现了另外的890个样品点。一旦获得这些,如埃塞俄比亚,在附近的附近样品中,在随机的近对上选择了另外190个位置。
通过接受标准程序和风险评估的培训的团队进行了抽样。每个团队计划每天参观五个主站点。主站点位置被加载到计算机平板电脑上,并为每个团队打印在纸图上。团队将使用手持GPS设备在最后几公里处导航到目标位置。在每个样本位置,团队将在1公里半径内具有成熟的谷物作物的最接近田间,并遵守农民同意。如果没有明显的谷物作物的田地,也就是说,已经收集了农作物,或者已经种植了非谷物作物,则该团队将要求农民确定最近收获和储存谷物的谷物的领域,并从中获得样品。如果不可能采样,那么团队要么超出1公里半径的替代位置,要么放弃位置。在指定的近对位置,理想情况下,在主站点位置的500 m(范围为100-1,000 m)内确定了第二个田地。如果找不到近对位置,则将在尚未专用于近对样本的下一个样本位置选择近对位置。
在选定的磁场中,从100 m2(0.01 ha)圆图中取样。除非由于疾病或作物损害,否则该区域的焦点与田间的实际相关。找到了五个子样本点(扩展数据图1)。第一点是情节的中心。然后,在沿裁剪行的地块中心的一条线上选择了两个子样本点,然后在第一个线正交的线上通过图中心选择了两个子样本点。在可能的情况下,将中央采样位置固定在作物行之间,样品阵列的长轴(在5.64和4.89 m处的样品位置)朝着作物行的方向定向,短轴垂直于作物行。在五个子样本点中的每个点中,荷兰螺旋钻的长度为150毫米,直径为50毫米,收集了一个土壤子样本。将螺旋桨垂直插入一个飞行的深度,并将五个子样本存储在一个袋子中。如果仍在田野中,成熟或成熟的作物仍在野外,则通过另一个操作员将谷物样品接近每个累积位置,以最大程度地减少灰尘和土壤的进一步污染。对于玉米,在五个点中的每一个中都取了一个棒。将玉米内核从每个库布的大约50%剥离,并在每个位置合成一个样品信封中。对于较小的颗粒农作物,采取了足够的茎,使大约20–50%的样品包膜被填充(尺寸为15 cm×22 cm),将样品首先放入样品袋中,并将茎从谷物头上扭转并丢弃。如果农作物在现场堆栈中,则从每个可用的堆栈中取出五个玉米棒的子样本,包括五只玉米或其他农作物的代表性样品,从堆栈内获取材料,以最大程度地减少灰尘和土壤的污染(扩展数据图1)。如果农民在农民商店里,那就是 已经从整个场上进行平均,然后取一个代表性的样品,同时,如果谷物松散地储存,并避免谷物从商店地板上储存,并避免使用可见的土壤或灰尘污染的谷物。
记录了样本位置和样品袋的照片,以与现场GPS位置一起进行质量保证。在埃塞俄比亚,如GPS所记录的那样,据报道晶粒数据的1,389个位置中有1,385个位置不确定性≤8m。其他四个位置的位置不确定性为9-16 m。在马拉维,1,812个位置中有1,790个位置不确定性≤9m。另外16个位置的位置不确定性为10-17 m,而6个位置的位置不确定性为2,900-5,000 m。我们决定不根据本研究的位置不确定性排除任何数据。我们使用了变异函数的强大估计器(扩展数据图2),由于少数点位于错误的位置53,因此对空间异常值的影响具有抵抗力,并且这些模型已验证。因此,位置误差的任何影响对这些量表下远程空间变化的广泛映射模式的任何影响都将非常有限和局部化。
将全晶状体样品在样品袋中播放。然后,将每个样品磨碎在家庭不锈钢咖啡研磨机中,使用前和每种样品在用非含有的布上擦拭干净。全谷物在许多情况下都消耗掉,尽管经常消耗较高的微量营养素富含麸皮和胚乳的损失,但经常被消耗掉。所有制剂都从土壤或灰尘污染的来源中消除了。然后将20-G的地面材料子样本运送到诺丁汉大学。根据土壤的水分含量,将土壤样品在40°C下干燥24-48小时。在土壤实验室进行准备,以避免与谷物样品进行交叉污染。从每个土壤样品中除去植物材料,然后将其分解并筛分为2 mm。然后将该材料固定并四分之一以产生子样本拆分。将150 g的土壤子样品倒入一个自封的袋子中,标记并运往英国,以在诺丁汉大学和罗瑟姆斯特德研究的实验室进行分析。使用标准方法测量土壤pH(水)和土壤有机碳(SOC)含量22。
谷物微量营养素分析方法遵循标准方法54。称量约0.2 g的每个接地样品并使用微波系统消化。对于2017年在Amhara地区收集的样品,使用了多波3000 48-PESEL MF50转子(Anton Paar)。消化容器是聚乙基酮压力夹克(Anton Paar)中的全氟烷氧化管。将样品在2 mL 70%痕量分析级HNO3中消化,1 ml Milli-Q水(18.2MΩCM; Fisher Scientific)和1 ml H2O2。设置为:1,400 W,140°C,2 MPa,持续45分钟。对于2018 - 2019年收集的样品,我们使用了由改良的聚甲基乙烯(56-mL“智能通风剂”,Anton Paar)制成的多波舞会41HVT56转子和压力激活的通风船。将样品在6 mL的70%痕量分析级HNO3中消化。设置为:1,500 W,10分钟加热至140°C,在140°C下保持20分钟,冷却15分钟至55°C。每个消化运行中通常包括两个操作空白。大约每四次消化运行中包括了认证参考材料(小麦面粉SRM 1567B,NIST)的重复样品。消化后,通过加入11毫升Milli-Q水,然后转移到25 mL通用管(SARSTEDT)并在室温下储存,将每根管的最终体积分别为15 mL。在分析之前,将样品用Milli-Q水进一步稀释成13毫升试管(SARSTEDT)。
对谷物(Ag,Al,AS,B,BA,CA,CA,CR,CR,CS,CU,CU,CU,FE,K,LI,MG,MG,MN,MO,NA,NI,NI,NI,P,P,PB,RB,SR,SR,SR,TI,TI,TL,TL,U,V和ZN)的多元素分析使用感应型plassma septromement(IC Plassma colypio)进行了ICPRY(ICP)iCPICICRY(ICP),进行了iCPRY(IC),并该仪器使用具有动能歧视的氦气碰撞电池来减少多原子干扰。从结合了ASXPRESS快速摄取模块(CETAC ASX-520,Teledyne Technologies)的AutoSampler引入样品,该样品通过PLUOROALOCOXY Microflow PFA-ST Nebuliser(Thermo Fisher Scientific)。将内部标准标准通过ASXPRESS单元在单独的线上引入样品流,包括SC(20μgL– 1),RH(10μgL– 1),GE(10μgL– 1)和IR(5μgL– 1)在2%HNO3(Primar Plimar Plus Plus等级; Fisher Scientific)中。An external multi-element calibration standard (Claritas-PPT grade CLMS-2; SPEX Certiprep) was used to calibrate Ag, Al, As, B, Ba, Be, Cd, Ca, Co, Cr, Cs, Cu, Fe, K, Li, Mg, Mn, Mo, Na, Ni, P, Pb, Rb, S, Se, Sr, Tl, U, V and Zn, in the range of0–100μgL – 1(0、20、40、100μg l – 1)。定制的外部多元素校准解决方案(纤溶酶,SCP科学)在0–30 mg L – 1的范围内创建CA,K,MG和NA标准。B,P和S校准使用内部标准解决方案(KH2PO4,K2SO4和H3BO3);Ti是半定量确定的。使用QTEGRA软件(Thermo Fisher Scientific)进行样品处理,并在需要时在脉冲计数和模拟探测器模式之间进行外部交叉校准。使用氧气细胞分别确定SE分别确定SE ICP – MS(ICAP TQ; Thermo Fisher Scientific),以将同位素80SE转移到M/Z 96(80SE16O),以减少40AR二聚体的干扰。使用RH作为内标实现漂移校正;校准使用CLMS-2多元素标准(CERTIPREP)。
分析在ICP -MS仪器上每次运行约240个样本的批处理(扩展数据表1)。校正各个晶粒浓度数据的特定运行式操作空白,然后在干燥的基础上转换为浓度。据报道,元素特异性检测的限制为3倍,假设概念的干重为0.2 g样品材料(扩展数据表1)。对于晶粒元素浓度小于检测极限的样品,在统计分析之前删除了数据。没有对谷物样品的潜在污染进行调整,例如,使用典型标记的土壤粉尘或储存量(例如,Fe,V)。从马拉维的一家谷物商店中采集的两个高粱样品被排除在基于高浓度的CA,MG和其他元素的数据分析之外,这些元素不太可能因土壤污染而引起。
计算了晶粒中所有元素的浓度的摘要统计数据,并检查了直方图。地球化学变量通常是对数正态分布的,并且使用进栅偏度来检查数据的偏度系数,作为分布分布的不对称性的强大度量55。如果如前所述56,则根据遍布偏度在间隔[-0.2,0,2]内分析数据(mg kg – 1)。如果进数偏度不超出该范围(具有正值),并且LOGE转换后的章鱼偏度的绝对值小于原始量表,则在LOGE量表上分析数据(扩展数据表1,2)。
使用三个估计器(扩展数据表2)估算了每个变量的变量图:标准估算值57和两个替代方案58,59。这两个替代估计器比标准估计量更强大,在这些边缘异常值(在直方图上明显)或空间异常值(在局部空间上下文中显而易见)。从观测值之间的所有成对比较(埃塞俄比亚为330 km,马拉维为100 km)以及滞后箱,宽度为10 km。使用distvincentysphere函数从R平台的地理库47,60的地理库中计算出任意两个位置(由纬度和经度指定)之间的距离。然后通过加权最小二乘61将指数变化函数函数拟合到估计值中。选择了指数变化函数,因为它确保了球体上距离的正定协方差矩阵62。然后通过交叉验证测试每个模型。所选模型在扩展数据中显示。
在交叉验证中,通过普通kriging从其余观察结果中删除了每个观察结果。这是使用为每个变量拟合的每个变量图模型完成的,以计算出由三个估计器计算的点估计值集。计算每个观察值的标准化平方预测误差(SSPE),因为观察到的值和预测值之间的平方差除以标准普通kriging方程中计算的预测误差方差(KRIGING差异)53。在有效的基础变化图模型的情况下,SSPE的中值为0.455的期望值为0.455,具有正态分布的Kriging错误53。由于MATHERON57引起的标准估计量比稳健的替代方案更有效,因此,如果从交叉验证结果(中位SSPE在95%的置信区间内),拟合到这些估计值的模型似乎正确,则不考虑替代方案。如果SSPE建议拟合到Matheron估计值的模型受异常值的影响,则还对适合稳健估计的模型进行了交叉验证,并且在交叉验证结果中选择了一个模型53。
一旦选择了变量函数模型,它将用于计算细粒浓度(或不转化)的细胞节点上的预测。这是由普通Kriging61完成的。在普通的kriging中,假定感兴趣的变量的平均值是局部恒定的,但未知。发现估计是观测值的线性组合,使得预测的预期平方误差(普通的kriging差异)被最小化。Kriging方差也被计算为预测不确定性的量度。对于给定的变化函数,Kriging方差反映了对观察到感兴趣变量进行预测的位置的接近度。如果变量已转换为对数,则每个位置的预测是通过在LOGE量表上的预测进行指定计算的。由此产生的反向转换估计值是中位数均匀的预测指标,适用于偏斜分布的变量63。请注意,Kriging方差不能有意义地反向转化。但是,它仍然表明预测的不确定性在空间上如何变化,因此在这里映射了转换变量的loge量表。Kriging方差图显示在扩展数据2中。3,4。在埃塞俄比亚,其中样品位点不规则地分布在映射区域上,克里吉方差明显不同,取决于局部样品密度。
在埃塞俄比亚,我们绘制了通过摄入小麦和Teff来满足饮食需求的百分比(图3)。同样,在马拉维的玉米(图4)。在埃塞俄比亚,TEFF每天每天97.6 g人均小麦和每天89.3克人均(基于食品和农业组织数据库项目“其他谷物”)用作参考摄入量。29;在马拉维,每天人均342.8克用作参考玉米进气29。估计的平均需求(EAR)阈值分别为CA,FE,SE和Zn的人均人均860、22.4、45和10.2 mg,根据18-24岁的成年女性,将CA,FE,SE和Zn的阈值选择为代表性阈值,该阈值是根据18-24岁的成年妇女(均未经过精制的成年女性)。这些阈值类似于其他人群群体。由于该派生变量的不确定性与Kriging差异的可比度量是不可用的,因此我们为埃塞俄比亚定义了掩盖,在该掩码中,采样的稀疏性会导致与马拉维相比更大的不确定性。我们考虑了TEFF中的Zn浓度,这是一个在长距离内具有空间依赖性的变量,并确定了该变量的Kriging差异超过变量本身方差的75%的区域,因为采样很少。这些区域定义了用于所有变量饮食需求百分比的图表所用的面具,并在图3中以灰色显示。
图2中所示的地图。3,4由点kriging进行,也就是说,它们是未采样位点测量的预测。普通的kriging也可用于预测一个区域或“块” 61的变量的平均值。为了说明这种方法的通信价值,在Amhara地区的Woreda水平显示了谷物(Teff和小麦)中Zn和Ca的平均浓度(图5)。这些是通过从相同样本数据中的woreda均值的块kriging获得的,并且具有与产生点kriging预测的相同变异函数模型。
确定地位的饮食生物标志物与谷物微量营养素浓度集中在此处的饮食生物标志物之间,为此,有可靠的饮食状态生物标志物13;ZN7和本研究中分析的其他微量营养素并非如此。埃塞俄比亚的微量营养素调查(血清23)和马拉维(Plasma24)获得了生殖年龄妇女血液中SE浓度的数据。计算每个可用枚举区域的平均浓度(埃塞俄比亚的321,马拉维的101),用于每个枚举区域的纬度和经度。对于每个枚举区域,发现最近的谷物样品位点(无论作物如何)。在埃塞俄比亚,所有枚举区域的中位距离距离最近的谷物样品位点为17公里。在马拉维,中位距离短得多(1.4 km),这既归因于马拉维的较密集作物抽样,又是对微量营养素调查使用的枚举区域的目标。
枚举区域不包括简单的独立随机样本,因此无法通过统计量(例如相关系数)来量化血清或等离子体SE浓度和SE浓度之间的关系。因此,使用适当的LMM进行了研究,该LMM结合了以Matérn相关函数建模的空间相关随机效应64。探索性分析表明,对于假设正常随机效应是合理的,所有血清或血浆SE浓度的LOGE转化是必要的。将观察到的血清或血浆SE浓度建模为在最近样品位置在晶粒中浓度的线性函数。剩余的最大似然用于估计随机效应参数。然后通过加权最小二乘65及其标准误差估算固定效果。反对无效假设的证据表明,通过对数类样比测试测试了晶粒SE浓度上血清或血浆SE的回归系数。
在埃塞俄比亚和马拉维的生殖年龄女性中血清或血浆SE浓度的图显示了变量之间的正相关(扩展数据图5),这是统计模型支持的。对于埃塞俄比亚,估计的回归系数(log [ng se se per per]和log [mg谷物se se per kg])为0.08,标准误差为0.02。零假设是,该系数为零的假设是基于对数似然比统计量(L = 14.48,p = 1.4×10-4)的理由拒绝的。如果生物标志物与谷物SE浓度之间没有关系,那么获得L统计量的可能性将很小。同样,对于马拉维,估计的回归系数为0.09,标准误差为0.03(L = 11.56,p = 6.7×10-4)。
提取了谷物中SE和Zn浓度的数据(马拉维的玉米;埃塞俄比亚的玉米,小麦和玉米),以及有关土壤pH(水)和SOC的相应数据。在这些相同位置也提取了三个环境协变量的观察结果:(1)平均年温度;(2)CHELSA数据集的平均年度降水值66,67,其缩小为30 s的空间分辨率;(3)来自30 s分辨率值得数字高程模型的地形指数值68。地形指数(有时称为地形湿度指数)是衡量排水趋势在现场积聚的趋势,并被广泛用作土壤特性的预测度量。经过探索性分析,对晶粒SE浓度数据进行了LOGE转换,以使正常随机效应的假设合理。这对于谷物锌不是必需的。来自马拉维的SOC的测量显示出明显的正偏斜,因此被洛格转化。
如生物标志物数据所述,使用LMM分析了数据,其中LMM将环境协变量的回归型函数视为固定效应以及空间自动相关的随机效应。随机效应参数通过最大似然估计,然后通过加权最小二乘固定效应参数估算。第一个模型的均值为唯一的固定效果。第二个模型将平均年降水拟合为固定效应。通过对第一个模型的对数似然比测试对该预测变量的证据进行了评估。如果在无效假设下,预测因子的无效效果的l值大于0.05,则将保留预测变量。然后以平均年温度和地形指数的顺序考虑其他预测变量。最后,将p值评估为多个测试的结果,控制了0.05时的错误分辨率(FDR)69。FDR是所有被拒绝的假设错误拒绝的假设的预期比例。对于每个农作物和国家 /地区中的每种微量营养素,可以鉴定出预测因子在0.05处被视为重要的FDR。考虑了第一个土壤pH和SOC,遵循相同的程序,以基于两个土壤特性产生可比的模型。
扩展数据图显示了针对环境协变量和土壤特性的晶粒SE和Zn浓度图。6–9。在扩展数据3中总结了环境协变量或土壤特性作为晶粒中微量营养素含量的预测指标的证据。扩展数据表3还显示了每个微量营养素的单独模型中的估计系数及其标准误差。对于埃塞俄比亚的玉米,teff或小麦,在马拉维的玉米。这些模型中的预测因素仅是选择具有FDR对照的那些。
有关研究设计的更多信息可在与本文有关的自然研究报告摘要中获得。

