广西科学院学报  2018, Vol. 34 Issue (4): 309-316   PDF    
岩溶水水化学特征的主成分分析和因子分析
张路遥1,2 , 马祖陆2 , 覃星铭2     
1. 广西师范大学生命科学学院,广西桂林 541006;
2. 中国地质科学院岩溶地质研究所,国土资源部岩溶生态系统与石漠化治理重点实验室,广西桂林 541004
摘要: 【目的】 为了解岩溶区地下水水化学特征以及地下水成分的来源。【方法】 以广西果化镇地下水为研究对象,于2017年7月共采集地下水样品21件, 运用Gw_chart软件制作水化学Piper三线图,结合R软件进行相关性分析、主成分分析法、因子分析法等对数据进行处理。【结果】 研究区岩溶地下水水化学类型主要为重碳酸-钙型水,Ca2+和Mg2+为地下水中主要阳离子,HCO3-和SO42-为地下水中主要阴离子。HCO3-与Ca2+ , Na++K+与Cl-, SO42-与Mg2+、Ca2+, 相关性较强,它们经历了相似的化学反应过程。通过主成分分析法提取了3个主成分,共解释了91%的方差,可以很好地代表原始数据;通过因子分析提取出3个公共因子, 共解释了86%的方差。【结论】 自然因素水-岩作用为水化学元素特征与来源主导因素,人类活动也起到了重要作用。
关键词: 岩溶     水化学特征     主成分分析     因子分析    
Principal Component Analysis and Factor Analysis of Chemical Characteristics of Karst Water
ZHANG Luyao1,2 , MA Zulu2 , QIN Xingming2     
1. College of Life Science, Guangxi Normal University, Guilin, Guangxi, 541006, China;
2. Key Laboratory of Karst Ecosystem and Treatment of Rocky Desertification, Ministry of Land and Resources, Institute of Karst Geology, Chinese Academy of Geological Sciences, Guilin, Guangxi, 541004, China
Abstract: 【Objective】 In order to understand the chemical characteristics of groundwater and the source of groundwater components in karst areas, the groundwater samples from Guohua town of Guangxi Province were taken as research objects. In July 2017, a total of 21 groundwater samples were collected. 【Methods】 The Gw_chart software was used to make the three-line diagram of the water chemistry Piper, and the R software was used to process the data by correlation analysis, principal component analysis and factor analysis. 【Results】 The study found that the karst groundwater hydrochemical type in the study area was mainly bicarbonate-calcium water, Ca2+ and Mg2+ were the main cations in groundwater, and HCO3- and SO42- were the main anions in groundwater. HCO3- is highly correlated with Ca2+, Na+ +K+ and Cl-, SO42- and Mg2+, Ca2+, and they undergo a similar chemical reaction process. Three principal components were extracted by principal component analysis, which explained 91% of the variance and represented the original data well. The three common factors extracted by factor analysis explained 86% of the variance. 【Conclusion】 Natural factors water-rock action is the dominant factor of water chemical element characteristics and source, and human activities also play an important role.
Key words: krast     hydrochemical characteristics     principal component analysis     factor analysis    
0 引言

【研究意义】岩溶水是中国西南岩溶地区的重要的供水源,具有农业用水和生活用水的双重效用。果化镇是典型的岩溶地区居民地,对当地岩溶水的水化学成分与水质进行分析研究,有利于当地地下水开采与保护,以期对该地区的生态环境治理与规划提供依据。【前人研究进展】地下水在循环过程中不断地与周围环境进行着物质和能量的交换,其组分来源主要受地下水所流经的地层岩性的影响。由于岩溶区特殊的地质背景和环境特征,水化学性质容易受到外部活动的影响,导致一些岩溶区的地下水水质受到一定程度的影响[1-2]。地下水水质受到水岩作用、人类活动及大气等因素的共同影响,这些影响因素不仅是地下水资源质量评价的重要内容,也为地下水合理开发利用方案的制定提供了重要依据[3-5]。岩溶地下水水文地球化学特征不仅能够反映地下水水质演化特征,而且通过对水化学组分来源、迁移和转化等水文地球化学的研究,能够在地下水成因、补给来源、径流途径、排泄方式、水岩相互作用以及其他水动力环境等方面提供一定的信息,水文地球化学研究已经成为解决地下水科学问题一种常用的手段[2]【本研究切入点】由于经济的发展,岩溶区易旱,岩溶区流域水资源供需矛盾日益严重,对生态环境和社会经济的可持续发展造成巨大压力,为了解水化学的真实特征,需综合这些影响因素共同分析,但随着影响因素的增加,计算难度会越来越大,越难以揭示变量间的相关性。通过主成分分析与因子分析两种多元统计方法,提取较少的具有代表性的主成分或公共因子概括多个变量所提供的的信息,可以减少计算难度,并能较为准确地把握研究对象相互之间的关系。【拟解决的关键问题】分析坡雷-果化岩溶流域不同水体的水化学组成,阐明流域水化学特征和水化学形成的原因,以期为不同地区的岩溶流域水资源保护提供理论依据。

1 材料与方法 1.1 研究区概况

研究区域位于平果县西北方向坡雷-果化岩溶流域,覆盖果化镇西南方5~10 km区域,该流域属于多级排泄的系统,既有那国地下河出口,也有位于果化镇东南侧的右江西岸的果化泉以及山顶泉、妙冠泉等岩溶泉出口。研究区域内气候属于南亚热带季风气候,热量充足,雨量充沛,多年平均气温为20.2~22.6℃,多年平均降水量1 322.3 mm,降雨年内分布极不均匀,干湿季节交替现象明显,平水期为4月与10月,枯水期为1-3月和11-12月。5-9月为丰水期,占全年的65%,最大的日降雨量可达112 mm。果化镇地下水点有41个,其中上升泉2个,下降泉19个,季节泉5个,天窗4个,溶井6个,溶洞5个,枯水期开采流量为1.54 m3/s[6]

采样点主要出露于石炭系上统(C3)和二叠系下统栖霞阶(P1q),局部出露有二叠系上统(P2)和三叠系下统(T1),岩石主要为纯石灰岩和硅质灰岩。研究区域位于扬子板块与华夏板块之间的过渡地带,多次发生构造运动,形成一系列褶皱和断裂[7],区内植被覆盖率低,为典型峰丛洼地,岩溶发育已到中后期,表层溶沟、溶槽、浅部溶隙、溶孔、溶穴、溶痕、石芽等发育,洼地内发育较多落水洞、竖井、天窗,饱水带多发育岩溶管道、岩溶裂隙,地表漏水严重,大气降水可快速转换成地下水。

1.2 样品采集与测试

于2017年7月8日至7月9日在右江流域果化段采集水样,共7个采样点,分别为妙冠(MG)、地良(DL)、那吉(NJ)、龙旧(LJ)、果化(GH)、三汀泉(STQ)、那国(NG), 每个采样点取3瓶样品,共计采取21个样品(图 1)。采样时用事先清洗过的高密度聚乙烯600 mL塑料瓶采取水样,每次取样以前先用待取水样涮洗取样瓶3次,再装取水样,装完后在水中进行密封,保证瓶中不存在气泡。从3瓶样品中选取1瓶现场加入5 mL 1:1 HNO3进行酸化,便于后续检测。

图 1 采样点分布图 Fig.1 Distribution of sampling points

检测过程分为野外现场测试和实验室测试两个阶段。

(1) 野外现场测试:野外采集水样的时候,现场采用便携式水质监测仪WTW Multi3430对水样的温度(T)、溶解氧(DO)、电导率(EC)、pH值4个指标进行监测,其中T、EC的精度为0.1,DO、pH值的精度均为0.01。运用TDS笔测量样本的TDS值,同时,采用德国Merck公司生产的Calcium-Test便携试剂测试ρ(Ca2+)和ρ(HCO3)。

(2) 实验室测试:水样中的阴、阳离子测定分别在桂林的国土资源部岩溶动力实验室和测试中心完成。依照本研究目的,在实验室检测其中的K+、Na+、Ca2+、Mg2+、NH4+、TFe、Cl-、SO42-、HCO3-、CO32-、NO3-、NO2-、F-、PO43-、OH-、CODMn、游离CO2,并测定pH值、CODMn。检测使用的主要仪器为离子色谱分析仪(ICP-600)(其精度为0.000 1 mg/L)、IRIS Intrepid Ⅱ XSP全谱直读等离子光谱仪(其精度为0.001 ppm)、PHS-3C pH计、T6新悦可见光分光光度计、833离子色谱仪、iCAP Q等离子体质谱仪。所测水样在测试之前,均用0.22 μm的过滤头对水样进行过滤处理,以防止水样中存在杂质影响检测的结果。

1.3 分析方法

利用GW_chart软件绘制Piper三线图;利用R软件进行相关分析、主成分分析与因子分析。相关性分析可以揭示地下水水化学各个组分间的相关关系,并且很好地展示地下水来源的一致性和差异性。运用R语言计算研究区地下水各指标的相关系数,可以采用pearson,kendall,spearman 3种方法,本文运用pearson法。主成分分析的目标是用一组较少的不相关变量代替大量相关变量,同时尽可能保留初始变量的信息,这些推导所得的变量称为主成分,他们是观测变量的线性组合[8]。模型的形式为

$ PC1 = {\rm{a1}}{X_1} + {\rm{a2}}{X_2} + \ldots {{\rm{a}}_k}{X_k}, $

k个观测变量的加权组合。

因子分析的目标是通过发掘隐藏在数据下的一组较少的、更为基本的无法观测的变量,来解释一组可观测变量的相关性。这些虚拟的、无法观测的变量称作因子(每个因子被认为可解释多个观测变量间共有的方差,因此准确来说,他们应该称作公共因子)[13]。模型的形式为

$ {X_i} = a{\rm{1}}{F_1} + a{\rm{2}}{F_2} + \ldots + ap{F_p} + {U_i}, $

其中Xi为第i个可观测变量(i=1…k),Fj是公共因子(j=1…p),并且p < kUiXi变量独有的部分(无法被公共因子解释)。

2 结果与分析 2.1 坡雷-果化岩溶流域系统水化学描述性统计结果

样本水化学统计分析结果见表 1表 2。从表中可知,研究区域地下水pH值野外测量变化范围为7.14~7.36,平均值为7.25,变异系数十分小。pH值反应了地下水中氢离子的浓度,并且氢离子在与碳酸盐岩产生反应时被消耗,因此地下水的pH值是受水-岩作用过程、大气、土壤和人类活动的共同影响;TDS(溶解性总固体)平均值为405左右,水体矿化度较低。地下水中阳离子含量为Ca2+ > Mg2+ > Na++K+, 地下水中Ca2+的平均含量占阳离子总量的96.37%,为地下水中主要阳离子,其次是Mg2+。变异系数可以反映水化学参数在空间上的离散程度,Ca2+含量波动较小,其来源主要为研究区碳酸盐溶解;K+、Mg2+两种阳离子的变异系数大,表明其含量在空间上的变化程度较大。地下水中阴离子含量大小为HCO3- > SO42- > Cl-, 其中HCO3-含量占阴离子总量的94.83%,为地下水中主要阴离子。

表 1 地下水常规组分统计特征值 Table 1 Statistical eigenvalues of conventional components of groundwater
表 2 电导率、溶解氧、pH值和温度统计特征值 Table 2 Statistical eigenvalues of electrical conductivity, dissolved oxygen, pH and temperature

图 2 Piper三线图显示,采样点的阳离子和阴离子分布较为集中,这表明研究区地下水水化学类型较为一致,均为重碳酸-钙型水。研究区大部分为碳酸盐岩地区,分布少量碎屑岩区,该地区地下水化学类型主要受地层、水文、地质构造影响,受人类活动因素较轻微。

图 2 研究区岩溶水三线图 Fig.2 Piper chart of karst water in study area
2.2 坡雷-果化岩溶流域水化学指标的相关关系

分析结果如图 3所示。由于K+和Na+的地球化学性质相似,将Na+归入K+中不单独区分。其中Ⅴ1到Ⅴ10分别代表K++Na+、Ca2+、Mg2+、Cl-、SO42-、HCO3-、F-、CODMn、SiO2、TDS。图中对角线代表变量自身的分布;对角线左下方代表两个属性的散点图,可以一目了然地看出两元素之间是否有线性相关;对角线右上方数字表示两个属性的相关性值,星号(*)越多表示越显著。

图 3 相关性分析可视化 Fig.3 Correlation analysis visualization

图 3可知,TDS与大多指标都有较好的相关性,在阳离子中TDS和HCO3-的相关性最强, 相关性值为0.99;与Ca2+、SO42-、Mg2+的相关性值分别为0.95, 0.35, 0.25,这4种离子决定了该碳酸盐地区的主要水化学类型。HCO3-与Ca2+具有很强的相关性,相关性值达0.95,说明地下水中该离子来源于研究区中广泛分布的灰岩、白云岩等可溶性碳酸盐岩的溶解有关[8-10],主要是来自方解石的溶解,以及土壤大气中的CO2的溶解和人类活动的共同影响。Na++K+和Cl-相关性较高,相关性值为0.79,SO42-与Mg2+、Ca2+也有较强的相关性,说明地下水在流动过程中发生了岩盐、石膏、菱镁矿等物质的溶解。COD是指示水体中有机物含量的污染指标[9-11],地下水中有机污染物主要来源有工农业污染及生活污染。图中可看出K++Na+、Mg2+、Cl-、F-与COD都有一定的相关性,相关性值分别为0.35, 0.30, 0.31, 0.54,表明这几重离子的来源于农药化肥的使用、生活及工农业废水的排放、生活垃圾及工业废弃物等有关。Na++K+与F-具有较高的相关性,相关性值为0.97,说明该研究区地下水埋藏较浅,以蒸发和浓缩作用为主[12],此时氟离子浓度同钾、纳离子同时增加。Ca2+与F-呈较强的负相关,是由于氟离子在水中可与钙离子形成氟化钙沉淀,使水中氟离子减少,由于该地区为岩溶区,水中钙离子较多,所以相应的氟离子较少。

2.3 坡雷-果化岩溶流域水化学指标的主成分分析 2.3.1 判断主成分个数

通常的,运用最多的判断主成分个数的方法是基于特征值的大小。每一个主成分都与相关系数矩阵的特征值相关联,第一主成分与最大的特征值相关联,第二主成分与第二大的特征值相关联,依此类推。根据特征值的大小,我们可以运用R软件实现3种检验方法。首先,根据Kaiser-Harris准则,特征值小于1的主成分所揭示的方差比包含在单个变量中的方差更少,因此我们只保留特征值大于1的主成分。其次,运用Cattell碎石检验绘制特征值与主成分数的图形,这类图形可以展示图形弯曲状况,在图形变化最大处之上的主成分都可以保留。最后,我们可以通过模拟,依据与初始矩阵相同大小的随机数据矩阵来判断要提取的特征值。若基于真实数据的某个特征值大于一组随机数据矩阵相应的平均特征值,那么该主成分可以保留,该方法称作平行分析[13]。在R软件中,运用fa.parallel()函数,对3种检验方法可视化,结果见图 4

图 4 主成分个数检验图 Fig.4 Detection chart of principal component number

图中直线与×符号代表碎石图,水平线代表特征值大于1准则线,虚线代表100次模拟的平行分析。根据图 4所示,保留3个主成分即可保留数据集的大部分信息。

2.3.2 提取主成分

在R软件中,利用principal()函数对原始数据进行主成分分析,所得结果如表 3所示。

表 3 主成分载荷矩阵 Table 3 Loading matrix of principal component

表 3中,PC1、PC2、PC3为成分载荷,表示原始数据中各变量与主成分的相关系数,可以用来解释主成分的含义。h2栏代表主成分对每个变分去噪,使之能够更容易地被解释。通过观察PC1、PC2、PC3栏,发现该载荷矩阵无法很好解释,因此对载荷矩阵进行旋转,旋转后结果如RC1、RC2、RC3所示。RC1、RC2、RC3分别为第一主成分、第二主成分和第三主成分,统计其特征值、成差百分数与累计方差百分数。方差百分数意味着每个主成分对整个数据集的解释程度(表 4),此处可以看出,3个主成分共解释了9个变量95%的方差,可以很好地代表原始数据信息。

表 4 特征值、方差百分数、累计方差百分数 Table 4 Eigenvalue, percentage of variance and cumulative percentage

通过表 3表 4可知,第一主成分RC1解释了38%的方差,由于该主成分中Ca2+、HCO3-、TDS等变量的贡献度较大,且由图 3可知,Ca2+、HCO3-和TDS三者互相之间相关性较好,通常认为相关性较好的离子具有相同的来源或经过了相同的化学反应过程[9],可以推测第一主成分RC2代表以方解石等碳酸盐为主的含水介质的水—岩反应和人类活动等影响因素的共同作用,使地下水的矿化度升高。第二主成分RC2的方差百分数为38%,与其密切相关的变量有Mg2+、Cl-、F-和K++Na+,说明主要来源于镁盐溶滤作用以及含纳岩石溶解作用的影响,且生活废水、化肥,大气降水也有较大影响。第三主成分RC3解释了20%的方差百分数,其中COD的贡献度最大,第三主成分RC3代表人类活动所产生的农业、生活污水对水质的影响。

主成分得分(表 5)可以直观的显示RC1、RC2、RC3与原变量之间的关系,较好的反映了采样点离子来源与影响因素。NJ、LJ采样点在RC1中得分较高,说明受碳酸盐水-岩作用影响较显著;GH、STQ在RC2、RC3中都有较高得分,说明该点水化学特征与含钠盐石的溶解以及人类的活动之间的关系较为密切。NG在第三主成分中有较高的得分,说明采样点和人类活动具有较高的相关性。

表 5 主成分得分 Table 5 Score of principal component
2.4 坡雷-果化岩溶流域水化学指标的因子分析 2.4.1 判断公因子个数

与主成分分析类似,因子分析也需要通过碎石图来判断因子个数。在R软件中利用fa.parallel()函数,判断所需因子个数。结果如图 5所示。

图 5 公共因子个数检验图 Fig.5 Detection chart of common factor number

图中直线带×符号是主成分分析结果,直线带△符号为因子分析结果。与主成分分析不同的是,在因子分析中,Kaiser-Harris准则的特征值数是大于0而不是大于1。因此,根据平行分析,碎石检验,特征值大于0这3种检验方法,我们保留3个公共因子。

2.4.2 提取公共因子

在保留3个公共因子的前提下,于R软件中运用fa()函数,对原始数据进行因子分析。与主成分分析不同,提取公因子的方法有很多,例如主轴迭代法、最大似然法、最小残差法等等,这里我们采用主轴迭代法。分析结果如表 6表 7所示。

表 6 因子载荷矩阵 Table 6 Factor loading matrix
表 7 特征值、方差百分数、累计方差百分数 Table 7 Eigenvalue, variance percentage and cumulative percentage

表 5中可以看出,与主成分分析相同,在未进行因子旋转时,因子载荷矩阵的意义并不能被很好的解释,因此对主轴迭代法得出的结果进行正交旋转,使之能够被更容易的解释(图 6)。

图 6 因子分析结果 Fig.6 The result of factor analysis

从所得结果可以看出,第一因子PA1贡献率为37%,第二因子PA2贡献率为36%,第三因子PA3贡献率为19%,3个因子共解释了原数据92%的方差。所以我们可以认为研究区主要受到3种因素的影响。从前文分析可知,Ca2+主要来自碳酸盐的溶解,因此第一公共因子可以命名为碳酸盐岩作用;Cl-、K++Na+、Mg2+主要来自含钠岩石的溶解,因此第二公共因子可以命名为氯化物作用;COD主要受人类生产生活所造成的废水排泄物等影响,因此第三公共因子命名为为人类活动。

3 结论

(1) 研究区内地下水化学类型以重碳酸-钙型水,研究区地下水pH平均值为7.25,为弱碱性水。TDS平均值为405 mg/L,矿化度较低。HCO3-与Ca2+、Na++K+和Cl-、SO42-与Mg2+、Ca2+相关性较强,碳酸盐岩和白云岩的风化与氯化物的水岩相互作用为其水化学特征做出了主要贡献,自然因素为主导因素,同时人类活动对研究区的水化学也产生了一定的影响。

(2) 主成分分析能够将8个采样点10个水化学特征变量压缩成3个解释水化学特征的主成分,可以简单地将3个主成分概括为碳酸钙溶解,含钠岩石溶解和人类活动。3个主成分共解释了95%的方差,并消除各主成分之间的相关性使结果更加合理,达到了降维和简化信息的目的。

(3) 通过因子分析法提取出控制本研究区水化学信息的3个公共因子,共解释了92%的数据信息。因子分析能够很好的解释研究区水化学的印象因素及各因素的影响强度,为区分自然因素和人为因素提供科学依据。

参考文献
[1]
WANG J, JIN M, JIA B, et al. Hydrochemical characteristics and geothermometry applications of thermal groundwater in northern Jinnan, Shandong, China[J]. Geothermics, 2015, 57: 185-195. DOI:10.1016/j.geothermics.2015.07.002
[2]
樊连杰, 裴建国, 杜毓超, 等. 广西红河水中下游澄江地区地下水地球化学特征[J]. 现代地质, 2015(4): 958-966.
FAN L J, PEI J G, DU Y C, et al. Geochemical characteristics of groundwater in Chengjiang area of the Honghe river in Guangxi[J]. Geoscience, 2015(4): 958-966. DOI:10.3969/j.issn.1000-8527.2015.04.026
[3]
陈正华, 曾亮, 刘宇. 重庆鱼田堡煤矿采动条件下顶板岩溶地下水运移规律探讨[J]. 中国岩溶, 2017, 36(1): 67-74.
CHEN Z H, ZENG L, LIU Y. Discussion on karst groundwater law under mining conditions in the Yutianbao coalmine of Chongqing[J]. Carsologica Sinica, 2017, 36(1): 67-74.
[4]
刘绍华, 郭芳, 姜光辉, 等. 桂林市峰林平原区岩溶水文地球化学特征[J]. 地球与环境, 2015, 43(1): 55-65.
LIU S H, GUO F, JIANG G H, et al. Karst plain area hydrogeochemical characteristics peaks of Guilin[J]. Earth and Environment, 2015, 43(1): 55-65.
[5]
杨平恒, 卢丙清, 贺秋芳, 等. 重庆典型岩溶地下水系统水文地球化学特征研究[J]. 环境科学, 2014, 35(4): 1290-1296.
YANG P H, LU B Q, HE Q F, et al. Hydrogeochemical characteristics of a typical karst groundwater system in Chongqing[J]. Environmental Science, 2014, 35(4): 1290-1296.
[6]
平果县志编纂委员会. 平果县志[M]. 南宁: 广西人民出版社, 1996.
Pingguo County Annals Compilation committee. Pingguo county annals[M]. Nanning: Guangxi People's Publishing House, 1996.
[7]
曹荆亚.广西平果矿区三角洲河道分布分形集合研究[D].长沙: 中南大学, 2012: 8.
CAO J Y.Study on distribution and fractal geometry of delta channel in Pingguo orefield, Guangxi[D]. Changsha: Central South University, 2012: 8. http://cdmd.cnki.com.cn/Article/CDMD-10533-1012475421.htm
[8]
BRENOT A, BARAN N, PETELET-GIRAUD E, et al. Interaction between different water bodies in a small catchment in the Paris basin (Brevilles, France):Tracing of multiple Sr sources through Sr isotopes coupled with Mg/Sr and Ca/Sr ratios[J]. Applied Geochemistry, 2008, 23(1): 58-75.
[9]
NÉGREL P, PETELET-GIRAUD E. Strontium isotopes as tracers of groundwater-induced floods:the Somme case study (France)[J]. Journal of Hydrology, 2005, 305(1): 99-119.
[10]
AIUPPA A, BELLOMOA S, BRUSCAB L, et al. Natural andanthropogenic factors affecting groundwater quality of anactive volcano (Mt.Etna, Italy)[J]. Applied Geochemistry, 2003, 18(6): 863-882. DOI:10.1016/S0883-2927(02)00182-8
[11]
CONRAD J E, COLVIN C, SILILO O, et al.Assessment of the impact of agricultural practices on the quality of groundwater resources in South Africa[R]. Pretoria, South Africa: Water Research Commission Report, 1999, 641/1/99.
[12]
BASAK B, ALAGHA O. The chemical composition of rainwater over Büyükcekmece Lake, Istanbul[J]. Atmospheric Research, 2004, 71(4): 275-288. DOI:10.1016/j.atmosres.2004.07.001
[13]
KABACOFF R I.R语言实战[M].高涛, 肖楠, 陈钢, 译.北京: 人民邮电出版社, 2013.
[20]
KABACOFF R I.R in action(data analysis and graphics with R)[M]. GAO T, XIAO N, CHEN G, trans.Beijing: People Post Press, 2013.