高光譜成像儀作為精密的光學(xué)儀器,不僅可以獲得圖像上每個(gè)點(diǎn)的光譜數(shù)據(jù),而且還可以獲得任一譜段的圖像信息。但由于其采集的光譜數(shù)據(jù)具有波段多、分辨率高、數(shù)據(jù)維度高、冗余性強(qiáng)等特點(diǎn),因此需要對(duì)光譜數(shù)據(jù)進(jìn)行預(yù)處理,以提升建模數(shù)據(jù)的準(zhǔn)確性。本文對(duì)高光譜成像儀的原理及光譜數(shù)據(jù)的預(yù)處理方法做了介紹。
高光譜成像儀的工作原理:
高光譜成像技術(shù)是利用成像光譜儀對(duì)目標(biāo)物體在光譜覆蓋范圍內(nèi)的數(shù)十或數(shù)百條譜線進(jìn)行連續(xù)掃描成像,在獲得目標(biāo)物體外部特征圖像信息的同時(shí),也能獲得反應(yīng)其內(nèi)部成分的光譜信息。典型的色散型成像光譜儀采用連續(xù)掃描的方式進(jìn)行成像,其主要由光源、電控移動(dòng)臺(tái)、色散元件、面陣探測(cè)器等幾部分組成,如下圖所示。
當(dāng)光源照射在電控移動(dòng)臺(tái)上的目標(biāo)樣品時(shí),樣品反射光經(jīng)過成像鏡頭、狹縫,再經(jīng)由光柵等光學(xué)器件后,按波長(zhǎng)色散并成像于CCD像面。由于狹縫只允許很窄的樣品條帶圖像通過,因此當(dāng)樣品在電動(dòng)平臺(tái)的連續(xù)移動(dòng)掃描下,能夠得到連續(xù)的一維影像及光譜信息。計(jì)算機(jī)上的圖像采集軟件對(duì)圖像進(jìn)行采集和存儲(chǔ),進(jìn)行處理后可以得到樣品的三維高光譜圖像。通過對(duì)高光譜圖像進(jìn)行特征提取、圖像融合等,可以得到樣品每個(gè)像素點(diǎn)的反射光譜(如下圖所示,X方向表示條帶的一列像元、Y方向表示連續(xù)成像的軌跡、入方向代表各像元在不同波長(zhǎng)下的光譜信息)。由于樣品不同部位具有不同的特征光譜,據(jù)此可以分析和判斷目標(biāo)的屬性。
高光譜成像儀光譜數(shù)據(jù)的預(yù)處理方法:
由于采集到的三維高光譜數(shù)據(jù)中的光譜信息除了含有有用的信息外,還含有其他大量的隨機(jī)噪聲和與樣本性質(zhì)無(wú)關(guān)的信息(如儀器噪音、雜光散射和基線漂移等),這些因素都會(huì)對(duì)光譜信息產(chǎn)生一定的干擾,甚至?xí)绊懰P偷男阅芎皖A(yù)測(cè)效果。因此,有效地消除光譜信息中的噪聲和無(wú)關(guān)信息是建立良好的分析預(yù)測(cè)模型的關(guān)鍵。
通過對(duì)光譜信息進(jìn)行有效的預(yù)處理可以減弱甚至消除其他與樣本性質(zhì)無(wú)關(guān)的信息對(duì)光譜信息的影響,為后續(xù)建立預(yù)測(cè)精度高、穩(wěn)健性好的分類判別模型奠定基礎(chǔ)。目前,常用的預(yù)處理方法有變量標(biāo)準(zhǔn)化算法、多元散射校正算法、導(dǎo)數(shù)算法、基線校正、平滑算法和去趨勢(shì)法等。
1.變量標(biāo)準(zhǔn)化算法(SNV)
變量標(biāo)準(zhǔn)化(Standard Normalized Variate,簡(jiǎn)稱SNV)主要是用來消除由光散射所引起的光譜誤差。SNV校正認(rèn)為,在每一條光譜中各波長(zhǎng)點(diǎn)的吸光度值應(yīng)滿足一定的分布規(guī)律。在這一假設(shè)的前提下,SNV是在原始光譜減去該條光譜曲線的平均光譜值,然后除以該條光譜曲線的標(biāo)準(zhǔn)偏差,其實(shí)質(zhì)是使原始光譜數(shù)據(jù)標(biāo)準(zhǔn)正態(tài)化處理。
2.附加散射校正算法(MSC)
附加散射校正(Multiplicative Scatter Correction,簡(jiǎn)稱MSC)是由Geladi等人提出,其主要目的是通過消除因顆粒大小及顆粒分布不均勻產(chǎn)生的散射影響,增強(qiáng)與成分含量相關(guān)的光譜吸收信息,并獲得較“理想”的光譜。MSC方法認(rèn)為,每一條光譜都應(yīng)該與“理想”的光譜成線性關(guān)系,但真正“理想”的光譜是無(wú)法得到,所以一般用校正集的平均光譜來近似。即,每個(gè)樣品的任意波長(zhǎng)點(diǎn)下的反射吸光度值與其平均光譜的相應(yīng)吸光度的光譜是近似線性關(guān)系,而且可以通過光譜集線性回歸獲得該直線的截距和斜率,并用來校正每條光譜。截距大小可以用來反應(yīng)樣品獨(dú)特反射作用,而斜率大小則用來反映樣品的均勻性。
3.平滑算法(Smoothing)
由光譜儀采集到的光譜信息中常常疊加著很多的隨機(jī)誤差,而平滑算法是常用來消除噪聲的方法。其基本思路是通過多次選取平滑點(diǎn)前后的特定點(diǎn)進(jìn)行平均或擬合來降低噪聲,從而提高信噪比。常用的平滑方法有:Savitzky-Golay卷積平滑法、移動(dòng)平均平滑法和指數(shù)平均平滑。
4.去趨勢(shì)法(De-trending)
去趨勢(shì)算法(De-Trending)一般可以用于消除經(jīng)SNV處理后的光譜的基線漂移,也可以單獨(dú)使用。該算法比較直接,先按多項(xiàng)式將光譜xi的吸光度和波長(zhǎng)擬合出一條趨勢(shì)線di,再?gòu)脑脊庾V中減掉趨勢(shì)線(xi-di)。經(jīng)過去趨勢(shì)法處理后,其波峰和波谷的特征更加明顯。
5.基線校正(Baseline)
在光譜分析中,由于樣品自身的不均性、儀器背景或其他因素等影響,導(dǎo)致所測(cè)樣品的譜圖經(jīng)常會(huì)出現(xiàn)傾斜或漂移現(xiàn)象,若不加處理,會(huì)影響校正模型的性能和對(duì)未知樣品預(yù)測(cè)結(jié)果的準(zhǔn)確性。
高光譜圖像數(shù)據(jù)的特點(diǎn):
1.光譜波段范圍較寬且分辨率較高
傳統(tǒng)R、G、B或黑白圖像的光譜范圍一般都在可見光,波段數(shù)在幾個(gè)至十幾個(gè),而高光譜儀獲得圖像的光譜范圍可以從可見光、近紅外、甚至延伸到中紅外,波段數(shù)可達(dá)到幾十至數(shù)百個(gè),從而形成一條連續(xù)而飽滿的光譜反射率曲線,連續(xù)性較強(qiáng),分辨率在2nm-10nm之間。
2.高光譜圖譜數(shù)據(jù)信息較為豐富
由于高光譜圖像的光譜分辨率較高,波段較寬,由此產(chǎn)生了許多窄波段的光譜信息,這些光譜信息之間關(guān)聯(lián)性較強(qiáng),為高光譜圖像數(shù)據(jù)帶來了大量、豐富的信息。
3.高光譜圖像有較為豐富的數(shù)學(xué)分類模型
高光譜圖像的復(fù)雜性致使它的數(shù)據(jù)模型較為豐富,如圖像分類模型、光譜差異模型、特征提取模型等,使得圖譜數(shù)據(jù)的處理、分析、提取等更加豐富和靈活。