時間:2022-11-09 10:39:19
緒論:在尋找寫作靈感嗎?愛發表網為您精選了1篇紅外光譜模型在農產品及食品中的研究,愿這些內容能夠啟迪您的思維,激發您的創作熱情,歡迎您的閱讀與分享!
引言
近些年來,隨著社會對農產品和食品質量與安全的要求日益增高,傳統的檢測分析方法已經滿足不了目前農產品和食品的發展需要。從生產者角度出發,傳統的檢測方法不僅耗時,而且破壞性的檢測方法導致了檢測的樣品不能再次出售,成本較大,同時由于大部分為抽樣檢測,不能對樣品進行全面檢測,會出現次品漏檢的現象,對于商品的出售產生負面效應。對于大多數消費者而言,由于不具備傳統檢測方法的條件,大部分都以個人經驗以及賣家信譽購買商品,單從商品外表難以獲知其內部品質,導致購買商品的不確定性。同時,對于行業專業人員來講,傳統的檢測方法對于人員操作要求較高,耗時且耗力,不利于方法的普及以及使用[1]。因此生產者、消費者還是行業專業人員越來越意識到開發快速、準確、經濟的檢測手段是十分必要的。近紅外光譜(nearinfraredspectroscopy,NIR)分析具有快速、無污染、成本低以及無損等技術優勢,越來越受到社會的關注。NIR的波長范圍是780~2500nm,該光譜區域主要承載的是含氫基團振動倍頻與合頻特征信息,如O—H,N—H和C—H等含氫基團。由于大部分農產品以及食品由有機分子構成,含有大量的含氫基團,因此近紅外光譜分析技術的應用也是從農業領域起步并慢慢普及。1965年,Norris和Hart[2]首次采用近紅外光譜法對谷物的水分等指標含量進行了檢測。1985年,Birth[3]等開發了一種叫做“Biospect”的近紅外光譜儀,采用其對新鮮洋蔥的干物質含量進行了測定。此后,近紅外光譜分析技術在檢測領域取得了快速的發展,能夠檢測的物料品種以及相關指標也越來越多[4]。與此同時,儀器的種類也根據分析對象的種類、運行條件以及特殊需求等得到了進一步的優化,如離線型、在線型、臺式、手持式以及特制型等[5]。目前為止,近紅外光譜在農產品和食品品質分析的研究以及應用很多[6],但大多數只對于一種物料建立近紅外專用數學模型。由于農產品和食品的種類眾多,應對這種情況,運用傳統的近紅外分析方法無疑會增加建模的工作量。一般差異較大的物料是難以進行模型通用的。然而近些年來,一些專家和學者嘗試建立近紅外通用模型,即建立一個近紅外通用模型,能夠對多種物料的同一指標或多種指標進行檢測。雖說這類通用模型與傳統模型相比,精確度有所下降,但該類模型不僅具有建模成本低、工作量小等優勢,而且若模型預測結果能滿足實際應用要求,也使近紅外光譜技術在農產品和食品領域中的應用具有很大的推廣意義。針對農產品和食品近紅外光譜通用模型在建模過程中樣品信息的獲取、模型的建立以及樣品信息的預測三個步驟中的研究進行綜述,對使用的方法進行歸納總結,提出對于通用模型開發與研究的一些建議,并就近紅外光譜通用模型預測方法在檢測領域的發展趨勢做進一步展望。
1通用模型樣品信息的獲取
近紅外光譜分析法的樣品信息獲取包括采集樣品的光譜和測定樣品的指標,這些信息中包含樣品的確定信息和不確定信息。確定信息決定了模型的關系信息,即光譜與指標之間的關系,不確定信息決定了模型的適用范圍,即關系信息之外的一些影響因素,這兩種信息影響模型的準確性和穩健性[7]。根據通用模型的目的不同,獲取樣品信息的側重點也不同,如不同地域、不同批次、不同年份、不同溫度、不同加工方法、不同成分組成甚至是不同品種。王燕妮[8]等采用近紅外光譜分析法,首先將8種飼料原料(菜粕、DDGS、豆粕、麩皮、棉粕、小麥、玉米和雜粕)研磨后并過0.75mm篩,然后采集粉末狀飼料原料的近紅外漫反射光譜,然后測定了這些飼料原料的粗蛋白、粗脂肪和粗纖維3種組分的指標含量,利用偏最小二乘法(partialleast-squaresregression,PLS)算法,建立了能夠對8種飼料原料的3個指標進行預測的通用檢測模型,通過比較其結果顯示,通用模型的檢測結果與單獨模型的檢測檢測結果差異不大,并且能滿足實際生產需要。PiyamartJannok[9]等利用手持式短波可見近紅外光譜儀分別采集了蘋果、梨、柿子三種水果的漫透射光譜后,測得三種水果的可溶性固形物(sol-ublesolidscontent,SSC),同樣運用PLS算法建立了一種通用模型,該模型實現對蘋果、梨與柿子的SSC進行通用預測。通過與單獨品種模型的預測標準偏差(standarderrorofprediction,SEP)的范圍(SEP=0.34~0.40°Brix)對比,通用模型的SEP(0.43°Brix)雖有所下降,但仍滿足檢測要求。該研究表明,即便品種不同,但質構相似的薄皮水果是可以建立通用模型來預測相關品質指標的。Fan[10]等考察了利用近紅外光譜儀采集蘋果不同部位(赤道處、花萼處、柄附近處)的光譜分別建立SSC定量模型,發現赤道位置采集光譜建立的SSC定量模型只能對本位置采集的蘋果光譜進行有效的預測SSC含量,其他兩個部位建立的SSC模型也有相似的結果。為了解決這一問題,該課題組將三個部位采集的信息合并,共同建立一個模型,即“位置通用模型”。結果顯示,位置通用模型對赤道處、花萼處、柄附近處果肉SSC的SEP分別為0.386°Brix,0.486°Brix和0.409°Brix,預測相關系數為0.977,0.955和0.977。說明該種方法能夠有效減少由于采集信息的位置不同導致的預測誤差。上述研究可知,通用模型的信息獲取可以說是通過一些“校正”與“包容”的思維來攻破模型通用的難題,即在影響模型準確性和穩健性不大的前提下,滿足檢測的要求,提高模型的適用性。
2通用模型的建立
當物料的光譜信息以及待測指采集之后,需要建立兩者之間的數學關系,即建立模型。相對于傳統的近紅外分析模型,通用模型的建立在樣本集篩選、光譜預處理、變量選擇以及建模方法上都需要考慮由于不同地域、年份、溫度、成分組成以及品種等因素的復雜性產生的影響。
2.1通用模型樣本集的篩選
樣本篩選是將采集的樣本信息分為校正集與驗證集。當樣本集中的樣品數足夠多且具有代表性、參數分布均勻以及性質范圍應包含待測樣品等時,預測模型的準確性和穩健性才能滿足一定的檢測需求。對于通用模型而言,更需要保證模型的適用性,因此通用模型樣本集的篩選相對復雜。Kennard-Stone(KS)[11]方法是樣本集篩選中最為常用的一種分類方法,該種方法根據光譜特征進行選取。Wang[12]等首先采集五個品種(RedComice,Wujiuxiang,Abate,Cas-cade,Conference)洋梨的漫透射光譜以及光譜采集對應位置的SSC與果肉硬度值,每個品種約94~96個樣本信息,通過KS方法把各個品種樣本信息按照三比一的比例分為校正集與驗證集,隨后將分離后的各個品種的校正集和驗證集合并組成一個新的校正集(358個)和驗證集(118個)。經統計,SSC與果肉硬度的新校正集的指標范圍分別為11.3%~18.5%,1.9~71.2N,驗證集的指標范圍分別為11.6%~18.0%,3.5~66.5N。最后運用多元線性回歸(multiplelin-earregression,MLR)算法建立了洋梨的SSC通用預測模型,用PLS法建立果肉硬度的通用檢測模型。結果顯示,SSC與硬度通用模型的預測決定系數分別為0.87與0.66,SEP分別為0.45%和8.11N,該通用模型具有一定的應用潛力。Setpartitioningbasedonjointx-ydistance(SPXY)法[13]是在KS方法的基礎上演變而來的一種新的樣本篩選方法,該方法考慮了樣本的光譜特征以及對應的指標兩種因素,進而對樣本信息進行篩選。馬卉[14]等采集了五種藥材飲片(黃芩、梔子、板藍根、黃柏、胖大海)的近紅外光譜,并測定了五種藥材的水分含量,同樣用Wang的方法,運用SPXY距離劃分法將五種藥材的樣本信息劃分為校正集與驗證集。經統計顯示,該方法劃分的校正集含水量范圍涵蓋驗證集,證明劃分的校正集具有良好的代表性,有利于建立這五種藥材飲片水分含量的通用檢測模型。常冬[15]等通過建立四種不同飼料原料的淀粉含量通用定量檢測模型時發現,通過KS方法篩選的通用模型樣本集比單個品種的分布范圍更加廣泛,通用模型的評價參數甚至要好于獨立模型。通過以上研究可以推斷,無論使用哪種樣本篩選方法,應先將獨立對象的樣本按照一定比例進行校正集和驗證集的預篩選,然后將各自篩選出來的校正集與驗證集進行整合后,校正集和樣本集的分布數據更佳合理,建模效果較好。
2.2通用模型的光譜預處理方式
采集后的光譜信息除了含有樣品自身的有效信息外,還包含其他無效信息,以及對建立模型產生負面效應的信息,如噪聲、背景以及雜散光等。在建立通用模型時,由于樣本具有地域、時間、大小以及品種的多樣性導致的光譜多樣性也會對建立通用模型帶來不利。因此如何使用有效的方法對光譜進行處理,是建立通用模型時需要考慮的問題。常見的光譜預處理方法有均值中心化、標準化、歸一化、平滑、導數、標準正態變量變換、多元線性校正、傅里葉變換、小波變換、正交信號校正以及凈分析信號等[16]。Liu[17]等運用可見/近紅外光譜便攜儀分別采集了蘋果、梨、桃三種水果的光譜信息,積分時間分別為100,90和60ms,然后測得SSC值,并建立三種水果的SSC通用定量檢測模型。研究發現,首先通過標準正態變量變換處理,能夠在一定程度上消除水果大小以及內部果肉顆粒造成的散射影響,Savitzky-Golay平滑處理能夠消除一些高頻噪聲,二階導數處理能夠消除由于采集光譜積分時間不同導致的基線漂移現象,經過上述三種光譜預處理之后,三種水果的光譜在840~920nm波長范圍內表現出良好的光譜一致性,在這個波段范圍嘗試PLS以及MLR兩種建模方法進行通用模型的建立。結果顯示,PLS通用模型的預測決定系數和SEP分別為0.97和0.45°Brix,MLR通用模型的預測決定系數和SEP分別為0.96和0.46°Brix,模型均達到了一定的預測要求。彭丹等[18]采集了不同原料(大豆和菜籽)的不同等級油的近紅外光譜,共建立了四種油的過氧化值通用檢測模型,即不同等級的大豆油、不同等級的菜籽油以及兩種同一等級但原料不同的食用油。結果顯示,通過二階導數處理后的光譜建立的一級油的通用模型效果最好,其推測二階導數處理能夠消除基線以及背景干擾,提高有效信息的表達,有利于建立通用模型。Saranwong等[19]建立近紅外光譜通用模型,考察該模型對兩種芒果是否被果蠅的蟲卵幼蟲侵染進行無損檢測。結果表明,采集后的光譜進行二階導處理,能夠有效的表征兩種芒果正常儲藏和被果蠅蟲卵及幼蟲侵染后的果實品質的變化,建立的偏最小二乘法判別通用模型能夠對兩種芒果是否被果蠅蟲卵及幼蟲侵染進行正確判別,即芒果被蠅蟲卵及幼蟲侵染后48h,校正集判別假負率和判別假正率均為1.1%,驗證集判別假負率為6.2%,判別假正率為1.2%。Li等[20]使用AntarisⅡ近紅外分光光度計半透反射模式掃描三種不同等級蜂蜜近紅外光譜,并通過高效液相色譜法測定蜂蜜的水分、5-羥甲基糠醛、果糖和葡萄糖含量,建立三種等級蜂蜜的指標定量預測的通用模型。結果顯示,在建立水分、5-羥甲基糠醛和果糖三種指標的通用定量模型時,采用一階導數、Savitzky-Golay平滑與多元散射校正的光譜預處理組合方式,模型效果最好。對于葡萄糖模型,僅使用一階導數的光譜預處理方式效果最佳。通過上述研究推斷,建立近紅外光譜模型時,對采集的光譜信息運用預處理手段可以消除噪聲以及背景的信息,提高有效信息。同時在建立通用模型時,適當選取某些波段再進行光譜預處理,還能消除由于樣品多樣性產生的光譜不一致性,利于建立通用模型。
2.3通用模型的變量選擇
光譜分析法建立的模型在對樣品進行分析時,由于光譜的數據量越來越大,也會產生一些該技術在農產品及食品品質高通量無損快速檢測需求的不利因素,其主要表現為增加計算成本、對儀器硬件要求較高以及工作效率低等方面[21]。因此,近些年來,大量的研究工作專注于變量選擇,篩選后的有效信息用于建立變量少的數學模型。由于采集光譜使用的儀器、采集方式等不同,導致了光譜的表觀形式不同,光譜預處理也具有放大信號的作用,即放大了由于品種、產地、加工方式等產生的光譜差異,這些因素對于建立近紅外通用模型是不利的。因此相比于傳統的模型,通用模型具有更加多樣化的樣本信息,選擇有效、少且全的變量信息是一個相對復雜的研究課題。Li等[22]采用便攜式可見近紅外光譜儀分別采集了三種甜瓜(瑪瑙、金紅寶、西州蜜)兩個部位(赤道部位、花萼部位)處的可見近紅外漫透射光譜,光譜范圍是550~1100nm,檢測對應部位的SSC值,建立三種甜瓜SSC的通用模型。結果顯示,采集的三種甜瓜的光譜,由于品種以及采集部位不同,原始光譜的特征差異較大,為了消除基線以及甜瓜表面紋路的影響,采用的多元散射校正、Savitzky-Golay平滑以及一階導數的光譜預處理方式,處理后光譜范圍在550~749nm的光譜差異較大,這是由于甜瓜表面顏色不同導致的,而在750~950nm處的光譜一致性較好。因此在750~950nm范圍內運用競爭性自適應重加權算法(competi-tiveadaptivereweightedsampling,CARS)僅選?。玻磦€變量,建立的PLS通用模型能夠具備一定的應用潛力(RMSEP=0.73°Brix,R2p=0.83)。有研究先將三種糧食樣品經過粉碎處理,再通過18目篩后進行光譜掃描,通過物理方法消除了由于顆粒大小造成的影響,光譜與水分含量測定后,分別運用蒙特卡洛無信息變量消除算法(Montecarlouninformativevariableelimination,MCUVE)與蒙特卡洛無信息變量消除算法與連續投影算法聯用算法MCUVE-SPA(Montecarlouninformativevariableeliminationsuccessiveprojectionsalgo-rithm,MCUVE-SPA)對光譜的變量進行篩選后,建立具有對糧食水分進行預測的通用定量模型。相比于原始變量(127個),MCUVE與篩選的變量分別為18和7個,經歷了變量篩選后的建立的模型仍可滿足需求。周婷等[23]采集了7個不同批次的溫州蜜桔的光譜信息(200~1100nm),建立SSC模型,光譜經過預處理后,選取230~950nm波段范圍建立模型,同時采用無信息消除變量法(uninformativevariablelimination,UVE)、CARS法以及UVE-CARS組合的方法建立SSC的PLS通用定量模型。結果表明,通過UVE-CARS方法選取的變量數目最少,僅34個變量,模型的預測效果最佳,即Rcv=0.704,RMSECV=0.949%,Rp=0.732,RMSEP=0.873%。經上述研究可推測,通用模型建立時,變量篩選需先通過物理、化學以及化學計量學方法消除其他因素干擾,選取合適的建模波段范圍作為基礎,再通過算法選出變量進行建模,效果較好。2.4通用模型的建模方法近紅外光譜分析法中常用的定量方法有多元線性回歸法、主成分回歸法、偏最小二乘法等一些線性校正方法,同時還有人工神經網絡以及支持向量機等非線性校正方法[24]。目前來說,PLS方法在近紅外光譜分析法中應用最為廣泛,逐漸成為一種標準的常用方法,而一些非線性方法的應用也逐漸增多[25]。Pocwiardowski等[26]運用近紅外光譜儀采集了五種蔬菜種子的近紅外光譜,使用PLS法建立了五種蔬菜種子的水分含量的通用預測模型,結果顯示,校正模型的相關系數為0.9968,Q系數[27]達到0.8904(Q系數大于0.7,表明該模型預測性能較好)。Torres等[28]使用微型光譜儀采集了兩個柑橘品種(Oranges和Mandarins)光譜,測得兩種柑橘的顏色指數(L*,a*,b*,C*,h*,比色指數)、硬度、果皮、縱徑、橫徑、重量、厚度以及果汁質量,比較使用線性回歸方程(PLS法)與非線性方程(non-linearregressiontechniques,LOCAL算法[29])建立兩種柑橘水果模型的結果,其顯示使用LOCAL算法建立的各個指標通用模型效果均比PLS法更佳。Huang等[30]使用可見近紅外光譜儀采集了三種茶葉、六個部位的光譜信息,并測得四種主要兒茶素和咖啡因含量,分別用不同的建模方法建立了通用定量模型。結果顯示,使用MLR方法建立的四種兒茶素的通用定量模型效果最好,模型的相關系數分別為0.949,0.893,0.968和0.931,使用PLS法建立的咖啡因的通用定量模型效果最好,模型的相關系數為0.917。經上述研究可知,無論是線性校正方法還是非線性校正方法,都能建立通用模型。
3通用模型樣品信息的預測
隨著近紅外技術使用環境的多樣化,比如環境的溫度、濕度、儀器臺間差、待測樣本狀態等,使得采集的光譜產生差異等因素,給使用建立好的通用模型對未知樣品信息的預測帶來困難。為了解決這一問題,模型傳遞的研究也是近期研究的熱點[31],同時該方法的研究也為實現模型的通用開辟了新的道路。Wongsaipun等[32]首先建立了泰國茉莉香米摻假的偏最小二乘判別模型,隨后采用正交投影算法[33]提取泰國茉莉香米的變量,再通過模型傳遞對未知摻假樣品的近紅外光譜進行校正,使其在模型的預測范圍之內,相比于之前未進行模型傳遞的模型,預測值RMESP值降低,Q2值提高。這種方法不僅實現了對泰國茉莉香米是否摻假的量化檢測,同時也降低了建立模型的成本,實現了模型的通用。李小昱等[34]應用模型傳遞的方法,實現了不同品種豬肉pH值的近紅外定量預測模型的通用。該課題組先建立了山黑豬豬肉pH值的近紅外光譜PLS定量模型,隨后使用光譜值校正傳遞算法消除了山黑豬豬肉與零號土豬豬肉之間的光譜差異,進而對零號土豬豬肉的pH值進行預測,模型傳遞后的預測相關系數為0.837,相比沒有傳遞之前提高了101.69%,模型傳遞后的預測均方根誤差為0.0856,相比沒有傳遞之前降低了52.55%,研究表明校正后模型的預測效果均達到應用水平。近些年來,互聯網、大數據、云服務等技術不斷興起,通過將這些新興技術與近紅外光譜技術快速、便捷、無損的特點相結合,為新農業發展提供了思路。郭志明等[35]通過研發低成本、低能耗、小型的蘋果手持便攜儀器采集光譜信息,通過物聯網云端數據庫實現對蘋果品質的數據傳輸以及遠程維護,建立了17個產區富士蘋果的SSC、硬度以及維生素C含量的通用定量檢測模型,并對兩個地區的蘋果(陜西洛川和甘肅天水)的進行預測,其獨立預測相關系數Ri平均值分別為0.931,0.794和0.755,獨立預測均方根誤差平均值分別為0.596%,1.563kg?cm-2和0.942mg?(100g)-1,結果顯示該系統可以將通用模型與云服務技術相結合,對蘋果的品質進行預測。綜上所述,隨著新技術的發展,某些通用模型對樣品信息的預測已經突破了傳統形式上的模型預測方式,這種將無損快速檢測技術與其他新興技術有機地結合起來運用到農產品與食品的研究成果,也為未來通用模型的開發與利用提供了新的探索方向。
4結論
農產品和食品的質量與安全與人們的日常生活息息相關,需求量大且種類多給農產品和食品品質檢測帶來了巨大的工作量。近紅外光譜由于其速度快、靈敏度高、采樣方式靈活多變以及無損檢測等技術優勢,已經在農產品以及食品品質檢測領域占有一席之地。目前,大多數研究是針對于某種特定情況下對某一種物料進行檢測。但在實際生活中,面對不同地域、不同年份、不同溫度、不同加工方法、不同成分組成甚至是不同品種的農產品以及食品,傳統的近紅外光譜“一對一”式模型已經滿足不了該項技術在農產品與食品領域的產業化應用。隨著計算機技術、光譜儀硬件、化學計量學以及互聯網技術的發展,一部分學者已經開始著手于近紅外光譜通用型模型的研究與開發。然而,近紅外光譜通用型模型在農產品以及食品品質檢測方面的研究尚處于發展階段,還存在著一些問題,主要體現在以下方面。(1)目前通用型模型研究的農產品以及食品種類不多,至今報道的文獻仍然相對較少,主要集中在果蔬與糧油的品質檢測,而且該項技術應用還不廣泛。(2)目前通用型模型主要應用在定量檢測,對于用于定性檢測的通用模型研究相對比較少。(3)建立通用型模型時,建模方法主要以多元線性回歸以及偏最小二乘法居多,其他的建模方法相對較少,應用也不多。(4)通用型模型建立的機理研究尚不深入。采用近紅外光譜技術建立通用型模型對農產品以及食品品質進行檢測尚處于科學研究階段,應用相對較少。結合通用型模型的優點,改進的預測方法必然是未來檢測領域的趨勢。同時,近紅外光譜通用性模型的建立也為其他方式無損檢測通用型模型的研究與開發提供新的思路。
作者:李明 韓東海 魯丁強 魯曉翔 柴春祥 劉文 孫柯璇 單位:天津商業大學生物技術與食品科學學院 中國農業大學食品科學與營養工程學院 湘潭大學化工學院