soybean seeds and their hybrid descendants using multispectral imaging and chemometric methods
利用Videometer多光譜成像和化學計量學方法對常規抗草甘膦大豆種子及其雜交后代進行無損鑒別
摘要:大豆是一種重要的產油和蛋白質作物,在過去的幾十年中,大豆遺傳轉化取得了長足的進步。盡管在田間很難區分常規和轉基因大豆種子及其雜交后代,但應評估轉基因流發生的可能性。通過多光譜成像系統結合化學計量學方法,對常規和抗草甘膦大豆種子及其雜交后代進行非破壞性區分的可行性進行了檢驗。應用主成分分析(PCA)、偏最小二乘判別分析(PLSDA)、最小二乘支持向量機(LS-SVM)和反向傳播神經網絡(BPNN)方法對大豆種子進行分類。目前的結果表明,常規和抗草甘膦大豆種子及其雜交后代之間的明顯差異可以很容易地可視化,并且可以實現出色的分類(BPNN 模型為 98%)。結論是,多光譜成像與化學計量學方法相結合將是一種高效鑒定轉基因大豆種子的有前途的技術。
圖1.多光譜成像系統的主要設置
圖2.來自常規(丸豆28)和抗草甘膦(DP4546RR)大豆種子及其雜交后代(DP4546RR × 丸豆 28)的多光譜圖像的平均光譜
在405-970nm范圍內收集光譜,包括可見光和NIR區域的較低波長。圖2顯示了作為整個數據集的200個常規(皖豆 28)和200個抗草甘膦(DP4546RR)大豆種子及其200個雜交后代(DP4546RR × 皖豆 28)的平均光譜。顯然,除了光譜的一些細微變化外,所有光譜的總體趨勢非常相似,反映了大豆種子中數百種物理和化學成分之間的差異,由樣品的光譜帶和種子顏色表示。 VideometerLab 測量的主要是大豆種子的表面。可見范圍的差異是由于樣品在整個可見顏色光譜范圍內的顏色特征。此外,近紅外(NIR) 區域的差異可歸因于常規和抗草甘膦大豆種子及其雜交后代之間的化學差異。圖3顯示了用于區分常規和抗草甘膦大豆種子及其雜交后代的最相關波長的圖像。由于大豆種子中的成分較多,因此很難根據化學成分確定光譜差異。此外,在可見光和近紅外范圍內都觀察到了成分差異,可用于定性分類。這種現象可能有多種來源;因此,使用了多元分類模型。
圖3.用于區分抗草甘膦(DP4546RR,左)和常規(皖豆 28,中)大豆種子及其雜交后代(DP4546RR × 皖豆 28,右)的最相關波長的圖像
圖4.常規(皖豆28)和抗草甘膦(DP4546RR)大豆種子及其雜交后代(DP4546RR×皖豆28)前三個主成分的三維得分圖,光譜數據集(a),以及組合的光譜和形態特征數據 設置(b)
最初進行PCA是為了檢查常規和抗草甘膦大豆種子及其雜交后代在主成分(PC)空間中的質量差異。200個常規和200個抗草甘膦大豆種子及其200個雜交后代的所有光譜都用于PCA。圖4顯示了使用前三個評分向量的三維PC評分圖,PC1、PC2和PC3來自光譜數據以及樣本的組合光譜和形態特征數據。最初的三個因素占光譜變化的大部分(光譜數據集和組合光譜和形態特征數據集分別為 97·37 和 94·29%),用于使區分更加清晰。發現常規和抗草甘膦大豆種子明顯用組合的光譜和形態特征數據從三維 PCA 空間中的混合后代中分離出來。這些結果表明,區分常規和抗草甘膦大豆種子及其雜交后代是可能的,并且樣品的不同光譜屬性與樣品的特征相關。此外,一個特征加權算法(ReliefF)用于識別主要特征。結果表明,前五個主要特征是獵人 a* 和 b*、面積以及 660 和 470 nm 的光譜帶。值得一提的是,光譜帶和形狀特征在區分常規和抗草甘膦大豆種子及其雜交后代方面很重要。
圖5.使用PLSDA模型和光譜數據集 (a) 以及光譜和形態學的組合,繪制了常規(Wandou 28)和抗草甘膦(DP4546RR)大豆種子及其雜交后代(DP4546RR × Wandou 28)的實際與計算值圖 驗證集中的特征數據集 (b)
對于PLSDA,基于最小分類誤差,發現LV的數量為8。圖5顯示了使用PLSDA模型與光譜數據(圖5(a))以及驗證集中的組合光譜和形態特征數據(圖5(b))對大豆種子類型的預測。結果表明,PLSDA 模型結合多光譜成像獲得了足夠的信息來區分常規和抗草甘膦大豆種子及其雜交后代樣本。使用光譜數據和組合光譜和形態特征數據的預測準確度的平均值分別為72%和73·33%。