scholarly journals Cultivar Discrimination of Single Alfalfa (Medicago sativa L.) Seed via Multispectral Imaging Combined with Multivariate Analysis

Sensors ◽  
2020 ◽  
Vol 20 (22) ◽  
pp. 6575
Author(s):  
Lingjie Yang ◽  
Zuxin Zhang ◽  
Xiaowen Hu

Rapid and accurate discrimination of alfalfa cultivars is crucial for producers, consumers, and market regulators. However, the conventional routine of alfalfa cultivars discrimination is time-consuming and labor-intensive. In this study, the potential of a new method was evaluated that used multispectral imaging combined with object-wise multivariate image analysis to distinguish alfalfa cultivars with a single seed. Three multivariate analysis methods including principal component analysis (PCA), linear discrimination analysis (LDA), and support vector machines (SVM) were applied to distinguish seeds of 12 alfalfa cultivars based on their morphological and spectral traits. The results showed that the combination of morphological features and spectral data could provide an exceedingly concise process to classify alfalfa seeds of different cultivars with multivariate analysis, while it failed to make the classification with only seed morphological features. Seed classification accuracy of the testing sets was 91.53% for LDA, and 93.47% for SVM. Thus, multispectral imaging combined with multivariate analysis could provide a simple, robust and nondestructive method to distinguish alfalfa seed cultivars.

2020 ◽  
Vol 48 (1) ◽  
pp. 83-99 ◽  
Author(s):  
Xiaowen Hu ◽  
Lingjie Yang ◽  
Zuxin Zhang ◽  
Yanrong Wang

It is hard to remove sweet clover seeds from alfalfa seed lots by conventional methods, affecting the purity of seed lots and resulting losses in for alfalfa hay production as well as seed yield. However, the discrimination of sweet clover seed contaminates in alfalfa seed lots is difficult without special training. In this study, multispectral imaging with object-wise multivariate image analysis was evaluated for its potential to separate sweet clover and alfalfa seeds. Principal component analysis (PCA), linear discrimination analysis (LDA), partial least squares discriminant analysis (PLSDA), AdaBoost and support vector machine (SVM) methods were applied to classify seeds of sweet clover and alfalfa according to their morphological features and spectral traits or a combination thereof. The results showed that an excellent classification could be achieved based on a combination of morphological features and spectral data in a tested data set. Seed classification accuracy was up to 99.58% in a validation set with the LDA model, which was better than the PLSDA (68.19%), AdaBoost (96.95%) and SVM (98.47%) models. Thus, multispectral imaging together with chemometric multivariate analysis is a promising technique to identify sweet clover seeds in alfalfa seed lots with high efficiency.


2017 ◽  
Author(s):  
Αθηνά Ροπόδη

Τη σημερινή εποχή, οι καταναλωτές απαιτούν συνεχή επιβεβαίωση της προέλευσης, της ποιότητας και της συμμόρφωσης με την ετικέτα των τροφίμων που αγοράζουν. Για το λόγο αυτό, οι βιομηχανίες τροφίμων, οι έμποροι και οι αρχές είναι αναγκαίο να αναπτύξουν προηγμένες, αποτελεσματικές και χαμηλού κόστους λύσεις για τη διασφάλιση της ποιότητας και τον εντοπισμό δόλιων πρακτικών. Σε αυτό το πλαίσιο, η μελέτη αυτή εστιάζει (α) στην πολυφασματική απεικόνιση (Multispectral Imaging-MSI), (β) την φασματοσκοπία υπέρυθρου με μετασχηματισμό Fourier (Fourier Transform Infrared -FTIR spectrometry) και (γ) την εφαρμογή προηγμένων μεθόδων ανάλυσης δεδομένων και μηχανικής μάθησης. Όσον αφορά την ποιότητα, εξετάστηκε η αποτελεσματικότητα των προαναφερόμενων μεθόδων σε σχέση με (α) τον εντοπισμό της μη-συμμόρφωσης με την ετικέτα ή/και δόλιων πρακτικών και (β) τη μικροβιολογική αλλοίωση. Οι ακόλουθες αναλύσεις, έλαβαν χώρα:Στην 1η περίπτωση, εξετάστηκε η νοθεία του μοσχαρίσιου κιμά με χοιρινό. Χρησιμοποιήθηκαν 220 πολυφασματικές εικόνες δειγμάτων από 4 ανεξάρτητες πειραματικές διαδικασίες (κομμάτια κρέατος διαφορετικής προέλευσης). Η νοθεία έγινε με βήμα 10% w/w, δημιουργώντας 11 κατηγορίες (συμπεριλαμβανομένων των ανόθευτων χοιρινών και μοσχαρίσιων δειγμάτων). Μετά από ένα στάδιο προεπεξεργασίας της εικόνας, εφαρμόστηκαν η Ιεραρχική Ανάλυση Συστάδων (Hierarchical Cluster Analysis - HCA) και Ανάλυση Κυρίων Συνιστωσών (Principal Component Analysis - PCA). Παρατηρήθηκαν δε σημαντικές διαφορές μεταξύ των διαφορετικών κομματιών κρέατος και των διαφορετικών κλάσεων όταν και τα τρία πρώτα ζευγάρια κομματιών κρέατος συμπεριλήφθηκαν στην ανάλυση. Μετά την κατάτμηση των δεδομένων σε σετ εκπαίδευσης και επικύρωσης, τα δεδομένα του τέταρτου ζεύγους χρησιμοποιήθηκαν για ανεξάρτητη επικύρωση και εφαρμόστηκαν οι μέθοδοι Γραμμικής Διακριτικής Ανάλυσης και Μερικών Ελαχίστων Τετραγώνων Linear Discriminant Analysis - LDA, Partial least-squares discriminant analysis – PLSDA) για 11 και για 3 (ανόθευτα χοιρινά, μοσχαρίσια και νοθευμένα) κλάσεις. Στην περίπτωση των 11 κλάσεων, 98.48% και 96.97% των δειγμάτων κατηγοριοποιήθηκαν εντός μιας ±10% κατηγορίας για LDA και PLSDA αντίστοιχα, ενώ στην περίπτωση των τριών επιτεύχθηκε σωστή κατηγοριοποίηση 98.48%. Τα αποτελέσματα της ανεξάρτητης επικύρωσης ήταν λιγότερο ακριβή για την LDA, αλλά με την PLSDA όλα τα δείγματα κατηγοριοποιήθηκαν σωστά, αποδεικνύοντας ότι το ποσοστό 10% είναι εντός των ορίων ανίχνευσης.Στην δεύτερη περίπτωση, 110 δείγματα κιμά τριών διαφορετικών κομματιών κρέατος από μοσχάρι και άλογο και επιπλέον εικόνες που ελήφθησαν μετά από 6, 24 και 48 ώρες χρησιμοποιήθηκαν για την ανίχνευση νοθείας. Η PCA χρησιμοποιήθηκε για οπτικοποίηση των δεδομένων, ενώ οι μέθοδοι PLSDA και Random Forest (RF) για κατηγοριοποίηση μεταξύ διαφορετικών ποσοστών νοθείας (4 κλάσεις), ανόθευτων μοσχαρίσιων, ανόθευτων αλογίσιων και νοθευμένων, ανόθευτων και νοθευμένων, και τέλος μεταξύ φρέσκων και συντηρημένων δειγμάτων. Τα μοντέλα κατά την ανεξάρτητη επικύρωση δεν είχαν υψηλή ακρίβεια. Στο τέλος, προτιμήθηκε η χρήση μηχανών διανυσμάτων υποστήριξης (Support Vector Machines – SVMs) σε δύο στάδια προκειμένου να διαχωριστούν τα φρέσκα από τα συντηρημένα δείγματα και μετά τα νοθευμένα από τα ανόθευτα. Έτσι, επιτεύχθηκε ποσοστό σωστής κατηγοριοποίησης 95.31% στο ανεξάρτητο σετ επικύρωσης.Στην τρίτη περίπτωση, ελήφθησαν πολυφασματικές εικόνες και φάσματα FTIR από κιμά επτά διαφορετικών κομματιών και από αντίστοιχα αποψυγμένα δείγματα που είχαν καταψυχθεί στους -20°C για 7 και 32 μέρες (συνολικά 105 εικόνες και φάσματα). Η PCA χρησιμοποιήθηκε για τη διερεύνηση των δεδομένων, ενώ PLSDA και SVM πέτυχαν 100% σωστή κατηγοριοποίηση μεταξύ φρέσκων και αποψυγμένων κατά την επικύρωση και την ανεξάρτητη επικύρωση με χρήση πολυφασματικών εικόνων. Η FTIR ήταν λιγότερο ακριβής με 93.3 και 96.7% αντίστοιχα.Στην 4η και 5η περίπτωση, διερευνήθηκε η αλλοίωση του βοδινού κιμά. Στην 4η περίπτωση, χρησιμοποιώντας τη διαδικτυακή εφαρμογή “MeatReg”, χρησιμοποιήθηκαν επτά διαφορετικές μέθοδοι για την εκτίμηση του μικροβιακού πληθυσμού. Τα δεδομένα αποτελούνταν από 105 δείγματα συντηρημένα σε δυο διαφορετικές συσκευασίες -αέρας και modified air packaging (MAP - 20% CO2/ 80% O2)- και δύο θερμοκρασίες (4 και 10°C), μικροβιολογικές αναλύσεις (Pseudomonads, Lactobacilli, B. thermosphacta and Enterobacteriaceae, Ολική Μεσόφιλη Χλωρίδα - ΟΜΧ). Τα δεδομένα πολυφασματικής απεικόνισης και FTIR συγκρίθηκαν με αυτά από ηλεκτρονική μύτη, υγρή χρωματογραφία υψηλής απόδοσης (HPLC) και αέρια χρωματογραφία/ φασματοσκοπία μάζας (GC-MS). Τα αποτελέσματα διαφοροποιήθηκαν αρκετά ανάλογα το είδος του οργάνου και της ομάδας μικροοργανισμών. Παρόλα αυτά υπήρξε καλή ακρίβεια, με την μέθοδο RF να δίνει τα καλύτερα αποτελέσματα.Ομοίως στην 5η περίπτωση, 168 δείγματα βοδινού κιμά αναλύθηκαν ως προς την ΟΜΧ, ενώ παράλληλα έγιναν μετρήσεις FTIR. Τα δείγματα είχαν συντηρηθεί σε αέρα και MAP στους 4 και 10°C. Χρησιμοποιήθηκε μία προσέγγιση βασισμένη στην μεθοδολογία των ensemble μοντέλων, όπου η εκτίμηση της αλλοίωσης έγινε βάσει μίας μίξης αποτελεσμάτων επιμέρους νευρωνικών δικτύων (artificial neural networks). Το μέσο τετραγωνικό σφάλμα της πρόβλεψης ήταν 0.16 (log CFU/g)^2.


Sensors ◽  
2021 ◽  
Vol 21 (17) ◽  
pp. 5804
Author(s):  
Xuemeng Wang ◽  
Han Zhang ◽  
Rui Song ◽  
Xin He ◽  
Peisheng Mao ◽  
...  

Seed aging detection and viable seed prediction are of great significance in alfalfa seed production, but traditional methods are disposable and destructive. Therefore, the establishment of a rapid and non-destructive seed screening method is necessary in seed industry and research. In this study, we used multispectral imaging technology to collect morphological features and spectral traits of aging alfalfa seeds with different storage years. Then, we employed five multivariate analysis methods, i.e., principal component analysis (PCA), linear discrimination analysis (LDA), support vector machines (SVM), random forest (RF) and normalized canonical discriminant analysis (nCDA) to predict aged and viable seeds. The results revealed that the mean light reflectance was significantly different at 450~690 nm between non-aged and aged seeds. LDA model held high accuracy (99.8~100.0%) in distinguishing aged seeds from non-aged seeds, higher than those of SVM (87.4~99.3%) and RF (84.6~99.3%). Furthermore, dead seeds could be distinguished from the aged seeds, with accuracies of 69.7%, 72.0% and 97.6% in RF, SVM and LDA, respectively. The accuracy of nCDA in predicting the germination of aged seeds ranged from 75.0% to 100.0%. In summary, we described a nondestructive, rapid and high-throughput approach to screen aged seeds with various viabilities in alfalfa.


Sensors ◽  
2019 ◽  
Vol 19 (20) ◽  
pp. 4523 ◽  
Author(s):  
Carlos Cabo ◽  
Celestino Ordóñez ◽  
Fernando Sáchez-Lasheras ◽  
Javier Roca-Pardiñas ◽  
and Javier de Cos-Juez

We analyze the utility of multiscale supervised classification algorithms for object detection and extraction from laser scanning or photogrammetric point clouds. Only the geometric information (the point coordinates) was considered, thus making the method independent of the systems used to collect the data. A maximum of five features (input variables) was used, four of them related to the eigenvalues obtained from a principal component analysis (PCA). PCA was carried out at six scales, defined by the diameter of a sphere around each observation. Four multiclass supervised classification models were tested (linear discriminant analysis, logistic regression, support vector machines, and random forest) in two different scenarios, urban and forest, formed by artificial and natural objects, respectively. The results obtained were accurate (overall accuracy over 80% for the urban dataset, and over 93% for the forest dataset), in the range of the best results found in the literature, regardless of the classification method. For both datasets, the random forest algorithm provided the best solution/results when discrimination capacity, computing time, and the ability to estimate the relative importance of each variable are considered together.


2015 ◽  
Vol 2015 ◽  
pp. 1-8 ◽  
Author(s):  
Oliver Kramer

Cascade support vector machines have been introduced as extension of classic support vector machines that allow a fast training on large data sets. In this work, we combine cascade support vector machines with dimensionality reduction based preprocessing. The cascade principle allows fast learning based on the division of the training set into subsets and the union of cascade learning results based on support vectors in each cascade level. The combination with dimensionality reduction as preprocessing results in a significant speedup, often without loss of classifier accuracies, while considering the high-dimensional pendants of the low-dimensional support vectors in each new cascade level. We analyze and compare various instantiations of dimensionality reduction preprocessing and cascade SVMs with principal component analysis, locally linear embedding, and isometric mapping. The experimental analysis on various artificial and real-world benchmark problems includes various cascade specific parameters like intermediate training set sizes and dimensionalities.


Proceedings ◽  
2018 ◽  
Vol 2 (19) ◽  
pp. 513
Author(s):  
Olga Valenzuela ◽  
Beatriz Prieto ◽  
Elvira Delgado-Marquez ◽  
Hector Pomares ◽  
Ignacio Rojas

Heart disease is currently one of the leading causes of death in developed countries. The electrocardiogram is an important source of information for identifying these conditions, therefore, becomes necessary to seek an advanced system of diagnosis based on these signals. In this paper we used samples of electrocardiograms of MIT-related database with ten types of pathologies and a rate corresponding to normal (healthy patient), which are processed and used for extraction from its two branches of a wide range of features. Next, various techniques have been applied to feature selection based on genetic algorithms, principal component analysis and mutual information. To carry out the task of intelligent classification, 3 different scenarios have been considered. These techniques allow us to achieve greater efficiency in the classification methods used, namely support vector machines (SVM) and decision trees (DT) to perform a comparative analysis between them. Finally, during the development of this contribution, the use of very non-invasive devices (2 channel ECG) was analyzed, we could practically classify them as wearable, which would not need interaction by the user, and whose energy consumption is very small to extend the average life of the user been on it.


2012 ◽  
Vol 24 (6) ◽  
pp. 1391-1407 ◽  
Author(s):  
Bharath K. Sriperumbudur ◽  
Gert R. G. Lanckriet

The concave-convex procedure (CCCP) is an iterative algorithm that solves d.c. (difference of convex functions) programs as a sequence of convex programs. In machine learning, CCCP is extensively used in many learning algorithms, including sparse support vector machines (SVMs), transductive SVMs, and sparse principal component analysis. Though CCCP is widely used in many applications, its convergence behavior has not gotten a lot of specific attention. Yuille and Rangarajan analyzed its convergence in their original paper; however, we believe the analysis is not complete. The convergence of CCCP can be derived from the convergence of the d.c. algorithm (DCA), proposed in the global optimization literature to solve general d.c. programs, whose proof relies on d.c. duality. In this note, we follow a different reasoning and show how Zangwill's global convergence theory of iterative algorithms provides a natural framework to prove the convergence of CCCP. This underlines Zangwill's theory as a powerful and general framework to deal with the convergence issues of iterative algorithms, after also being used to prove the convergence of algorithms like expectation-maximization and generalized alternating minimization. In this note, we provide a rigorous analysis of the convergence of CCCP by addressing two questions: When does CCCP find a local minimum or a stationary point of the d.c. program under consideration? and when does the sequence generated by CCCP converge? We also present an open problem on the issue of local convergence of CCCP.


Sign in / Sign up

Export Citation Format

Share Document