Méthode de détection de corps étrangers dans la ceinture minière basée sur YOLOv4
MaisonMaison > Blog > Méthode de détection de corps étrangers dans la ceinture minière basée sur YOLOv4

Méthode de détection de corps étrangers dans la ceinture minière basée sur YOLOv4

Apr 13, 2023

Rapports scientifiques volume 13, Numéro d'article : 8881 (2023) Citer cet article

92 accès

1 Altmétrique

Détails des métriques

Dans le processus de transport de la ceinture minière, divers corps étrangers peuvent apparaître, ce qui aura un impact important sur le concasseur et la ceinture, affectant ainsi la progression de la production et provoquant de graves accidents de sécurité. Par conséquent, il est important de détecter les corps étrangers aux premiers stades de l'intrusion dans les systèmes de convoyeurs à bande miniers. Pour résoudre ce problème, la méthode YOLOv4_GECA est proposée dans cet article. Tout d'abord, le module d'attention GECA est ajouté pour établir le modèle de détection d'objets étrangers YOLOv4_GECA dans la ceinture minérale afin d'améliorer la capacité d'extraction de caractéristiques d'objets étrangers. Deuxièmement, sur la base de ce modèle, la décroissance du taux d'apprentissage du recuit cosinus de redémarrage est utilisée pour améliorer les performances de détection d'image d'objet étranger du modèle. Enfin, nous avons collecté des informations sur les images de transport par courroie du site de la mine d'or de Pai Shan Lou à Shenyang et établi un ensemble de données de détection de corps étrangers par courroie. Les résultats expérimentaux montrent que la précision de détection moyenne de la méthode YOLOv4_GECA proposée dans cet article est de 90,1 %, le taux de rappel est de 90,7 % et le temps de détection moyen est de 30 ms, ce qui répond aux exigences de précision de détection et de performances en temps réel sur le site de transport de la ceinture de mines.

La détection de corps étrangers joue un rôle important dans les industries de traitement du minerai et de contrôle de la qualité des produits. Les bandes transporteuses de minerai peuvent être chargées de toutes sortes de corps étrangers lors du transport de minerai, tels que des barres d'acier, des câbles de fer, du fer, du bois, des tuyaux en plastique, etc., ce qui peut avoir un impact énorme sur les concasseurs, les broyeurs à boulets et les bandes. Les méthodes traditionnelles de détection de corps étrangers sont la méthode de détection manuelle, la méthode des rayons et la méthode de détection spectrale. La méthode de détection manuelle est fortement influencée par l'état mental des travailleurs et est inefficace. La méthode des rayons est plus stable mais coûteuse et nocive pour le corps humain1. La méthode de détection spectrale a un taux de fausse détection relativement faible, l'inconvénient est qu'elle est sensible aux interférences, difficile à entretenir l'équipement et difficile à détecter les corps étrangers dans le minerai de fer pour détecter le fer. En raison de l'influence des facteurs humains et des interférences externes, les techniques de détection de corps étrangers ci-dessus sont lentes, coûteuses et difficiles à entretenir, avec des taux de fuite élevés, ce qui rend difficile leur promotion universelle dans les entreprises minières.

Avec le développement de l'apprentissage en profondeur, les méthodes de détection d'objets basées sur les réseaux de neurones convolutifs ont été largement utilisées, et les méthodes de détection de corps étrangers basées sur l'apprentissage en profondeur sont devenues un point chaud de la recherche. Les méthodes de détection d'objets existantes sont principalement basées sur des ancres et sans ancre. Parmi eux, Anchor-based a principalement deux étages Faster R-CNN et une série YOLO à un étage, SSD, etc. En 2015, Ren2 et al. a proposé le Faster R-CNN, qui a amélioré la vitesse de l'algorithme de recherche sélective pour extraire les régions de boîtes candidates et est devenu le premier détecteur de cible d'apprentissage en profondeur de bout en bout en temps quasi réel. YOLO (on ne regarde qu'une fois)3 a été proposé par Redmon et al. en 2015 en tant que premier détecteur à un étage dans le domaine de l'apprentissage en profondeur. Le principal point d'amélioration de YOLOv24 par rapport à la version précédente est l'algorithme d'entraînement conjoint proposé, qui fournit une localisation plus précise tout en maintenant la vitesse de traitement de YOLO. fonctionnalités, l'ajout de réseaux SPP pour améliorer l'extraction d'images et l'utilisation de la fonction d'activation Mish, ces améliorations font également de YOLOv4 un détecteur d'objets extrêmement efficace et puissant. Liu7 et al. a proposé l'algorithme SSD en 2015, qui introduit des techniques de détection multi-références et multi-résolutions, et le réseau de différentes couches détecte des objets à différentes échelles, et l'effet de détection pour les petites cibles est grandement amélioré. YOLOv58 utilise un calcul de cadre d'ancrage adaptatif et un mécanisme de détection de fusion multi-sémantique, qui permet la fusion rapide et efficace d'informations sémantiques riches de haut niveau avec des informations de localisation de bas niveau pour obtenir une détection rapide des objets. pour améliorer considérablement la précision de la détection sans augmenter le coût de l'inférence, tout en réduisant efficacement environ 40 % des paramètres et 50 % de l'effort de calcul des détecteurs de cibles en temps réel existants.

Ces dernières années, un grand nombre de chercheurs ont utilisé des méthodes d'apprentissage en profondeur pour la détection d'objets étrangers, y compris la détection d'objets étrangers basée sur le réseau neuronal convolutif (CNN), la détection d'objets étrangers basée sur le réseau neuronal récurrent (RNN) et la détection d'objets étrangers basée sur l'encodeur automatique. Ces méthodes ont obtenu de bons résultats dans la détection d'objets étrangers et ont une meilleure généralisation et robustesse par rapport aux algorithmes d'apprentissage automatique traditionnels. ont proposé un nouvel algorithme basé sur le réseau neuronal convolutif (CNN) pour détecter les débris d'objets étrangers (FOD) basé sur des capteurs d'imagerie optique. Comparé aux R-CNN et SSD plus rapides, leur algorithme proposé a de meilleurs résultats pour la détection des débris de corps étrangers pour les chaussées des aéroports. En 2018, Xu12 et al. ont proposé une nouvelle méthode de reconnaissance de matériel de fragment d'objet étranger basée sur l'apprentissage de la migration et les modèles de réseau de neurones à convolution profonde (D-CNN). En 2019, Rong13 et al. appliqué deux structures de réseau neuronal convolutif différentes aux images de noix pour segmenter automatiquement les images et détecter les objets étrangers naturels et artificiels de différentes tailles, en évitant l'extraction manuelle des caractéristiques et en surmontant le phénomène d'agrégation entre les noix et les objets étrangers dans les images réelles. En 2020, He14 et al. a construit un réseau basé sur l'apprentissage en profondeur pour la détection de sacs en plastique sous les trains en utilisant le réseau SSD et en combinant différents extracteurs de caractéristiques. Parmi les résultats, la vitesse de détection la plus rapide a été obtenue avec la combinaison de SSD et MobileNet. En 2020, Pang15 et al. ont proposé une méthode de détection en temps réel basée sur l'algorithme YOLOv3 pour détecter les armes métalliques cachées sur le corps humain, qui a été appliquée aux images à ondes millimétriques passives (PMMW). Il a non seulement une grande précision mais également une vitesse de détection très rapide en termes de détection pour les cibles de petite taille. En 2022, Chen16 et al. a combiné l'algorithme YOLOv4 avec une boîte d'ancrage optimisée pour obtenir une détection efficace des corps étrangers dans les convoyeurs à bande et réduire l'apparition de ce problème de déchirures longitudinales de la bande. En 2022, Qiu17 et al. Une technique de détection en temps réel basée sur l'apprentissage profond pour les radars au sol avec un mécanisme d'attention supplémentaire et une augmentation des données pour améliorer les problèmes de détection fausse et manquée dans la détection. En 2022, Jing18 et al. ont proposé un cadre de forêt aléatoire basé sur des caractéristiques de vision pixel optimales et des caractéristiques de vision pixel conçues (PVF) afin de surmonter la complexité des informations d'image de la chaussée de l'aéroport et la variabilité des fragments d'objets étrangers, ce qui est plus avantageux en termes de précision et de rappel de la détection de fragments d'objets étrangers. En 2022, Abramson19 et al. a créé un algorithme de suivi d'objets étrangers entièrement automatisé qui a utilisé un réseau de neurones convolutifs personnalisé pour atteindre une précision de 99 %, surpassant d'autres algorithmes comparables.

La recherche actuelle sur la détection de corps étrangers dans les ceintures minières se concentre sur les méthodes traditionnelles de détection d'objets, avec une faible précision de reconnaissance, une vitesse d'identification lente et une situation de fuite et d'erreur de jugement facile à produire. Dans le même temps, il existe de petits objets, des corps étrangers, des corps étrangers partiellement masqués et des corps étrangers difficiles à identifier en raison de l'interférence de la poussière lors du transport de la ceinture minérale. Pour résoudre les problèmes ci-dessus, cet article propose une méthode basée sur YOLOv4_GECA pour détecter les corps étrangers sur la courroie de transmission du minerai. Notre contribution peut se résumer comme suit.

En réponse à l'absence d'une base de données d'images standard et ouverte dans le domaine de la détection de corps étrangers dans la ceinture minière, nous avons collecté des informations sur les images de transport de la ceinture du site de la mine d'or Pai Shan Lou à Shenyang, créé un ensemble de données de détection de corps étrangers dans la ceinture minière et l'avons élargi, avec les principaux types de corps étrangers, notamment les barres d'acier, les câbles en acier, le fer, le bois et les tuyaux en plastique.

Le mécanisme d'attention GECA est proposé et le modèle YOLOv4_GECA est construit pour les caractéristiques d'occlusion partielle de corps étrangers et d'interférence de poussière dans les images dans le processus de production réel.

La méthode de décroissance du taux d'apprentissage dans le processus d'apprentissage du modèle est améliorée pour optimiser le processus d'apprentissage avec la méthode de décroissance du taux d'apprentissage par recuit cosinus de redémarrage. Basé sur le modèle YOLOv4_GECA, le réseau YOLOv4_GECA_SGDR est construit pour améliorer encore les performances sans augmenter la charge du modèle.

Le modèle YOLOv4 est amélioré sur la base du modèle YOLOv320, incorporant d'excellentes techniques de détection qui ont émergé dans le domaine de l'apprentissage en profondeur ces dernières années, améliorant les performances de détection du modèle pour les petits objets, et le schéma de la structure du modèle est illustré à la Fig. 1. En termes de structure globale du réseau, le modèle YOLOv4 peut être divisé en quatre parties : entrée, réseau dorsal, cou et tête. Le modèle YOLOv4 utilise l'augmentation de données Mosaic du côté entrée pendant la formation en effectuant certaines opérations de retournement et de mise à l'échelle des quatre images séparément, puis en assemblant les quatre images ensemble pour obtenir une nouvelle image21. Le backbone du modèle YOLOv4 inclut l'utilisation du réseau CSPDarknet53 et la fonction d'activation Mish. Le réseau de détection d'objets utilise une structure de regroupement pyramidal spatial et une structure PANet au milieu des couches CSPDarknet53 et de sortie. PAN transmet les informations sémantiques profondes à la couche superficielle pour compléter les informations sémantiques superficielles, obtenant ainsi des caractéristiques sémantiques fortes et à haute résolution, qui ont des performances très impressionnantes dans des domaines tels que la détection de petits objets et la segmentation d'instance. Sur Prédiction, le mécanisme de la trame d'ancrage de la couche de sortie est le même que YOLOv3, et les principales améliorations sont la fonction de perte CIOU_Loss lors de l'apprentissage et la suppression non maximale du filtrage de la trame de prédiction dans DIOU_nms.

La structure du modèle YOLOV4.

L'architecture de réseau fédérateur CSPDarknet53 de YOLOv4 utilise de nombreux modules CSPX pour l'empilement. Le module CSPX emprunte la structure du réseau partiel inter-étages22 (CSPNet) avec assemblage tenseur par couches convolutives et modules d'unité X Res, voir Fig. 2. Dans le problème de détection d'objets, l'utilisation de CSPNet comme réseau fédérateur peut apporter une certaine amélioration des performances au modèle de réseau, améliorer la capacité des réseaux de neurones convolutifs à extraire des caractéristiques des images et améliorer l'efficacité de calcul. La figure 3 montre la structure du module résiduel (unité Res), qui est divisé en une partie de cartographie directe et une partie résiduelle, où la partie résiduelle contient deux opérations de convolution. La partie résiduelle est d'abord convoluée puis additionnée par tenseur avec la partie de cartographie directe. La figure 4 illustre le module convolutif CBL, qui se compose d'une couche convolutive, d'une couche de normalisation par lots et d'une couche d'activation Leaky Relu.

Schéma structurel du module CSPX.

Schéma structurel du module de l'unité Res.

Schéma structurel du module de convolution CBL.

Le module de mécanisme attentionnel ECA améliore le module SE23 en éliminant l'opération de réduction de dimensionnalité et en utilisant deux couches entièrement connectées de la même dimension plus utiles pour apprendre l'attention efficace du canal. Cependant, l'utilisation de deux couches entièrement connectées de la même dimension conduira à une quantité excessive de paramètres, de sorte que l'approche consistant à utiliser k caractéristiques adjacentes pour obtenir des informations d'interaction locale entre canaux n'a qu'un nombre k de paramètres et peut obtenir les mêmes performances et est plus efficace. Le module du mécanisme attentionnel ECA est calculé comme suit :

où \(C1D\) représente l'opération de convolution unidimensionnelle effectuée sur les entités d'entrée et représente la fonction sigmoïde. Le module ECA n'utilise pas la couche de connexion complète dans le module SE. Il apprend directement les caractéristiques après la mise en commun de la moyenne globale à travers une convolution unidimensionnelle qui peut partager des poids, comme illustré à la Fig. 5. Les informations d'interaction locale entre canaux sont obtenues par chaque canal et ses k caractéristiques adjacentes, c'est-à-dire que l'interaction d'informations entre les canaux est obtenue par convolution unidimensionnelle avec un noyau de convolution de taille k. La relation non linéaire entre chaque canal est apprise et les poids des différents canaux sont également obtenus. La convolution unidimensionnelle implique l'hyperparamètre k, la taille du noyau de convolution, qui indique la couverture des interactions locales entre canaux, c'est-à-dire combien de caractéristiques adjacentes au voisinage de cette caractéristique de canal sont conjointement impliquées dans la prédiction de l'attention.

Schéma structurel du module ECA.

Lors de l'optimisation de l'algorithme de descente de gradient stochastique, lorsque la valeur de perte se rapproche du minimum global, le taux d'apprentissage actuel est important pour les poids et la fonction de perte actuels, et à ce stade, si le taux d'apprentissage est réduit, le modèle peut être rapproché du minimum global. Le recuit cosinus réduit le taux d'apprentissage par la fonction cosinus, comme le montre la figure 6, où la coordonnée horizontale est le nombre de tours d'apprentissage et la coordonnée verticale est le taux d'apprentissage. La décroissance du taux d'apprentissage de 0,01 à 0,005 avec l'augmentation des cycles d'apprentissage est illustrée à la Fig. 6, où sa valeur de cosinus diminue d'abord lentement avec l'augmentation des cycles, puis accélère et diminue lentement à nouveau. Ceci est utilisé dans le processus de formation du modèle YOLOv4, où le taux d'apprentissage diminue progressivement au fur et à mesure que la formation progresse, la fonction de perte diminuant d'abord considérablement au début de la formation, et variant dans une petite plage autour de l'optimum local ou de l'optimum global plus tard.

Descente du taux d'apprentissage du recuit cosinus.

La méthode de décroissance du taux d'apprentissage par recuit cosinus utilise la fonction cosinus, de sorte que le processus de décroissance se conforme à la forme de la fonction cosinus, dont la formule est indiquée dans l'équation. (2).

où \({\eta }_{max}\) et \({\eta }_{min}\) sont respectivement les valeurs maximale et minimale du taux d'apprentissage, \({T}_{\text{cur}}\) est le nombre de tours d'entraînement jusqu'à présent, et \(T\) est le nombre total de tours d'entraînement.

Les algorithmes d'optimisation de descente de gradient stochastique rencontrent souvent le problème de tomber dans les minima locaux pendant le processus d'apprentissage. L'approche de décroissance du taux d'apprentissage par recuit cosinus aura un taux d'apprentissage plus faible dans les dernières étapes de la formation et peut tomber dans des minima locaux difficiles à sortir, ce qui se traduit par un algorithme de descente qui ne peut pas être optimisé à un minimum global. Si le taux d'apprentissage est augmenté à un moment où le taux d'apprentissage est faible plus tard dans la formation de l'algorithme de descente stochastique, il est alors possible de faire sauter le processus d'optimisation hors des minima locaux et de trouver le chemin vers le minimum global, appelé redémarrage de la méthode du taux d'apprentissage par recuit cosinus. La formule du taux d'apprentissage du recuit cosinus de redémarrage est donnée dans l'équation. (3).

Dans la formule, le \(i\) indique les premières fois le taux d'apprentissage de redémarrage. \({\eta }_{max}^{i}\) et \({\eta }_{min}^{i}\) indiquent respectivement les valeurs maximale et minimale du taux d'apprentissage au ième redémarrage. \({T}_{i}\) indique le nombre total de tours du processus d'entraînement au ième redémarrage et \({T}_{\text{cur}}\) indique le nombre de tours actuellement exécutés et sera mis à jour à chaque redémarrage. Les valeurs maximale et minimale du taux d'apprentissage de redémarrage sont définies, et chaque taux d'apprentissage de redémarrage subit une décroissance de recuit cosinus, le taux d'apprentissage décroissant de la valeur maximale à la valeur minimale. La figure 7 montre une simulation du taux d'apprentissage pour trois recuits cosinus de redémarrage, où le taux d'apprentissage est redémarré dans les 50e, 100e et 150e cycles du processus de formation, et la valeur maximale et minimale du taux d'apprentissage pour chaque redémarrage est de soixante-dix pour cent de la valeur précédente.

Redémarrez la descente du taux d'apprentissage du recuit cosinus.

Pour tirer pleinement parti des informations contextuelles globales et capturer les dépendances à longue portée pour le site de production réel où se trouvent de petits objets, certains objets étrangers existent pour obscurcir et de la poussière peut être générée, cet article propose le mécanisme d'attention GECA pour améliorer le mécanisme d'attention ECA. L'opération de mise en commun de moyenne globale dans le mécanisme d'attention ECA ne fonctionne qu'en faisant la moyenne de chaque carte de caractéristiques de canal séparément et utilise cette moyenne pour représenter les informations de carte de caractéristiques de canal sans utiliser pleinement les informations globales. Dans cet article, l'opération de mise en commun de la moyenne globale dans ECA est améliorée en n'utilisant pas la mise en commun de la moyenne globale, mais en utilisant une opération de convolution unidimensionnelle pour obtenir les dépendances sur les emplacements des pixels de chaque carte de caractéristiques de canal pour obtenir le vecteur de sortie, qui est ensuite exploité par la fonction Softmax pour obtenir le vecteur de valeur de probabilité, qui est multiplié par la carte de caractéristiques d'entrée d'origine. Cette amélioration peut tirer pleinement parti des informations en texte intégral de la carte des caractéristiques pour obtenir la connexion entre les points de pixel de chaque canal, et le vecteur de valeur de probabilité obtenu rend les informations clés sur la carte des caractéristiques plus visibles, ce qui est plus pratique pour l'apprentissage ultérieur du mécanisme d'attention du canal, et améliore également la capacité d'extraction des caractéristiques des objets étrangers partiellement occlus et des objets étrangers sur les images poussiéreuses. Le module GECA construit est illustré à la Fig. 8.

Schéma structurel du module GECA.

Le module CSPX du réseau fédérateur CSPDarknet53 contient plusieurs unités Res de blocs résiduels qui atténuent les problèmes de disparition et d'explosion de gradient, permettant à la structure du réseau d'être construite plus profondément et plus capable d'extraire des caractéristiques des images. Dans cet article, nous proposons de construire le module d'unité Res_GECA en plaçant le module de mécanisme d'attention GECA derrière la couche convolutive de la partie résiduelle dans le bloc résiduel de l'unité Res, en espérant apprendre plus efficacement l'attention du canal du bloc convolutif et améliorer la capacité d'extraction de caractéristiques du réseau dorsal avec l'introduction de très petits paramètres de modèle. Le module unitaire Res_GECA construit est illustré à la Fig. 9.

Schéma structurel du module unitaire Res _GECA.

Il y a 23 modules de connexion résiduels dans les cinq modules CSPX du réseau fédérateur YOLOv4, et le module de connexion résiduel d'origine est remplacé par le module résiduel Res_GECA avec le mécanisme d'attention GECA proposé dans cet article, voir Fig. , et permettant une meilleure détection des corps étrangers difficiles à identifier.

Le schéma de structure du réseau fédérateur du modèle YOLOV4_GECA.

Actuellement, il n'existe pas de base de données d'images standard et ouverte dans le domaine de la détection de corps étrangers dans les ceintures minières. Nous avons collecté des informations sur les images de transport par courroie du site de la mine d'or Pai Shan Lou à Shenyang, créé un ensemble de données et élargi l'ensemble de données à l'aide de l'amélioration des données. Les informations d'image dans l'ensemble de données peuvent être consultées dans les informations supplémentaires. L'amélioration des données est une expansion artificielle d'un ensemble de données limité pour produire des données plus équivalentes. Les méthodes d'amélioration des données d'image couramment utilisées comprennent le tramage des couleurs de l'image, les transformations de retournement et de rotation, le rognage aléatoire, les transformations de panoramique et de contraste, l'amélioration des données de mosaïque, etc.

Cet article utilise LabelImg, un logiciel d'étiquetage pour les tâches de détection de cible, qui permet de sélectionner la cible à l'aide d'une boîte rectangulaire et de l'enregistrer sous forme de fichier XML. Pour créer un échantillon d'images d'objets étrangers de la ceinture minière, le logiciel d'étiquetage de l'ensemble de données LabelImg a été utilisé pour cartographier manuellement les cibles d'objets étrangers sur le tapis roulant. Pour marquer un seul objet étranger, cliquez sur le bouton de la boîte rectangulaire du logiciel, maintenez enfoncé le bouton gauche de la souris dans le coin supérieur gauche de l'objet étranger, faites glisser la souris vers le coin inférieur droit de l'objet étranger, laissez la boîte rectangulaire l'envelopper complètement, puis remplissez la catégorie d'objet étranger et enregistrez-la. Lorsqu'il y a plusieurs objets étrangers dans le diagramme, marquez chaque objet étranger séparément et remplissez la catégorie à laquelle il appartient. L'étiquetage est enregistré au format VOC. Un total de 1291 images contenant des objets étrangers ont été sélectionnées pour l'ensemble de données total final, qui a été divisé en 5 catégories d'objets étrangers, y compris l'acier, les tuyaux en plastique, le bois, le câble en acier et le fer, avec un nombre équilibré d'images dans chaque catégorie. L'ensemble d'entraînement et l'ensemble de test sont pris dans un rapport de 8:2. L'augmentation de données en mosaïque est utilisée pendant la formation pour enrichir l'ensemble de données et rendre le réseau plus robuste.

L'ordinateur utilisé pour la formation du modèle de détection d'objets étrangers de la ceinture minière dans cet article utilise un processeur Intel Core i5-9400F 2,90 GHz, une carte graphique NVIDIA GTX 1660, 16 Go de RAM et un disque dur Western Digital de 500 Go. En termes de logiciel, le système d'exploitation de l'ordinateur est Windows 10 64 bits. Le modèle de détection de corps étrangers de la ceinture minière est construit à l'aide du cadre d'apprentissage en profondeur PyTorch, qui est un cadre open source largement adopté, simple et efficace. Les bibliothèques de traitement d'images Opencv et PIL sont utilisées pour traiter les images, et des bibliothèques telles que Matplotlib sont utilisées pour dessiner les images. Pour le GPU, utilisez Cudnn 7.6.5 et Cuda 10.2 pour configurer la carte graphique.

Le modèle YOLOv4 utilise CSPDarknet53 comme architecture dorsale et est pré-formé sur l'ensemble de données ImageNet pour initialiser certaines des couches convolutives. Dans l'expérience, les hyperparamètres par défaut sont les suivants : le nombre total de tours d'entraînement pour le modèle de détection de corps étrangers de la ceinture minière est de 1 000 tours ; la taille de chaque image d'apprentissage par lots est définie sur 4 ; la valeur initiale du taux d'apprentissage est fixée à 0,01, ce qui diminuera lentement pendant le processus d'apprentissage, et le taux d'apprentissage de décroissance final est de 0,0005 ; la quantité de mouvement et la décroissance du poids sont fixées à 0,937 et 0,005, respectivement ; la taille de l'image d'entrée est de 3843´84. où la taille du noyau convolutif unidimensionnel dans le modèle YOLOv4_GECA est définie sur 3, 5 et 7 pour des expériences visant à tester l'impact de ce paramètre sur les performances sur l'amélioration du modèle. En termes de sélection de la fonction d'activation, nous utilisons la fonction d'activation Leaky Relu car la capacité de la carte graphique requise pour l'activation de Mish est trop importante. Le modèle de détection de corps étrangers de la ceinture minière utilise un algorithme d'optimisation de descente de gradient stochastique, qui utilise d'abord une stratégie d'ordonnancement du taux d'apprentissage de la décroissance du recuit cosinus pour trouver un modèle amélioré approprié, puis entraîne le modèle à l'aide d'une stratégie de décroissance du taux d'apprentissage du recuit cosinus de redémarrage pour tester si différentes stratégies de décroissance du taux d'apprentissage affectent le modèle. Pour les tests, nous avons obtenu des vecteurs de confiance au niveau de la région par scores. Les résultats sont post-traités par vote par boîte englobante et suppression non maximale (NMS) à l'aide d'un seuil de 0,5 IOU.

Dans le processus de détection de corps étrangers sur le site de minerai de transport par bande transporteuse, l'occurrence de la détection d'objets étrangers faux et manqués et la vitesse de détection n'est pas conforme aux normes sur le travail d'inspection a un grand impact, de sorte que les indicateurs de vérification de ces situations sont les principaux indicateurs de performance du système de détection de cette étude. Par conséquent, la précision moyenne moyenne (mAP), le rappel et le Fps (images par seconde) sont utilisés comme mesures d'évaluation du modèle dans cette étude. Où la précision moyenne moyenne (mAP) est la moyenne des valeurs AP prises sur toutes les catégories. mAP est la précision moyenne, qui est la moyenne de toutes les précisions obtenues sur toutes les valeurs possibles de Recall. Le rappel est utilisé pour évaluer la couverture de détection du détecteur pour toutes les cibles à détecter. Fps fait référence au nombre d'images pouvant être traitées par seconde. Ils sont calculés comme suit.

Dans la formule, TP est le nombre d'échantillons positifs prédits comme étant des classes positives ; FP est le nombre d'échantillons négatifs prédits comme étant des classes positives ; FN est le nombre d'échantillons positifs prédits comme étant des classes négatives ; TN est le nombre d'échantillons négatifs prédits comme étant des classes négatives.

Cet article compare les effets de détection de différents modèles de détection d'objets avancés sur l'ensemble de données de détection de corps étrangers de la ceinture minière, y compris cinq modèles de réseau, YOLOv3, YOLOv3-spp, Faster RCNN, YOLOv4 et YOLOv5, et le modèle de détection d'objets YOLOv4 est sélectionné comme base modèle de réseau pour les conditions complètes du site de transport du minerai. Les performances des modèles améliorés YOLOv4_ECA, YOLOv4_GECA et YOLOv4 sont également comparées les unes aux autres, ainsi que l'effet de la taille du noyau convolutionnel unidimensionnel dans le modèle YOLOv4_GECA sur les performances du modèle. Dans cet article, nous améliorons la stratégie de décroissance du taux d'apprentissage dans la formation du modèle de détection de corps étrangers de la ceinture minière et modifions la stratégie de décroissance du taux d'apprentissage de YOLOv4 pour redémarrer la décroissance du taux d'apprentissage par recuit cosinus et effectuer une comparaison et une analyse expérimentales.

Pour démontrer et évaluer les performances de notre méthode proposée, les performances sont comparées à d'autres détecteurs avancés. Les cinq modèles de réseau, YOLOv3, YOLOv3-spp, Faster RCNN, YOLOv4 et YOLOv5, ont été formés pendant 1000 tours sur l'ensemble de données sur les corps étrangers de la ceinture minière et testés sur l'ensemble de test. La figure 11 montre les tendances des métriques mAP du modèle YOLOv4 et du modèle YOLOv5 pendant le processus de formation. Après 300 cycles d'entraînement, les mesures se sont stabilisées et ont varié autour des valeurs optimales. Parmi eux, l'effet d'entraînement du modèle YOLOv5 est meilleur que celui du modèle YOLOv4. La figure 12 montre la tendance des métriques de rappel pendant la formation du modèle YOLOv4 et du modèle YOLOv5, et après 300 cycles de formation, les métriques se sont stabilisées et ont varié autour des valeurs optimales. Parmi eux, l'effet d'entraînement du modèle YOLOv4 est meilleur que l'effet d'entraînement du modèle YOLOv5.

L'indicateur [email protected] change pendant la formation des modèles YOLOv4 et YOLOv5.

Rappel des changements d'indicateur pendant la formation des modèles YOLOv4 et YOLOv5.

Dans cette étude, le modèle a été formé sur un ensemble de données de corps étrangers de ceinture minière maison, et premièrement, les cinq modèles de réseau, YOLOv3, YOLOv3-spp, Faster RCNN, YOLOv4 et YOLOv5, qui sont plus couramment utilisés dans les tâches de détection, ont été formés sur l'ensemble de données d'entraînement divisé pour 1000 tours respectivement, puis testés sur l'ensemble de données de test. comme indiqué dans le tableau 1.

Comme on peut le voir dans le tableau 1, le modèle YOLOv5 a la précision de détection la plus élevée avec un mAP de 0,907 pour la tâche de détection de corps étrangers de la ceinture minière, et les autres modèles ont une valeur mAP plus proche d'environ 0,885. Cependant, le modèle YOLOv5 a un rappel inférieur de 0,867 et le modèle YOLOv4 a le rappel le plus élevé de 0,888, soit 2,1 % de plus que le modèle YOLOv5. Pour cette tâche de test, les détections manquées sont plus graves que les faux positifs, le rappel est donc plus important. En résumé, le modèle YOLOv4 est plus performant que les modèles YOLOv3, YOLOv3-spp et YOLOv5 en termes de précision et de rappel, avec un mAP de 0,885 et un rappel de 0,888, et ses Fps peuvent répondre aux besoins réels des sites de production. Le modèle YOLOv4 est donc sélectionné comme modèle de base pour l'amélioration.

Une comparaison des résultats de prédiction partielle des quatre modèles YOLOv3, YOLOv3-spp, YOLOv4 et YOLOv5 est illustrée à la Fig. 13. De gauche à droite, trois images contenant des corps étrangers, notamment du bois, des barres d'armature, des tuyaux en plastique et des câbles en acier, sont présentés dans l'ordre de haut en bas, montrant les effets de détection des quatre modèles de détection d'objets sur les images de corps étrangers.

Comparaison de l'effet de détection des quatre modèles.

Dans la détection des images Image1, le modèle YOLOv4 et le modèle YOLOv5 ont prédit les catégories avec une plus grande confiance. Dans la détection des images Image2, le modèle YOLOv5 identifie incorrectement le minerai comme un corps étranger de bois par rapport aux trois autres modèles en cas d'erreur de classification. Lors de la détection des images Image3, les trois modèles, à l'exception du modèle YOLOv4, avaient manqué la détection, le modèle YOLOv3 avait manqué un corps étranger en bois et un corps étranger en câble d'acier, et le modèle YOLOv3-spp et le modèle YOLOv5 avaient manqué un corps étranger en câble d'acier. Sur le site de production réel, les erreurs de jugement et la détection manquée de corps étrangers peuvent causer des problèmes au processus de traitement du transfert du minerai. Une détection manquée entraîne l'intrusion de corps étrangers dans l'ouverture d'alimentation, le broyeur et le broyeur à boulets, et d'autres équipements causant des dommages à l'équipement, et une erreur de jugement peut augmenter l'intensité du travail des travailleurs. De l'effet global de la prédiction du modèle, le modèle YOLOv4 est plus adapté à la tâche de détection de corps étrangers de la ceinture minière en termes de performances, donc YOLOv4 est choisi comme modèle de base pour cet article pour l'amélioration du modèle.

Le modèle amélioré YOLOv4_GECA est formé sur l'ensemble de données de corps étrangers de la ceinture minière, et les hyperparamètres k impliqués dans la convolution unidimensionnelle dans le module résiduel Res_GECA sont ajustés et définis sur 3, 5 et 7 respectivement, puis formés pour 1000 tours respectivement. Quatre courbes, YOLOv4, YOLOv4_GECA_3, YOLOv4_GECA_5 et YOLOv4_GECA_7, sont illustrées à la Fig. 14, où YOLOv4_GECA_3 indique que l'hyperparamètre de noyau convolutif unidimensionnel k du mécanisme d'attention GECA dans le modèle YOLOv4_GECA est de 3, et ainsi de suite. Sur la figure, on peut voir que le [email protected] du modèle YOLOv4_GECA avec trois paramètres k différents a atteint son point le plus élevé à environ 400 tours pendant le processus de formation du modèle, et a fluctué autour de la valeur optimale par la suite. En comparaison, le [email protected] du modèle YOLOv4_GECA est supérieur à celui du modèle YOLOv4 pendant le processus d'apprentissage.

L'indicateur [email protected] change pendant la formation du modèle YOLOv4_GECA.

Le modèle a été testé sur l'ensemble de test après la formation, et les résultats des tests sont présentés dans le tableau 2. Les résultats des performances de détection du modèle YOLOv4 et du modèle amélioré YOLOv4_GECA avec différents hyperparamètres k sont présentés dans le tableau 2. On peut voir que le [email protected] de YOLOv4_GECA s'améliore beaucoup par rapport à YOLOv4 pour la tâche de détection de corps étrangers de la ceinture minière, et le rappel de YOLOv4_GECA_3 et YOLOv4_GECA_5 s'améliore également s par rapport à YOLOv4, et le nombre de paramètres du modèle amélioré augmente très peu. Le modèle YOLOv4_GECA_7 est plus performant dans l'indice [email protected], mais son Recall diminue. le modèle YOLOv4_GECA diminue l'indice Fps par rapport au modèle YOLOv4, détectant 5 images de moins par seconde. Le modèle YOLOv4_GECA_3 fonctionne le mieux en termes de tous les indices, et il améliore le [email protected] et le rappel de la tâche de détection de corps étrangers de la ceinture minière de 1 % et 0,6 %, respectivement, et le nombre supplémentaire de paramètres résultant de l'ajout du mécanisme d'attention GECA est très faible. D'après les résultats expérimentaux, la combinaison du mécanisme d'attention GECA proposé dans cet article avec CSPDarknet53, le réseau dorsal du modèle YOLOv4, peut améliorer les performances de détection de corps étrangers. Bien que le modèle YOLOv4_GECA_3 ait réduit l'indice Fps, détectant 30 images d'objets étrangers par seconde, il peut toujours répondre à la demande de tâche de détection d'objets étrangers de la ceinture minière à partir de la situation pratique et peut être appliqué dans le processus de production réel.

Un mécanisme de vitesse d'apprentissage de recuit cosinus de redémarrage est utilisé dans le processus de formation du modèle de détection de corps étranger amélioré YOLOv4_GECA_3 sur l'ensemble de données de corps étranger de la ceinture minière. Le modèle YOLOv4 est formé avec le mécanisme de taux d'apprentissage de recuit cosinus, et son processus de décroissance du taux d'apprentissage est illustré à la Fig. 15. La valeur initiale du taux d'apprentissage est de 0,01, qui décroît lentement au début de la phase de formation et diminue rapidement au fur et à mesure que la formation progresse, et diminue au stade final de la formation du modèle, avec un taux d'apprentissage final de 0,0005.

Le processus de décroissance du taux d'apprentissage du modèle YOLOV4.

Étant donné que la décroissance du taux d'apprentissage du recuit cosinus est faible à la fin de l'apprentissage du modèle et peut tomber dans les minima locaux, cet article utilise un mécanisme de redémarrage du taux d'apprentissage du recuit cosinus pour augmenter le taux d'apprentissage lorsque le taux d'apprentissage est faible à la dernière étape de l'apprentissage de l'algorithme de descente de gradient stochastique, de sorte que le processus d'optimisation saute hors des minima locaux et trouve le chemin vers le minimum global. Dans cet article, le taux d'apprentissage d'un redémarrage, le taux d'apprentissage de deux redémarrages, le taux d'apprentissage de trois redémarrages et le taux d'apprentissage de quatre redémarrages ont été testés, comme illustré à la Fig. .0005. Les points de redémarrage sont situés aux points où les tours d'entraînement sont répartis de manière égale, tels que quatre taux d'apprentissage de redémarrage, dont les points de redémarrage sont situés lorsque le modèle est formé aux 200e, 400e, 600e et 800e tours, respectivement. La valeur de départ de chaque redémarrage du taux d'apprentissage est la valeur maximale du taux d'apprentissage précédent multipliée par un facteur d'échelle, qui est utilisé dans cet article comme 0,7.

Définissez différents taux d'apprentissage de recuit cosinus de redémarrage.

Le processus d'apprentissage du modèle utilise une méthode de récession du taux d'apprentissage par recuit cosinus de redémarrage, qui entraîne la modification de la fonction de perte en raison de l'augmentation du taux d'apprentissage pendant le redémarrage du taux d'apprentissage. Dans cet article, YOLOv4_GECA_3_SGDR_4 indique que quatre opérations de taux d'apprentissage de redémarrage ont été effectuées lors de la formation du modèle YOLOv4_GECA_3, et ainsi de suite. Le processus de formation du modèle YOLOv4_GECA_3_SGDR_4 est illustré à la Fig. 17 avec une grande fluctuation de la fonction de perte de classification pendant le redémarrage du taux d'apprentissage, suivie d'une diminution continue de la fonction de perte.

La perte de classification change pendant la formation du modèle YOLOv4_GECA_3_SGDR_4.

Le modèle YOLOv4_GECA_3 avec une méthode de décroissance du taux d'apprentissage par recuit cosinus de redémarrage introduite pendant le processus de formation a été testé sur l'ensemble de test après la fin de la formation, et les résultats des tests sont présentés dans le tableau 3. Le tableau 3 contient les résultats des tests du modèle YOLOv4 avec des paramètres pour le modèle amélioré YOLOv4_GECA avec un nombre différent de taux d'apprentissage de redémarrage et le réseau YOLOv4_GECA_3_Decay avec une décroissance exponentielle des taux d'apprentissage. Les résultats montrent qu'une approche de décroissance du taux d'apprentissage par recuit cosinus de redémarrage est supérieure à l'approche de décroissance exponentielle sur le modèle YOLOv4_GECA. Dans le tableau, nous pouvons voir que le modèle YOLOv4_GECA_3_SGDR_1 a le mAP@0,5 et l'indice de rappel les plus élevés, où la précision moyenne de 0,901 est supérieure de 0,6 % à YOLOv4_GECA_3, et le rappel de 0,907 est supérieur de 1,3 % à YOLOv4_GECA_3. Le taux d'apprentissage du triple redémarrage apporte également une grande amélioration des performances du modèle, avec un [email protected] de 0.898 par rapport à YOLOv4_GECA_3, et un Recall de 0.899 par rapport à YOLOv4_GECA_3, soit une amélioration de 0.5%. Dans l'ensemble, l'introduction d'une approche de décroissance du taux d'apprentissage par recuit cosinus de redémarrage pendant l'apprentissage est efficace et n'impose aucune charge sur les paramètres du modèle, et n'a aucun effet sur la vitesse de détection du modèle.

Le modèle de détection de corps étrangers dans cette étude est formé sur l'ensemble de données d'images de corps étrangers de la ceinture minière, et la comparaison expérimentale montre que le modèle YOLOv4 fonctionne mieux en termes de précision et de rappel par rapport aux modèles YOLOv3, YOLOv3-spp et YOLOv5, avec un mAP de 0,885 et un rappel de 0,888, de sorte que le modèle YOLOv4 est choisi comme modèle de base pour la détection de corps étrangers et améliore la structure du modèle YOLOv4 et la façon dont du taux d'apprentissage décroissant pendant la formation, respectivement. Premièrement, la structure du modèle YOLOv4 est améliorée et le modèle YOLOv4_GECA est construit dans le réseau dorsal CSPDarknet53 en combinant le mécanisme d'attention GECA proposé dans cet article. En entraînant et en testant le modèle YOLOv4_GECA avec différents hyperparamètres k séparément, les meilleures performances du modèle YOLOv4_GECA_3 sont obtenues. Ensuite, la méthode de décroissance du taux d'apprentissage lors de la formation du modèle YOLOv4_GECA_3 est améliorée, et la méthode de décroissance du taux d'apprentissage par recuit cosinus de redémarrage est proposée pour améliorer encore les performances du modèle. YOLOv4_GECA_3_SGDR_1 a les meilleures performances avec un mAP de 0,901 et un Recall de 0,907. La figure 18 montre la comparaison des performances des modèles YOLOv4, YOLOv4_GECA_3 et YOLOv4_GECA_3_SGDR_1, et nous pouvons voir que mAP et Recall du modèle YOLOv4 sont améliorés après avoir combiné le mécanisme d'attention GECA proposé dans cet article. Les performances du modèle sont encore améliorées par la méthode de décroissance. L'approche d'amélioration du modèle dans cette étude améliore les performances des corps étrangers du modèle, réduit le taux de détection manquée et de fausse détection, et peut toujours être appliquée dans le processus de production réel, bien qu'il y ait une diminution de la vitesse de détection.

Comparaison des performances du modèle.

Pour différentes reconnaissances de corps étrangers, les tableaux 4 et 5 montrent les résultats des modèles YOLOv4, YOLOv4_GECA_3 et YOLOv4_GECA_3_SGDR_1 pour chaque type de reconnaissance de corps étrangers, respectivement. D'après le tableau 4, on peut voir que les deux modèles améliorés YOLOv4_GECA et YOLOv4_GECA_SGDR_1 proposés dans cet article améliorent la précision de détection de chaque catégorie de corps étrangers par rapport au modèle de base YOLOv4, par exemple, le mAP@0,5 du modèle YOLOv4 dans la détection de corps étrangers de câbles en acier n'est que de 0,638, tandis que YOLOv4_GECA_3 améliore cet indice à 0,664. Toujours à partir du tableau 5, on peut voir que le modèle amélioré dans cet article améliore le rappel pour chaque catégorie de détection de corps étrangers, YOLOv4 a un rappel de 0,957 pour la détection de corps étrangers dans les tuyaux en plastique, tandis que YOLOv4_GECA_3 améliore l'indice à 0,975. Les résultats de ces deux tableaux montrent que le mécanisme d'attention GECA proposé dans cet article a amélioré la détection des corps étrangers difficiles causés par de petits objets, l'occlusion partielle de corps étrangers et les interférences de poussière, prouvant l'efficacité du mécanisme d'attention GECA.

Une comparaison des résultats de prédiction des modèles YOLOv4, YOLOv4_GECA et YOLOv4_GECA_SGDR pour certaines images est illustrée à la Fig. 19. Trois images contenant des corps étrangers sont affichées de gauche à droite, et les résultats de détection de trois modèles de détection d'objets pour les images de corps étrangers sont affichés dans l'ordre de haut en bas. Dans l'image Image4, on peut voir que le corps étranger du câble en acier est partiellement obscurci et que le modèle YOLOv4 dévie dans la prédiction de l'emplacement du corps étranger par rapport aux deux autres modèles améliorés, et les modèles améliorés YOLOv4_GECA et YOLOv4_GECA_SGDR dans cet article sont plus précis dans la détection du corps étranger. Dans l'image Image5, influencée par la lumière et l'occlusion, le modèle YOLOv4 a connu un faux positif, prédisant un seul corps étranger de câble en acier comme deux, et la confiance de prédiction du tube en plastique était inférieure à celle des deux autres modèles améliorés. Dans l'image Image6, en raison de la barre d'armature enterrée et relativement petite, qui a été perturbée par la poussière, la lumière et l'obscurcissement de nombreux facteurs, le modèle YOLOv4 a subi une détection de corps étranger de barre d'armature manquée, ce qui aurait un impact sur la sécurité de la production ultérieure. La comparaison des résultats de détection d'image montre que les deux modèles améliorés YOLOv4_GECA et YOLOv4_GECA_SGDR proposés dans cet article sont plus efficaces que le modèle de base YOLOv4 pour détecter les petits objets, les corps étrangers partiellement obscurcis et les corps étrangers difficiles à identifier en raison des interférences de poussière. En résumé, le modèle YOLOv4_GECA amélioré proposé avec mécanisme d'attention basé sur GECA et le modèle YOLOv4_GECA_SGDR proposé avec un taux d'apprentissage de recuit cosinus de redémarrage décroissant sont validés à l'aide d'expériences comparatives pour améliorer la précision de détection et le rappel de détection dans la détection de corps étrangers difficiles à identifier causés par de petits objets, des corps étrangers partiellement obscurcis et des interférences de poussière, et peuvent être appliqués au site réel de transport du minerai.

Comparaison de l'effet de détection des trois modèles.

Cet article sélectionne YOLOv4 comme modèle de base de détection d'objets étrangers et propose le mécanisme d'attention GECA pour construire le modèle YOLOv4_GECA, qui peut exploiter pleinement les informations de contexte globales de la carte des caractéristiques, obtenir la relation de dépendance entre chaque canal et améliorer la capacité d'extraction de caractéristiques du modèle pour les petits objets étrangers cibles, les objets étrangers partiellement occlus et les images d'interférence de poussière. Il est également proposé d'améliorer la méthode originale de décroissance du taux d'apprentissage de YOLOv4 en construisant une méthode de décroissance du taux d'apprentissage par recuit cosinus de redémarrage basée sur le modèle YOLOv4_GECA avec le réseau YOLOv4_GECA_SGDR. Ce réseau augmente la polyvalence du processus de formation et d'optimisation du réseau de détection d'objets étrangers et améliore les performances du modèle dans la détection d'images d'objets étrangers sans augmenter la charge du modèle, ce qui est plus adapté à la formation de modèles de détection d'objets étrangers pour les ceintures minières. Des expériences ont été menées sur l'ensemble de données de détection de corps étrangers de la ceinture minière créé, et les résultats de l'analyse expérimentale ont montré que la précision et le rappel de la méthode YOLOv4_GECA proposée dans cet article ont été considérablement améliorés et ont atteint un équilibre entre précision et vitesse, où la précision a atteint 0,901, le rappel 0,907 et le Fps 30,31 ms, atteignant l'objectif d'améliorer la détection des corps étrangers dans les ceintures minérales.

Les ensembles de données utilisés et/ou analysés au cours de l'étude en cours sont disponibles auprès de l'auteur correspondant sur demande raisonnable.

Janssens, E., De Beenhouwer, J. & Van Dael, M. Réseau de neurones Rétroprojection filtrée basée sur la transformée de Hilbert pour une inspection rapide par rayons X en ligne. Mes. Sci. Technol. 29(3), 034012 (2018).

Annonces d'article Google Scholar

Ren S, He K, Girshick R, et al. R-CNN plus rapide : vers une détection d'objets en temps réel avec des réseaux de proposition de région. Adv. Information neuronale. Processus. Syst. 28 (2015).

Redmon, J., Divvala, S., Girshick, R., et al. Vous ne regardez qu'une seule fois : détection d'objet unifiée en temps réel. en 2016 IEEE Conference on Computer Vision and Pattern Recognition, Las Vegas, États-Unis, 2016 : 779–788. doi : https://doi.org/10.1109/CVPR.2016. 91.

Redmon, J. et Farhadi, A. YOLO9000 : Meilleur, plus rapide, plus fort. en 2017 IEEE Conference on Computer Vision and Pattern Recognition, Honolulu, États-Unis, 2017 : 6517–6525. doi : https://doi.org/10.1109/CVPR.2017.690.

Redmon, J. et Farhadi, A. YOLOv3 : Une amélioration progressive. prétirage arXiv arXiv:1804.02767, (2018).

Bochkovskiy A, Wang CY, Liao HYM. YOLOv4 : Vitesse et précision optimales de la détection d'objets. arXiv : 2004.10934, (2020).

Liu W, Anguelov D, Erhan D, et al. SSD : détecteur Single Shot MultiBox. dans Actes de la 14e Conférence européenne sur la vision par ordinateur. Amsterdam : Springer, 2016. 21–37.

Jocher, G., Stoken, A., Borovec, J., et al. Ultralytics/YOLOv5 : V3.1 - corrections de bugs et améliorations des performances [EB/OL]. https://doi.org/10.5281/zenodo.4154370 (2020).

Li, C., Li, L., Jiang, H., et al. YOLOv6 : un cadre de détection d'objets en une seule étape pour les applications industrielles. prétirage arXiv arXiv:2209.02976, (2022).

Wang, CY, Bochkovskiy, A., Liao, HYM YOLOv7 : Le sac de cadeaux entraînable définit un nouvel état de l'art pour les détecteurs d'objets en temps réel. prétirage arXiv arXiv:2207.02696, (2022).

Cao, X. et al. CNN régional pour la détection de débris de corps étrangers sur les chaussées d'aérodrome. Capteurs 18(3), 737 (2018).

Article ADS PubMed PubMed Central Google Scholar

Xu, H. et al. Reconnaissance de matériaux de débris d'objets étrangers basée sur des réseaux de neurones convolutifs. J. Image Vidéo Proc. 2018, 21. https://doi.org/10.1186/s13640-018-0261-2 (2018).

Article Google Scholar

Rong, D., Xie, L. & Ying, Y. Détection par vision par ordinateur d'objets étrangers dans les noix à l'aide de l'apprentissage en profondeur. Calcul. Électron. Agric. 162, 1001-1010 (2019).

Article Google Scholar

Lui, Q. et al. Détection de corps étrangers sur le soubassement des trains à grande vitesse basée sur le deep learning. Accès IEEE 7, 183838–183846. https://doi.org/10.1109/ACCESS.2019.2960439 (2019).

Article Google Scholar

Pang, L. et al. Détection d'objets cachés en temps réel à partir d'images à ondes millimétriques passives basées sur l'algorithme YOLOv3. Capteurs 20(6), 1678 (2020).

Article ADS PubMed PubMed Central Google Scholar

Chen, Y. et al. Application de l'algorithme YOLOv4 pour la détection de corps étrangers sur un convoyeur à bande dans un environnement à faible éclairage. Capteurs 22(18), 6851 (2022).

Article ADS PubMed PubMed Central Google Scholar

Qiu, Z. et al. Application d'un algorithme YOLOv5 amélioré dans la détection en temps réel d'objets étrangers par radar à pénétration de sol. Télédétection 14(8), 1895 (2022).

Annonces d'article Google Scholar

Jing, Y. et al. Détection de débris de corps étrangers pour capteurs d'imagerie optique basée sur une forêt aléatoire. Capteurs 22(7), 2463 (2022).

Article ADS PubMed PubMed Central Google Scholar

Abramson, HG et al. Détection automatique de corps étrangers en neurochirurgie par une approche d'apprentissage profond sur des images échographiques peropératoires : des modèles animaux aux premiers tests sur l'homme. Devant. Surg. 30(9), 1040066. https://doi.org/10.3389/fsurg.2022.1040066 (2022).

Article Google Scholar

Sowmya V, Radha R. Détection de véhicules lourds basée sur YOLOv4 avec des techniques d'augmentation de données et d'apprentissage par transfert. dans Journal of Physics : Série de conférences. Vol 1911, 1, 012029 (Éditions IOP, 2021).

Hou Z, Liu X, Chen L. Algorithme de détection d'objets pour améliorer la suppression non maximale à l'aide de la série de conférences GIoU.in IOP : Science et ingénierie des matériaux. Vol. 720, n° : 1, 012062 (Éditions IOP, 2020).

Wang CY, Liao HYM, Wu YH, et al. CSPNet : Une nouvelle dorsale qui peut améliorer la capacité d'apprentissage de CNN. dans Actes de la conférence IEEE/CVF sur les ateliers de vision par ordinateur et de reconnaissance de formes. 390–391 (2020).

Ge, R. et al. Réseau convolutif de compression et d'excitation pour la détection d'arythmie ECG. Artif. Renseignement. Méd. 121, 102181 (2021).

Article PubMed Google Scholar

Télécharger les références

Ce travail a été soutenu en partie par le programme national clé de recherche et de développement de Chine dans le cadre de la subvention 2020AAA0109200 ; en partie par le programme de revitalisation des talents du Liaoning dans le cadre de la subvention XLYC2008020 ; en partie par la Fondation nationale des sciences naturelles de Chine dans le cadre de la subvention 52074064 ; en partie par les fonds de recherche fondamentale des universités centrales de Chine dans le cadre des subventions N2304006, N2204006 et N2104026.

École des sciences de l'information et de l'ingénierie, Northeastern University, Shenyang, 110004, Chine

Dong Xiao, Panpan Liu et Hang Yu

Liaoning Key Laboratory of Intelligent Diagnosis and Safety for Metallurgical Industry, Northeastern University, Shenyang, 110819, Chine

Dong Xiao et Panpan Liu

Shenyang Institute of Computing Technology Co. Ltd., CAS, Shenyang, 110168, Liaoning, Chine

Jichun Wang

Collège des sciences, Université Shenyang Jianzhu, Shenyang, 110168, Liaoning, Chine

Jichun Wang

Le premier hôpital de l'Université médicale de Chine, Shenyang, Chine

Zhengmin Gu

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

DX a conçu l'étude et rédigé le texte principal du manuscrit. PL a collecté des données. JW a analysé et interprété les données. ZG a préparé des figures et des tableaux. HY a révisé le manuscrit. Tous les auteurs ont révisé le manuscrit.

Correspondance à Dong Xiao.

Les auteurs ne déclarent aucun intérêt concurrent.

Springer Nature reste neutre en ce qui concerne les revendications juridictionnelles dans les cartes publiées et les affiliations institutionnelles.

Libre accès Cet article est sous licence Creative Commons Attribution 4.0 International, qui permet l'utilisation, le partage, l'adaptation, la distribution et la reproduction sur n'importe quel support ou format, à condition que vous accordiez le crédit approprié à l'auteur ou aux auteurs originaux et à la source, fournir un lien vers la licence Creative Commons et indiquer si des modifications ont été apportées. Les images ou tout autre matériel de tiers dans cet article sont inclus dans la licence Creative Commons de l'article, sauf indication contraire dans une ligne de crédit au matériel. Si le matériel n'est pas inclus dans la licence Creative Commons de l'article et que votre utilisation prévue n'est pas autorisée par la réglementation légale ou dépasse l'utilisation autorisée, vous devrez obtenir l'autorisation directement du détenteur des droits d'auteur. Pour voir une copie de cette licence, visitez http://creativecommons.org/licenses/by/4.0/.

Réimpressions et autorisations

Xiao, D., Liu, P., Wang, J. et al. Méthode de détection de corps étrangers en ceinture minière basée sur le modèle YOLOv4_GECA. Sci Rep 13, 8881 (2023). https://doi.org/10.1038/s41598-023-35962-3

Télécharger la citation

Reçu : 10 février 2023

Accepté : 26 mai 2023

Publié: 01 juin 2023

DOI : https://doi.org/10.1038/s41598-023-35962-3

Toute personne avec qui vous partagez le lien suivant pourra lire ce contenu :

Désolé, aucun lien partageable n'est actuellement disponible pour cet article.

Fourni par l'initiative de partage de contenu Springer Nature SharedIt

En soumettant un commentaire, vous acceptez de respecter nos conditions d'utilisation et nos directives communautaires. Si vous trouvez quelque chose d'abusif ou qui ne respecte pas nos conditions ou directives, veuillez le signaler comme inapproprié.