Применение методов машинного обучения для поиска дефектов на рельсах (Часть 2)

Использование методов машинного обучения для обнаружения дефектов на рельсах (Часть 2)

Для обеспечения безопасности движения в железнодорожном транспорте регулярно проводится неразрушающий контроль рельсов с использованием различных подходов и методов. Один из основных подходов к определению эксплуатационного состояния железнодорожных рельсов – это ультразвуковое неразрушающее тестирование [1]. В настоящее время поиск изображений дефектов рельсов с использованием полученных дефектограмм осуществляется с помощью человека. Успешное развитие алгоритмов поиска и классификации данных позволяет предложить использование методов машинного обучения для определения дефектов рельсов и снижения рабочей нагрузки на людей путем создания экспертных систем.

Сложность создания таких систем описана в [1, 3-6, 22] и связана, с одной стороны, с разнообразием графических изображений, полученных в процессе многоканального ультразвукового контроля рельсов, а с другой – с небольшим количеством данных с дефектами (небалансированными). Один из возможных способов создания экспертных систем в этой области – это подход, основанный на разложении сложной задачи анализа всей многоканальной дефектограммы на отдельные каналы или их наборы, характеризующие отдельные типы дефектов. 

Один из наиболее распространенных дефектов рельсов – это радиальная трещина в болтовом отверстии, известная в литературе как “звездная трещина” (рис. 1). Этот тип дефекта обычно обнаруживается каналом дефектоскопа с предпочтительным центральным наклонным углом входного ультразвукового излучения в диапазоне 380-450 [1-2]. Несмотря на систематическое внедрение непрерывного пути в сети железных дорог, диагностика болтовых отверстий является важной задачей [1-2], что послужило причиной его выделения и рассмотрения в данной работе.

Рис. 1 – Пример радиальной трещины в болтовом отверстии рельсы

  • Цель работы: сравнить эффективность различных моделей машинного обучения при решении задачи классификации состояний болтовых отверстий железнодорожных рельсов в ходе ультразвукового их обследования.

Для достижения поставленной цели решаются следующие задачи:

  • Формирование и подготовка набора данных
  • Исследовательский анализ данных
  • Выбор протоколов и метрик для оценки работы алгоритмов
  • Выбор и синтез реализаций моделей классификации
  • Оценка эффективности моделей на тестовых данных

Формирование и подготовка набора данных

При движении дефектоскопа, оснащенного пьезоэлектрическими преобразователями (ПЗТ) вдоль железнодорожного пути, в рельс испускаются ультразвуковые импульсы в течение определенного периода. В то же время ПЗТ регистрируют отраженные волны. Обнаружение дефектов ультразвуковым методом основано на принципе отражения волн от металлических неоднородностей, так как трещины, включая другие неоднородности, отличаются своим акустическим сопротивлением от остальной части металла [1-5].

При ультразвуковом сканировании рельсов их структурные элементы и дефекты имеют акустические отклики, которые отображаются на дефектограмме в виде характерных графических изображений (сканов). На рисунке 2 показаны примеры дефектограмм в виде B-скана («Яркий скан») участков рельсов с болтовым соединением, полученных измерительными системами различных типов под определенным углом входного ультразвука.

Рис. 2 – Примеры отдельных каналов обнаружения дефектов (B-скан) при сканировании болтовых отверстий рельсов дефектоскопами разных компаний

Индивидуальные сканы болтовых отверстий (кадры) могут быть выделены из таких дефектодограмм, например, применяя амплитудные критерии (рис. 3).

Рис. 3 – Выделение кадров с сигналами о болтовых отверстиях из B-скана

Ширина W и длина L каждого кадра одинаковая (рис. 3) и выбирается на основе максимально возможных размеров сигнализирующих болтовых отверстий и их дефектов. Каждый такой кадр (экземпляр) представляет собой часть B-скана и поэтому содержит данные о координатах, измерениях и размерах каждой точки, данные от каждого из двух ультразвуковых сигнальных входов на рельс (+/- 400). В работе [3] такие данные кадры преобразуются в матрицу формата (60, 75), размером 60 * 75 = 4500 элементов в градациях серого цвета, строится и успешно обучается классификационная сеть на основе методов глубокого обучения. Однако в работе не рассматриваются альтернативные и менее емкие варианты форматов данных кадров и не показываются возможности базовых методов и моделей машинного обучения, поэтому эта работа рассчитана на заполнение этого недостатка.

Различные формы радиальных трещин в болтовых отверстиях рельсов, их местоположение и отражательные свойства поверхности приводят к изменению графических изображений и, вместе с бездефектным состоянием, генерируют набор данных с возможностью различать 7 классов. В практике бинарной классификации принято присваивать класс “1” более редким и интересующим исходам или состояниям, а класс “0” – общему состоянию. В отношении идентификации дефектов мы определим общее и часто встречающееся в практике бездефектное состояние – класс “0” и некоторые классы дефектов “1”-“6”. Каждый класс дефектов отображается на дефектограмме в виде характерного изображения, которое видно экспертам во время расшифровки данных (рис. 4). Хотя присутствие или отсутствие дефекта (бинарная классификация) является решающим фактором в процессе эксплуатации железнодорожного пути, мы будем рассматривать возможности алгоритмов классификации и определить, какие типы дефектов или неисправностей в большей степени могут быть ложно классифицированы как бездефектные, что является опасным случаем при диагностике рельсов. Поэтому в данной работе задача классификации сводится к однозначно многоклассовой классификации.

Рисунок 4 – Примеры кадров B-скана (60, 75) с характерными изображениями отверстий с разными радиальными трещинами, отнесенными к одному из 7 классов

Каждый экземпляр класса может быть представлен в виде базовой структуры – прямоугольных данных. Чтобы выровнять размер экземпляров, установите длину формата таблицы равной k = 60 записям (на 30% больше, чем максимально возможное значение), заполните пустые ячейки нулевыми значениями (рис. 5а). Затем исходный экземпляр может иметь форму (6, 60) или быть преобразован в форму плоского массива и описан в n=6*60=360-мерном пространстве (рис. 5с), и на графике B-скана он будет выглядеть так, как показано на рис. 5б.

Рисунок 5 – Представление экземпляра прямоугольных данных

Выбор протокола оценки

Сбор и аннотирование данных с ультразвукового тестирования рельсов связано с существенными трудностями, которые описаны в [3], поэтому мы будем использовать синтезированный набор данных, полученных с помощью математического моделирования. Суть этого подхода отражена на рис. 6, и его применимость показана в [3]. Термин “синтезированные данные” широко обсуждается при создании объектов визуальной реальности, например, на блоге nVIDEA [23]. Эта работа расширяет применение синтезированных данных на область неразрушающего контроля.

Рисунок 6 – Применение модели машинного обучения

Достаточно большое количество экземпляров данных, полученных на основе математического моделирования, позволяет избежать проблемы с редким классом и выбрать протокол оценки моделей в виде отдельных сбалансированных наборов: обучение, верификация и тестирование. Ограничим размеры наборов данных: объем обучающих данных = 50 000, объем тестовых данных = 50 000, объем данных для валидации = 10 000 экземпляров.

Выбор метрики успеха

Отсутствие различий в относительных размерах классов (сбалансированность классов) позволяет выбрать показатель точности как метрику успеха при обучении алгоритмов, значение которой равно отношению числа правильно классифицированных экземпляров к их общему количеству. Одна метрика не может оценить все аспекты применимости модели для конкретной ситуации, поэтому на этапе тестирования модели используется матрица ошибок, метрики точности и полноты для каждого классификатора класса.

Анализ исследовательских данных

Информация о сбалансированности классов в обучающем, тестовом и валидационном наборе данных представлена на рис. 7.

Рисунок 7 – Сводная информация о количестве данных

На рис. 8 показана графическая представление распределения нормализованных глубин аварий и их координат для положительного измерительного канала Ch + 400 и классов 0, 2, 3 и 6. Распределения для Ch-400 и каналов 0, 1, 4 и 5 имеют симметричный образец.

Рисунок 8 – Распределение нормализованных значений координат и глубин данных из измерительного канала Ch+400 для классов 0, 2, 3 и 6

Метод главных компонент (PCA) был использован в качестве анализа исследовательских данных и определения избыточности данных, двумерное представление которого может быть представлено в виде рис. 9. Центральным классом является класс 0, от которого классы 2, 3, 6 и 1, 4, 5 находятся на противоположных сторонах, что соответствует их графическому отображению на B-скане.

 

Рисунок 9 – Визуализация двухмерного представления метода PCA

В общем случае, двухмерное представление классов имеет слабую кластеризацию, что указывает на необходимость использования более высокой размерности данных для их классификации в пределах оригинального плоского размера 6*60=360. График интегральной объяснимой дисперсии в зависимости от количества компонент метода PCA (рисунок 10а) показывает, что при использовании 80 компонент объясняется уже 98% дисперсии, что свидетельствует о высоком уровне избыточности исходных данных. Это можно объяснить разреженностью данных, которая показывает независимость полученных 80 компонент метода PCA от нулевых значений (рисунок 10б).

Рисунок 10 – PCA: а) интегральная объяснимая дисперсия в зависимости от количества компонент метода PCA, b) вклады предиктивных переменных плоского массива данных в проекции на оси PCA

Рассмотрим оценку заполненности экземпляров данных ненулевыми значениями для каждого класса (рисунок 11).

Рис. 11 – Оценка загруженности с ненулевыми значениями экземпляров классов

Примечание:

  1. Сходство диапазонов и квартилей классов
  2. Класс 0 имеет самый низкий медиану, так как отсутствуют дополнительные сигналы трещин в двух отверстиях болта без дефектов.
  3. Классы 5 и 6 имеют наибольшие значения медианы, что указывает на высокую заполненность данных из-за сигналов от верхней и нижней радиальной трещины в отверстии болта.
  4. Классы 1-4 имеют схожие значения медианы, что указывает на заполнение данных только сигналами от верхней или нижней радиальной трещины в отверстии болта.
  5. Классы 1 и 2, 3 и 4, 5 и 6 соответственно имеют схожие медианы и распределения из-за симметрии данных относительно центра отверстия болта.
  6. Уровень 80 компонентов метода PCA ниже медианы для классов 1-6, но достаточен для описания 98% вариаций, что может указывать на избыточность, вызванную не только нулевыми значениями в данных. Возможное объяснение может быть в том, что значения амплитуд сигналов в каждом классе мало меняются и слабо влияют на вариацию. Этот факт подтверждается практикой поиска дефектов, в которой дефектоскопы часто не используют параметр амплитуды.

Для оценки сложности предстоящей задачи исследовательского анализа данных была изучена многомерная структура входных данных с использованием методов Manifold learning (Обучение многообразия):

  • Случайное проекционное вложение
  • Изометрическое отображение (Isomap)
  • Стандартное локально-линейное вложение (LLE)
  • Модифицированное локально-линейное вложение (LLE)
  • Локальное касательное пространство (LTSA)
  • Многомерное шкалирование (MDS)
  • Спектральное вложение
  • t-распределенное стохастическое вложение соседей (t-SNE)

Также рассмотрены методы, которые могут быть использованы для контролируемого сокращения размерности и проекции данных в более низкую размерность:

  • Усеченное SVD-вложение
  • Случайное дерево вложения
  • Анализ компонент соседей (NCA)
  • Линейный дискриминантный анализ (LDA)

Результаты алгоритмов вложения данных из 3 000 выборок оригинальной формы (6, 60) в двумерное пространство представлены на рис. 12.

Рис. 12 – Вложение данных в двумерное пространство с использованием различных методов (цвет точек представляет класс)

Для методов обучения многообразий данные на графиках плохо обособлены в параметрическом пространстве, что характеризует предсказуемую сложность классификации данных с помощью простых обучаемых алгоритмов.

Также обратите внимание на то, что метод контролируемого сокращения размерности – Линейный Дискриминантный Анализ – показывает хорошую группировку данных и может быть кандидатом для классификационной модели.

Разработка моделей классификации данных

Базовая модель

Точность предсказания каждого из семи возможных классов случайным классификатором равна 1 / 7 = 0,143 и является отправной точкой для оценки статистической мощности (качества) будущих моделей.

В качестве базовой модели мы выберем Gaussian Naive Bayes, который часто используется в таких случаях. Фрагмент кода для настройки модели на обучающих данных и ее предсказания на тестовых данных:

Полученная матрица различий и сводный отчет о качестве модели представлены на рис. 13а и 13б. Обученная модель обладает статистической мощностью, так как имеет общую точность 0,5819, что в 4 раза выше точности случайного классификатора. Несмотря на достаточно низкую точность модели, мы рассмотрим конкретное соотношение между качественными показателями ее работы и графическим представлением проекционных данных, используя метод Линейного Дискриминантного Анализа (рис. 13с).

Рис. 13 – Сводные оценки качества модели Gaussian Naïve Bayesian: а) матрица различий, показывающая частоту неправильной классификации модели; б) отчет о качестве модели в форме различных метрик точности; c) проекция данных в двумерное пространство с использованием метода Линейного Дискриминантного Анализа

Проекционные данные класса 6 наиболее удалены от большинства точек других классов (рис. 13с), что отражается в высокой точности его классификатора, равной 0,9888, однако близость представления класса 3 уменьшает полноту классификатора 6 до 0,5688 из-за ложноотрицательных предсказаний, которые выражаются ошибкой, равной 2164, в матрице различий.

Удалена проекция класса 5, что отражено в высокой точности его классификатора, равной 0.9916, однако у него имеются пересечения с классами 1 и 4, что повлияло на полноту классификатора, равную 0.4163, из-за ошибочных предсказаний с частотами 2726 и 1268 для классификаторов 1 и 4 соответственно.

Проекция класса 1 имеет пересечения с классами 5, 4 и 0, а классификатор 1 соответственно имеет ложные положительные значения с частотой 2726 для класса 5 и ложные отрицательные значения с частотами 2035 и 3550 в пользу классификаторов 0 и 4.

Аналогичные отношения наблюдаются и для других классов. Один из интересных примеров – поведение классификатора 0. Класс 0 без дефектов находится посреди проекций, что соответствует его графическому изображению, которое ближе всего к классам 1, 2, 3 и 4 и наиболее различимо от классов 5 и 6 (рис. 4). Классификатор 0 хорошо распознает свой класс данных, что приводит к самому высокому показателю полноты 0.9928, однако имеет множество ложных положительных значений в классах 1, 2, 3 и 4 с точностью 0.4224, то есть классы с дефектами часто классифицируются как класс без дефектов (класс 0), что делает модель наивного байесовского классификатора с гауссовым распределением полностью непригодной для целей обнаружения дефектов. Результирующий классификатор наивного байесовского гауссовского классификатора достаточно прост для описания сложной структуры данных.

Модель классификатора линейного дискриминантного анализа (LDA)

Предварительный анализ на основе сокращения размерности данных показал хорошую группировку классов в методе линейного дискриминантного анализа (рис. 12), что послужило мотивацией для его использования в качестве одной из следующих моделей:

Результаты обучения и предсказания представлены на рис. 14. Общая точность модели составляет 0.9162, что в 1.57 раза лучше точности базовой модели. Однако у классификатора 0 есть большое количество ложных положительных значений для классов 2 и 4, а его точность составляет только 0.8027, что также не является удовлетворительным показателем для целей практического применения.

Рисунок 14 – Общая оценка качества работы классификатора линейного дискриминантного анализа (LDA)

Предположение о возможной нехватке данных для обучения для повышения точности модели LDA не подтверждается, так как построенная “кривая обучения”, представленная на рис. 15, показывает высокую сходимость зависимостей точности обучения и тестирования на уровне 0.92 при размере обучающего набора от 5000 до 6000 элементов:

Рисунок 15: Высокая сходимость зависимостей точности обучения и тестирования на уровне 0.92 при размере обучающего набора от 5000 до 6000 элементов

При попытке создания такой системы классификации производители оборудования для обнаружения дефектов сталкиваются с трудностью оценки зависимости предсказательной точности системы от количества элементов в наборе данных, которые должны быть получены в процессе диагностики рельсов. Построенная кривая обучения на основе данных модели позволяет в данном случае оценить это количество в диапазоне 5000 – 6000 экземпляров для достижения точности 0.92 в рамках алгоритма LDA.

Уменьшающаяся зависимость кривой обучения от тренировочных данных (синий цвет на рис. 15) классификатора LDA показывает его достаточную простоту для сложной структуры данных и наличие обоснованной потребности в поиске более сложной модели для улучшения точности предсказания.

Плотная нейронная сеть

Один из вариантов повышения точности прогнозирования – использование полносвязных сетей. Вариант такой структуры с найденными оптимальными параметрами с использованием инструмента Keras_tuner показан на рис. 16a, точность модели увеличилась по сравнению с предыдущим методом до 0.974 (рис. 16б), а точность классификатора нулевого класса составила 0.912.

Рис. 16 – Структура модели и показатели точности

Постепенное движение к увеличению точности прогнозирования за счет использования более сложных (вычислительно затратных) алгоритмов машинного обучения показывает обоснованность действий по созданию все более сложных моделей.

Метод опорных векторов (SVM)

Использование алгоритма опорных векторов с ядром в виде радиальной базисной функции и моделей гиперпараметров, на основе GridSearchCV из библиотеки машинного обучения scikit-learn, позволило получить модель с улучшенными показателями качества (рис. 17).

Рис. 17 – Сводная информация о оценках производительности классификатора на основе метода опорных векторов (SVM)

Использование метода SVM увеличило как общую точность предсказания до 0.9793, так и точность классификатора для нулевого класса до 0.9447. Однако среднее время работы алгоритма на тестовом наборе данных из 50 000 экземпляров с изначальной размерностью каждого составляло 9,2 секунды и является максимальным для рассматриваемых классификаторов. Снижение времени работы модели с использованием техник уменьшения размерности и алгоритма SVM в виде конвейеров не позволило сохранить достигнутую точность.

Классификатор Случайного Леса

Классификатор RandomForestClassifier на основе ансамбля случайных деревьев, реализованный в библиотеке scikitlearn, является одним из кандидатов на увеличение точности классификации рассматриваемых данных:

Оценки производительности алгоритма RandomForest из 50 деревьев на тестовом наборе данных показаны на Рис. 18. Алгоритм позволил увеличить как общую точность предсказания до 0.9991, так и важный показатель в виде точности классификатора для нулевого класса до 0.9968. Классификатор нулевого класса делает наибольшее количество ошибок в классах 1-4, которые графически схожи. Точность классификаторов классов 1-4 высока и снижается из-за ошибок в пользу классов 5 и 6, что не критично при нахождении дефектов.

Среднее время работы алгоритма при предсказании на тестовом наборе данных на ЦП составляло 0,7 секунды, что в 13 раз меньше времени работы SVM с увеличением точности на 0,02%.

Рис. 18 – Сводная оценка качества классификатора на основе метода случайного леса

Кривая обучения классификатора RandomForestClassifier на Рис. 19 демонстрирует высокий уровень оптимальности построенной модели:

  • С увеличением объема тренировочных данных эффективность модели не снижается, что указывает на отсутствие недообучения.
  • Оценка эффективности на этапе обучения и тестирования сходится и имеет высокие значения с разницей не более 0,028, что может свидетельствовать о том, что модель не переобучена.

Рис. 19 – Кривая обучения RandomForestClassifier

Полученная кривая обучения позволяет оценить необходимое минимальное количество образцов каждого класса для достижения приемлемой точности на уровне 0,98: 1550 копий данных, то есть 1550 / 7 = 220 образцов для каждого из 7 классов.

Высокая точность и скорость алгоритма случайного леса позволяют оценить влияние (важность) всех 360 предиктивных переменных на общую точность модели. Оценка производилась путем получения среднего снижения точности модели путем случайного перемешивания одной из переменных, что способствует потере ее предсказательной силы. На Рис. 20 показан результат фрагмента кода для оценки важности переменных на точность модели:

Рис. 20 – Оценка важности предиктивных переменных с помощью RandomForestClassifier

График на Рис. 20 показывает, что наиболее важные предиктивные переменные находятся в диапазоне от 60 до 85 для канала +40 и от 240 до 265 для канала -40, которые определяют глубину сигнала. Наличие пиков в начале и конце каждого диапазона указывает на еще большую предиктивную важность глубины начала и конца сигналов. Общее количество важных переменных можно оценить в 50.

Важность переменных, определяющих координаты и амплитуду сигнала в каждом экземпляре данных, намного ниже. Эта оценка соответствует предположениям, сделанным во время анализа исследования. Обучение RandomForestClassifier на всем тренировочном наборе данных без амплитуд показало общую точность 0,9990, без амплитуд и координат – 0,9993. Исключение из рассмотрения таких параметров, как амплитуда и координата для каждого экземпляра данных, уменьшает размер рассматриваемых данных до (2, 60) = 120 предиктивных переменных без уменьшения точности. Полученный результат позволяет использовать только параметр глубины сигнала для целей классификации данных.

Достигнутая точность RandomForestClassifier является достаточной и решает задачу классификации дефектов в отверстиях для болтов. Однако, с целью обобщения возможностей, рассмотрим класс моделей глубокого обучения на основе сверточных нейронных сетей.

Модель Глубокого Обучения (DL)

Синтез и обучение сверточной сети требуют итеративного процесса с поиском лучших структур и оптимизацией их гиперпараметров. На рис. 21 показана конечная версия простой структуры сети в виде линейного стека слоев и процесс ее обучения.

Рис. 21 – Структура модели и отчет о процессе ее обучения

Результаты обучения и прогнозирования сверточной нейронной сети представлены на рис. 21. Общая точность модели на тестовых данных составила 0,9985, что в 1,71 раза лучше точности базовой модели. Количество ложноположительных результатов классификатора 0 составляет 2+24+6+2=34 из всех 42893 дефектных экземпляров (рис. 22а). Среднее время предсказания тестовых данных на ЦП составляло 4,55 с.

Рис. 22 – Сводная оценка работы обученной сети на основе СNN на тестовых данных

Одна из важных задач полученного классификатора при его практическом применении будет точное определение класса без дефектов (класс 0), что исключит ложную классификацию дефектных образцов как недефектных. Возможно уменьшение количества ложноположительных результатов для класса без дефектов путем изменения пороговой вероятности. Для оценки приемлемого значения порога отсечки проводилась бинаризация многоклассовой задачи с выбором состояния без дефектов и всех состояний с дефектами, что соответствует стратегии “Один против остальных”. По умолчанию значение порога для бинарной классификации установлено на 0,5 (50%). При таком подходе у бинарного классификатора имеются показатели качества, показанные на рис. 23.

Рис. 23 – Качественные показатели бинарного классификатора при пороге отсечки 0,5

Полученная точность для класса “Без дефекта” составляет 0,9952, такая же, как и для многоклассового классификатора для класса “0”. Использование функции sklearn.metrics.precision_recall_curve позволяет отразить изменения точности и полноты бинарного классификатора в зависимости от изменения порога отсечки (рис. 24а). При пороге отсечки 0,5 значение ложноположительных результатов составляет 34 образца (рис. 24б). Максимальный уровень точности и полноты классификатора достигается в точке пересечения их графиков, что соответствует порогу отсечки 0,66. В этой точке классификатор снижает количество ложноположительных результатов для класса “Без дефекта” до уровня 27 (рис. 24б). Увеличение порога до уровня 0,94 позволяет уменьшить ложноположительные результаты до значения 8 за счет увеличения количества ложноотрицательных образцов до 155 (рис. 24б) (уменьшая полноту классификатора). Дальнейшее увеличение порога отсечки значительно снижает полноту классификатора до неприемлемого уровня (рис. 24а).

Рис. 24 – Влияние порога отсечки: а) график изменения точности и полноты в зависимости от изменения значения порога отсечки (кривая точность-полнота); б) матрицы несоответствия при разных значениях параметра порога отсечки

При установленном пороге отсечки 0,94 качественные оценки классификатора показаны на рис. 25. Точность для класса “Без дефекта” увеличилась до 0,9989.

Рис. 25 – Качественные показатели бинарного классификатора с порогом отсечки 0,94

На рис. 26 показано восемь образцов ложноположительно классифицированных данных с характерными графическими признаками дефектов.

Рис. 26 – Восемь ложно-положительных образцов

Из указанных выше графических изображений контроверзными являются образцы, отмеченные как “контроверзные”, что указывает на наличие очень короткой радиальной трещины, которую трудно классифицировать как дефект. Остальные 6 образцов – ошибка классификатора. Обратите внимание на качественный показатель в виде отсутствия ложной классификации образцов с дефектами в виде значительной длины радиальной трещины. Такие образцы наиболее легко классифицировать при ручном анализе с помощью дефектоскопа.

Дальнейшее повышение точности модели возможно за счет использования ансамблей полученных моделей: DL и RandomForestClassifier. Рассматриваемые модели могут быть добавлены в ансамбль, но созданный с использованием другого формата входных данных, включая прямой формат Bscan, как показано в [3].

Выводы и обсуждение

Основные качественные показатели разработанных моделей для классификации дефектов в отверстиях болтов сводятся в диаграмме на рис. 27. Последовательное и обоснованное усложнение моделей классификации отражается на диаграмме в форме увеличения как общей точности моделей (синий цвет), так и важного показателя в виде точности класса 0 (оранжевый цвет). Максимальные показатели точности выше 0,99 были достигнуты моделями, основанными на случайном лесе и сверточных нейронных сетях. При этом модель случайного леса имеет преимущество в меньшем времени, затрачиваемом на предсказание.

Рис. 27 – Выделенные показатели качества рассматриваемых моделей классификации

В данной работе

  1. Показана возможность поиска дефектов на ультразвуковом дефектоскопе путем его декомпозиции на отдельные каналы с данными и выделения отдельных диагностических участков.
  2. Оценивается влияние предиктивных переменных в форме амплитуды и координат на качество классификации.
  3. Дается оценка необходимого объема набора данных для построения модели классификации дефектов в болтовых отверстиях с точностью 98%, что может служить руководством для производителей оборудования для дефектоскопии при создании автоматических экспертных систем.
  4. Показана возможность достижения высокой точности классификации состояний болтовых отверстий на основе классических алгоритмов машинного обучения.
  5. Получены качественные оценки работы модели глубокого обучения, которые показывают возможность и целесообразность использования архитектуры сверточных нейронных сетей для синтеза сегментационных сетей для поиска дефектов в непрерывных паттернах дефектов (B-скан).

Литература

  • [1] Марков А.А., Кузнецова Е.А. Обнаружение дефектов железнодорожных путей. Формирование и анализ сигналов. Книга 2. Декодирование дефектограмм. Санкт-Петербург: Ультра печать; 2014.
  • [2] Марков А.А., Мосягин В.В., Шилов М.Н., Федоренко Д.В. АВИКОН-11: Новый дефектоскоп для 100% контроля рельсов. NDT World Review. 2006; 2(32): 75-78. Доступно по: http://www.radioavionica.ru/activities/sistemy-nerazrushayushchego-kontrolya/articles/files/razrab/33.zip [Дата доступа 14 марта 2023 г.].
  • [3] Калюжный А. Приложение модели данных для обучения классификатора дефектов в болтовых отверстиях рельсов в ультразвуковой диагностике. Artificial Intelligence Evolution [Интернет]. 2023 апр. 14 [цитируется 28 июля 2023 г.];4(1):55-69. DOI: https://doi.org/10.37256/aie.4120232339
  • [4] Кузьмина Е.В., Горбунов О.Э., Плотников П.О., Тюкин В.А., Башкин В.А. Применение нейронных сетей для распознавания структурных элементов рельсов на магнитных и вихретоковых дефектограммах. Моделирование и анализ информационных систем. 2018; 25(6): 667-679. Доступно по: doi:10.18255/1818-1015-2018-6-667-679
  • [5] Bettayeb F, Benbartaoui H,  Raouraou B. Надежность ультразвуковой характеризации сварных соединений с помощью искусственной нейронной сети. 17-я Всемирная конференция по неразрушающему контролю; 2008;  Шанхай, Китай. [Дата доступа 14 марта 2023 г.]
  • [6] Young-Jin C, Wooram C, Oral B.  Обнаружение повреждений трещин с использованием сверточных нейронных сетей на основе метода глубокого обучения.  Computer-Aided Civil and Infrastructure Engineering.   2017; 32(5): 361-378. Доступно по: doi:10.1111/mice.12263
  • [7] Heckel T, Kreutzbruck M, Rühe S, Высокоскоростной бесконтактный контроль рельсов с использованием передовых ультразвуковых и вихретоковых методов контроля.  5-й международный семинар экспертов по НКНК – НКНК в процессе 2009 г. (Сборник).  2009; 5: 101-109. [Дата доступа 14 марта 2023 г.].
  • [8] Papaelias M, Kerkyras S, Papaelias F, Graham K. Перспективы технологии инспекции рельсов и проекта FP7 INTERAIL.  51-я ежегодная конференция Британского института   неразрушающего контроля 2012, NDT 2012. 2012. [Дата доступа 14 марта 2023 г.].
  • [9]  Rizzo P, Coccia S, Bartoli I, Fateh M.  Бесконтактный ультразвуковой контроль рельсов и обработка сигналов для автоматического обнаружения и классификации дефектов.  Insight. 2005; 47 (6): 346-353. Доступно по:  doi: 10.1784/insi.47.6.346.66449
  • [10] Nakhaee MC, Hiemstra D, Stoelinga M, van Noort M. Последние применения машинного обучения в обслуживании железнодорожного пути: Обзор. In: Coll