Где соприкасаются горные породы и искусственный интеллект пересечение минералогии и компьютерного зрения без обучения

Пересечение горных пород и искусственного интеллекта в минералогии и компьютерном зрении без обучения.

Минералы — это природные неорганические вещества с определенным химическим составом и кристаллической структурой. Они являются строительными блоками горных пород и играют важную роль в различных геологических и промышленных процессах. Идентификация и классификация минералов являются очень сложным процессом и требуют высокой квалификации и экспертизы. Для выполнения этой задачи геологам приходится тратить часы и иногда дни на подготовку образца и выполнение различных видов анализа.

Усложняет процесс тот факт, что значительная часть минералов все еще требует более тщательного изучения, и на данный момент всего около нескольких сотен из 6 000 минералов полностью исследованы.

В результате ведутся обширные международные усилия по заполнению этой пробела путем тщательного исследования. Внедрение машинного интеллекта в этот процесс может сыграть ключевую роль в выявлении ошибок и оптимизации длительных рутинных задач, которые традиционно выполняются экспертами. Использование машинного интеллекта для визуальной диагностики имеет потенциал освободить профессиональных минералогов от рутинных задач, позволяя им уделять больше времени более сложным задачам.

В связи с этим Исследовательский институт искусственного интеллекта совместно с Sber AI и Московским государственным университетом имени М.В. Ломоносова создал набор данных для распознавания минералов с помощью моделей компьютерного зрения. Набор данных называется MineralImage5k. Они использовали набор данных Ферсмановского минералогического музея. Фонды музея содержат более 170 тысяч образцов (около 5 000 видов минералов). Эта коллекция является одной из крупнейших в мире.

Набор данных содержит сырые образцы, что делает его более близким к тем, которые можно найти в горах или речных русловых отложениях, и разделен на три подмножества, представляющих вызов для исследователей в области классификации минералов, сегментации и оценки размера. После сбора набора данных исследователи произвели анализ изображений и очистили набор данных. Сначала они удалили поврежденные изображения, затем удалили изображения с высокими соотношениями сторон, так как большинство моделей компьютерного зрения работает с квадратными входными данными. Также они добавили отступы к изображениям, если разница между сторонами изображения была слишком большой. Они также удалили дублирующиеся изображения, так как дубликаты увеличивают потерю памяти. Кроме того, они изменили размер оставшихся изображений до 1024 пикселей.

Однако искусственный интеллект может испытывать трудности при анализе минеральных изображений, поскольку ему может потребоваться знание, какая часть породы является нужным нам минералом. Чтобы помочь в этом, исследователи предоставили около 100 дополнительных изображений с метками, показывающими точное расположение минерала. Они использовали модель, которая учится на основе изображений и слов, чтобы продемонстрировать, насколько хорошо работает их тест. Они проверили, насколько хорошо это сработало после обучения модели на изображениях из набора данных MineralImage5k.

Исследователи подчеркивают, что они планируют в будущем получить больше изображений для своего теста. Они также сосредоточены на других исследованиях, создавая различные наборы изображений с большим количеством минералов и горных пород. Они также могут использовать другие типы информации для улучшения работы искусственного интеллекта. Наконец, эксперты по минералогии, эксперты по компьютерному зрению и эксперты по искусственному интеллекту должны работать вместе для улучшения распознавания минералов.