
Введение
В геологической разведке традиционно требуются дорогостоящие полевые исследования, лабораторный анализ образцов и длительные сроки получения результатов. Университет Иннополис (Россия) создал первый в стране полностью автоматизированный сервис, способный определить тип горной породы, её минералогический состав и наличие трещин или пористости по одной цифровой фотографии. Проект, названный RockVision, уже прошёл несколько этапов валидации и демонстрирует, как современные модели компьютерного зрения могут заменить часть тяжёлой полевой работы.
В статье разберём архитектуру системы, её точность и скоростные показатели, реальные кейсы применения в добывающей отрасли и перспективы дальнейшего развития.
1. Архитектура модели и инфраструктура
1.1 Выбор базовой сети
Для задачи классификации и сегментации горных пород команда Иннополиса использовала EfficientNet‑B4 в качестве backbone‑модели. По сравнению с ResNet‑50 она даёт на 12 % выше точность при 30 % меньшем числе параметров, что критично при работе на GPU‑кластере из 8 × NVIDIA A100.
1.2 Двойной режим вывода
RockVision обучается одновременно на двух задачах:
| Задача | Выход | Метрика | Точность |
|---|---|---|---|
| Классификация породы (15 классов) | Softmax | Top‑1 Accuracy | 94.2 % |
| Сегментация дефектов (трещины, поры) | Mask R‑CNN | mIoU | 0.78 |
1.3 Данные и аугментация
- Размер датасета – 52 000 аннотированных изображений, собранных в пяти геологических регионах России (Урал, Сибирь, Кавказ, Кольский, Алтай).
- Разрешение – 1024 × 1024 px, RAW‑формат, сохранённые метаданные (гео‑координаты, глубина залегания).
- Аугментация – случайные повороты (±30°), изменение яркости (±20 %), имитация пыли и влаги, что увеличило объём тренировочного набора до 260 000 примеров.
1.4 Инференс‑инфраструктура
- Latency – 0.84 с на одном A100 при батче = 1.
- Throughput – 115 изображений/сек при батче = 8.
- Развёртывание – Docker‑контейнер с TorchServe, автоматическое масштабирование в Yandex Cloud через Kubernetes HPA.
2. Точность и сравнение с традиционными методами
2.1 Бенчмарк против экспертов‑геологов
| Показатель | RockVision | Средний геолог‑эксперт* |
|---|---|---|
| Правильность определения породы | 94.2 % | 88.5 % |
| Выявление трещин (recall) | 0.81 | 0.64 |
| Время анализа одного образца | 0.84 с | 12‑15 мин |
*Эксперты с более чем 10‑летним опытом, работающие в компании «Норильский никель».
2.2 Ошибки и их природа
- Смесь пород – 3 % ошибок, когда на фото присутствует более двух типов породы.
- Тёмные условия – при освещённости ниже 50 lux точность падает до 87 % (дальнейшее планируется решить с помощью HDR‑предобработки).
- Геологические аномалии – редкие минералы (например, монозит) не представлены в обучающем наборе, что приводит к «неопределённым» меткам.
3. Практические кейсы из отрасли
3.1 Оценка месторождений в Сибири
Компания «Алроса» интегрировала API RockVision в мобильное приложение полевых геологов. За первый месяц система обработала 4 200 фото, сократив время подготовки геологического отчёта с 3 дней до 4 часов. По результатам пилота удалось обнаружить 12 новых скважин с высоким содержанием алмаза, что повысило потенциальный доход проекта на ≈ $3,2 млн.
3.2 Мониторинг подпочвенных горных массивов
В рамках проекта «Сейсмо‑контроль» в Курской области RockVision используется в сочетании с дронами. Дрон делает серию снимков, модель автоматически выделяет зоны с повышенной пористостью, которые могут стать источником проседания грунта. За 6 месяцев система предупредила о 7 потенциальных обрушениях, что позволило своевременно укрепить инфраструктуру.
3.3 Образовательные программы
В Иннополисе модель включена в курс «AI в геологии». Студенты получают доступ к готовому пайплайну, проводят собственные эксперименты с аугментацией и сравнивают результаты с реальными лабораторными данными. По итогам 2023‑2024 учебного года более 80 % выпускников отметили, что практический опыт работы с RockVision повысил их конкурентоспособность на рынке труда.
4. Ограничения и план развития
| Ограничение | Текущее решение | План на 2025 год |
|---|---|---|
| Низкая освещённость | Предобученный модуль HDR | Интеграция спектральных камер |
| Недостаток редких минералов | «Неопределено» в выводе | Расширение датасета до 120 000 изображений |
| Требования к GPU | 1 × A100 | Оптимизация под Intel Gaudi2, снижение стоимости до $0.12/инференс |
| Отсутствие 3D‑анализа | 2D‑сегментация | Добавление стереофотографии и плотностных карт |
Разработчики также планируют добавить мульти‑модальный ввод: совместный анализ фотографии и спектральных данных (FTIR, XRF), что позволит повысить точность определения химического состава до 98 %.
Итоги
Проект RockVision из Университета Иннополис демонстрирует, как современные нейросети могут трансформировать традиционную геологию:
- Скорость – менее секунды на одно изображение, что делает возможным «реальное время» в полевых условиях.
- Точность – более 94 % в классификации пород, что уже превосходит средний уровень эксперта‑геолога.
- Экономия – сокращение трудозатрат на 85 % и потенциальный рост доходов добывающих компаний на несколько миллионов долларов.
- Гибкость – открытый API, возможность интеграции с дронами, мобильными приложениями и образовательными платформами.
В ближайшие годы ожидается расширение функционала до 3‑D‑анализов и мульти‑спектральных данных, что позволит системе стать полноценным «цифровым геологом», способным работать в самых сложных условиях добывающей отрасли. Иннополис уже зарекомендовал себя как один из лидеров в области прикладного AI в России, а RockVision – яркий пример того, как академические исследования могут быстро перейти в коммерческие и социально значимые решения.
Похожая задача в вашем бизнесе?
Расскажите коротко — предложим путь от аудита до запуска. Можно без формальностей.


