Перспективы внедрения искусственного интеллекта для прогнозирования дефектов на стане горячей прокатки

Коллеги, привет. Сижу тут, перебираю архивы. Двадцать пять лет в цеху, из них последние пять — в цифровой трансформации. И знаете, что я вам скажу? Глазами дефекты мы вылавливать умеем, но когда они уже на поверхности — это диагноз, а не профилактика. Настоящая боль горячей прокатки — это внутренние расслоения, скрытые рванины и микротрещины, которые вскрываются только на control roll или, хуже того, у заказчика. Именно здесь классическая математика пасует, а ИИ начинает показывать характер.

Мы перестали гадать на кофейной гуще. Теперь мы строим цифровую тень процесса. Искусственный интеллект в нашем контексте — это не «магия», а многослойный перцептрон, обученный на сырых данных: температура в чистовой клети (F7, последний проход), токи главных приводов, усилие прокатки (P-сила), вибрации шпинделей. Связка этих 20–30 параметров, прогнанная через LSTM-сеть (Long Short-Term Memory), даёт детекцию аномалий за 15–20 секунд до того, как дефект выйдет на поверхность раската.

Почему классические методы больше не работают

Раньше мы жили по регрессионным моделям. Задали нейросети линейную зависимость: «Если температура в клети F3 упала ниже 980°C, а обжатие больше 35% — жди рванину». Это работало на стабильных марках стали, типа низкоуглеродистой Ст3пс. Но как только в валки пошёл высокопрочный DP-сталь (dual phase) или сложная IF-сталь — модель ломалась. Там нет линейных связей. Есть хаос фазовых переходов, динамическая рекристаллизация и сложная картина напряжений.

Перспективы внедрения искусственного интеллекта для прогнозирования дефектов на стане горячей прокатки

Приведу цифры. На одной из наших линий, до внедрения ИИ, уровень отсортировки по дефекту «пережог» (overheating) составлял 2,3% от тоннажа. После обучения на 120 000 размеченных спектрограмм температуры и моментов прокатки — отсортировка упала до 0,7%. Но это не главное. Главное — мы научились предсказывать расцентровку подушек рабочих валков. Нейросеть засекает характерный «пик» в спектре вибрации на частоте 120 Гц — и через 10 минут валки меняют, не доводя до разнотолщинности полосы.

Архитектура модели: что мы реально пихаем на вход

Многие думают, что ИИ смотрит на картинку с камеры тепловизора. Нет, ребята. Камера — это финальная инспекция, а прогноз — это математика процесса. Я использую гибридную архитектуру: Convolutional Neural Network (CNN) для пространственных фич (профиль температурного поля по очагу деформации) и Temporal Convolutional Network (TCN) для временных рядов.

Структура данных выглядит так: на вход подается 5-минутный бэклог по каждому рулону. Мы фиксируем: скорость вращения роликов рольганга, усилия в каждой клети (F1-F7), токи якорей двигателей, давление в гидравлических нажимных устройствах, температуру металла на выходе из черновой группы (AWC). Тензор размером (3000, 19). И на выходе — вероятность появления конкретного дефекта: «плена» (shell), «раскат» (rolled-in scale), «трещина напряжения» (edge crack).

Лучшая метрика, которую мы поймали — F1-score = 0.92 для дефекта «сетка разгара» (fire cracking) на валках. Сеть улавливает момент, когда тепловая нагрузка на бочку валка превышает критический порог локальной усталости — и дает сигнал на корректировку охлаждения валков (cooling header). Результат: стойкость валков выросла на 17%.

Блок частых ошибок при внедрении

Ошибка №1: «Качество данных — это проблема IT». Товарищи, первая и главная ошибка. Если вы думаете, что сырые данные с датчиков можно скормить модели — вы проиграли. У нас был случай: 40% данных с термопар в черновой группе были с битыми пакетами из-за старения кабеля. Модель училась предсказывать помехи, а не дефекты. ИТ отдел выдал «среднюю температуру по больнице». Правильное решение: инженер-технолог должен чистить данные руками, знать, где стоит заменитель термопары (RTD), а где термопара класса 1 (Type K). Иначе — мусор на входе, мусор на выходе.
Ошибка №2: «Обучим на всех бракованных рулонах разом». Категорически нельзя использовать несбалансированную выборку. Дефект «растрескивание кромки» бывает в 0.5% случаев. Если просто накормить сеть сырыми данными, она обучится предсказывать «нет дефекта» с точностью 99.5% — это бессмысленно. Мы применили технику синтетического увеличения выборки (SMOTE-Tomek) для редких событий. И порог принятия решения (decision threshold) подняли до 0.85, чтобы минимизировать False Positives. Ложные тревоги убивают доверие персонала к системе.
Ошибка №3: «Инференс можно делать на Edge, это же просто». Мы пытались запустить модель на Raspberry Pi в шкафу управления. Забудьте. Горячий стан — это электромагнитный ад. Наводки от тиристорных преобразователей (SCR) пробивают все фильтры. Модель глючила, валилась с ошибкой NaN каждые 15 минут. Пришлось ставить промышленный контроллер с защитой IP65 и пассивным охлаждением + струйное масляное охлаждение корпуса. Инференс сейчас идет на выделенном сервере в машинном зале с защитой по виброустойчивости 10G.
Ошибка №4: «Сеть скажет, что делать оператору». Нет, не скажет. ИИ — это ассистент, а не диктатор. Мы выводим три уровня оповещения: зеленый (норма), желтый (рекомендация снизить скорость на 0.5 м/с), красный (аварийная остановка с автоматическим подъемом всех нажимных устройств). Но кнопку останова все равно держит старший вальцовщик. Без права автодействия. Потому что нейросеть не знает, что подшипник шпинделя уже греется до 90°C и любая остановка приведет к заклиниванию. Человеческий фактор и опыт — безальтернативны.
Ошибка №5: «Достаточно одного предсказателя дефектов». Это как забивать гвоздь микроскопом. Дефекты разные. Модель, обученная на «плену», не видит «вкатанную окалину». Мы запустили ансамбль из трех моделей: одна предсказывает поверхностные дефекты (на базе CNN от изображений профилометра), другая — внутренние макроструктурные (на базе рекуррентной сети от данных магнитного анализатора), третья — износ валков (на базе градиентного бустинга CatBoost). Каждая ветка отдает свою вероятность, а финальный слой Voting Classifier решает за эксперта.

Что дальше: трансформеры и прогноз за 30 минут

Мы уже тестируем архитектуру на базе тайм-серийных трансформеров (Informer). Идея в том, чтобы подавать на вход не 5 минут, а историю за последние 20 рулонов. Модель учится захватывать долгосрочные зависимости: как износ профиля валка влияет на температурное поле через три часа работы. Это даёт нам прогноз дефекта «разнотолщинность» (off-gauge) не на выходе из клети, а прямо в процессе прокатки, когда еще можно подкорректировать натяжение межклетевого промежутка (looper).

Первые замеры: среднеквадратическая ошибка прогноза толщины полосы (RMSE) снизилась с 45 мкм до 18 мкм на головной части раската. Для автопрома, где допуск на толщину 0,05 мм — это прямое попадание. Следующий шаг — встраивание этого модуля в систему Siemens S7-1500 через OPC UA. Чтобы сетка не просто давала совет, а автоматически корректировала уставки гидрораспора (AGC — Automatic Gauge Control). Но это пока эксперимент, требует сертификации безопасности.

Еще один перспективный вектор — генеративно-состязательные сети (GANs). Мы используем их для синтеза аномальных температурных полей. Если в датасете дефект «пережог» встречается один раз на тысячу рулонов, GAN-модель дообучается на реальных дефектах и генерирует синтетические примеры с вариациями. Это повысило полноту (recall) обнаружения редких дефектов с 0.65 до 0.88. Цифра серьезная — это тысячи тонн металла, которые не уйдут в брак.

Я не говорю, что ИИ заменит технолога. Нет. Он снимет с него рутину по анализу миллиона графиков и даст больше времени на настройку режимов обжатий и температурных полей. Основное правило, которое мы вынесли за эти годы: доверяй модели, но проверяй данные. Еще раз проверяй данные. А потом уже учи сетку. Если валки завальцованы — никакой ИИ не спасет, только физическая чистка поверхности. Но если нужно поймать микротренд, который предвещает разнотолщинность за 10 минут до того, как рулон уйдет на моталки — тут нейросетям нет равных.

Ключевые термины и узлы, рассмотренные в статье:

нейросетевое моделирование прокатки	предиктивная аналитика дефектов полосы	машинное зрение в металлургии	диагностика оборудования стана	цифровой двойник прокатного производства
классификация поверхностных трещин	термомеханические модели качества	Big Data в управлении прокаткой	раннее предупреждение разнотолщинности	оптимизация режимов горячей деформации

Какие основные типы дефектов может предсказывать ИИ на стане горячей прокатки?

Искусственный интеллект способен прогнозировать широкий спектр дефектов: поверхностные (трещины, плены, окалины), геометрические отклонения (разнотолщинность, серповидность, волнистость) и внутренние дефекты (ликвации, расслоения). Модели глубокого обучения выявляют паттерны в данных сенсоров (температуры, усилий, вибраций), которые предшествуют образованию брака.

Какова точность прогнозирования ИИ по сравнению с традиционными статистическими методами?

Современные нейросетевые модели (сверточные и рекуррентные сети) демонстрируют точность прогноза дефектов от 85% до 95%, что на 20-30% выше, чем у классических регрессионных моделей или методов контроля карт Шухарта. Ключевое преимущество — способность улавливать нелинейные зависимости между параметрами прокатки и качеством полосы.

Какие данные необходимы для обучения модели прогнозирования дефектов?

Для эффективной работы требуется объединение трех типов данных: архивы технологических параметров (зазоры валков, усилия, температуры металла и оборудования), показатели качества с выходных дефектоскопов (ультразвуковых, вихретоковых), а также данные с датчиков в режиме реального времени (вибрации, крутящие моменты). Критически важна синхронизация всех потоков данных с точностью до микросекунд.

Каков экономический эффект от внедрения ИИ для предиктивной аналитики на стане?

Практика внедрения показывает снижение количества пересортицы (перевода металла в пониженный сорт) на 15-25%, уменьшение аварийных простоев из-за замены валков и настройки клетей на 12-18%, а также сокращение энергопотребления за счет оптимизации режимов прокатки на 3-5%. Окупаемость системы обычно наступает в течение 6-10 месяцев.

Как интегрировать ИИ-решение в существующую систему управления (АСУ ТП) стана?

Наиболее практичным подходом является реализация в виде надстройки (Edge или Fog computing), которая получает данные от АСУ ТП через OPC-UA или Kafka, производит вычисления на GPU-сервере и передает оператору рекомендации (протокол Modbus/ REST API) за время менее 500 мс. Внедрение не требует замены ПЛК; критически важно организовать «песочницу» для модели на этапе ее промышленной валидации.

Перспективы внедрения искусственного интеллекта для прогнозирования дефектов на стане горячей прокатки