Пролог: В котором ваш багаж исчезаетЧемодан медленно уезжает за резиновую шторку и на некоторое время перестаёт быть вашим.Где-то по ту сторону экрана его уже нПролог: В котором ваш багаж исчезаетЧемодан медленно уезжает за резиновую шторку и на некоторое время перестаёт быть вашим.Где-то по ту сторону экрана его уже н

Рентген может не отличить опасное от безобидного: как работает досмотр багажа и зачем там ИИ

Пролог: В котором ваш багаж исчезает

3e66789058643e3165dc581b7324477b.png

Каждый день через такие системы проходят миллионы сумок. И почти никто не задумывается, насколько это сложная задача. Здесь мы поговорим не про конкретные модели и железо. Мы узнаем,

  • почему человеку трудно разбираться в содержимом чемоданов,

  • почему нейросети здесь не всесильны

  • и почему безопасность всегда остаётся компромиссом.

Для начала разберёмся с базой. Что такое интроскоп и почему он хоть что-то видит?

Глава 1: Как интроскоп видит багаж

Проще всего представить интроскоп (ту самую холодную металлическую коробку) как устройство, которое считает, как рентгеновский луч проходит через содержимое чемодана. Луч проходит сквозь вещи и постепенно ослабевает. В плотных материалах сигнал падает сильнее, в более лёгких слабее. В итоге каждая точка изображения это просто число, которое показывает, насколько именно ослаб сигнал в этом месте. Цвет появляется уже после измерений и добавляют его не для красоты, а потому что с картинкой человеку проще работать, чем с набором чисел.

Сам рентген не различает опасное и разрешённое. Он реагирует только на физические свойства материалов. Из-за этого на экране обычные вещи иногда выглядят странно и вполне могут отправиться на дополнительный досмотр.

20e1bd41748f10e83817e4637c81ab42.png

Чтобы оператор мог хоть как-то ориентироваться в этих данных, изображение раскрашивают. Обычно используется простая логика:

  • 🟠 оранжевый (органика)

  • 🔵 синий (металл)

  • 🟢 зелёный (пластик и композиты)

С помощью цветов оператор может лишь примерно понимать из какого материала сделаны предметы в чемодане. И смотря на эту картинку за несколько секунд решить что перед ним: обычный багаж с хаотичной укладкой или ситуация, которая требует внимания.

Изображение отражает только измеренные параметры ослабления излучения. Ошибки возникают на этапе интерпретации этих данных человеком.

Глава 2: Чемодан как головоломка

Внутри чемодана царит настоящий хаос: вещи беспорядочно разбросаны и накладываются друг на друга, скрывая свою истинную форму.

923a24382d0cd71893419ffa5d6bc200.png

Для человека это просто неудобно. Для анализа изображений это серьёзная проблема. Когда предметы перекрывают друг друга, ни один из них не виден полностью. В компьютерном зрении это называют перекрытием объектов, и с этим плохо справляются и алгоритмы, и люди. Но даже без перекрытий остаётся другая сложность. Один и тот же предмет выглядит по-разному в зависимости от ракурса. То, что сбоку легко узнаётся, сверху может превратиться в обычный кусок металла.

К этому добавляется то, что оттенки на дисплее отражают лишь физическую сущность объектов, никак не раскрывая их потенциальное применение. Один и тот же сигнал может соответствовать самым разным вещам, в том числе опасным. Поэтому оператор смотрит не на отдельный признак, а на всё сразу. Он оценивает форму, плотность, взаимное расположение предметов и общую картину.

20e058f12c871f1e9904363d2dbfe756.png

Человек это не бесконечный ресурс. За смену оператор просматривает сотни, а иногда и тысячи чемоданов. Картинки повторяются, внимание притупляется, и со временем становится сложнее замечать детали.

Ошибки здесь возникают не из-за некомпетентности, а потому что сама задача плохо подходит для человеческого восприятия. Автоматизированный поиск угроз представляет собой сложную научно-техническую проблему, выходящую далеко за пределы обычных улучшений пользовательского интерфейса. Компьютерное зрение выступает важным дополнением к работе операторов, снижая утомляемость и повышая эффективность выявления потенциальных рисков.

Глава 3: Нейросети как помощник, а не панацея

Представление о том, что нейронные сети работают подобно человеческому зрению, весьма распространено, однако механизм их работы гораздо глубже и сложнее, чем простое сопоставление образов.

Модели нейросетей оперируют цифровыми массивами данных, представляющими изображения в виде набора чисел, где реальные объекты (чемоданы, ножи и прочее) теряют свою очевидную форму и превращаются в сложный цифровой ландшафт. Чтобы в этом появилось хоть какое-то понимание, нейросеть обучают на тысячах или даже десятках тысяч размеченных снимков. Поэтому без большого объёма размеченных данных такая система работать не будет.

8c408048b5ea81e96a7366768e8bc0f0.png

И тут возникает простой, но неприятный вопрос: где взять тысячи рентгеновских снимков чемоданов с оружием легально и без последствий? На практике такие данные почти недоступны.

Поэтому обучение ведётся на ограниченном наборе специализированных датасетов. Существуют наборы данных, содержащие изображения запрещённых или опасных объектов, разрешённых к использованию исключительно в научных исследованиях. Также можно найти редкие наборы, которые разрешено использовать в коммерческих целях. Но большинство таких датасетов закрыты лицензиями «только для исследований». Ниже представлены некоторые из них.

Датасет

Количество изображений

Типы объектов

Лицензия / ограничения

GDXray

20 966

Оружие, лезвия, обычный багаж (аэропортовский досмотр)

Только для исследований и обучения; коммерческое использование и распространение запрещены

SIXray

1 059 231

Пистолет, нож, гаечный ключ, плоскогубцы, ножницы, молоток

Только академическое использование; права принадлежат CAS

OPIXray

8 885

Складной нож, прямой нож, ножницы, хозяйственный нож, мультитул

Только академическое использование; коммерческое использование запрещено

PIDray

47 677

12 категорий запрещённых предметов (ножи, пистолеты, батарейки, зажигалки и др.)

Apache-2.0, но фактически только академическое использование

X-ray Contraband Detection Dataset

13 728

12 категорий контрабандных предметов (сбалансированный набор)

CC BY 4.0 — разрешено коммерческое использование с указанием авторства

В этот момент у бизнеса обычно наступает пауза, потому что выясняется, что обучить модель на красивых данных можно, а вот использовать её в реальной системе уже нет. Причины понятные: данные из аэропортов, требования безопасности, ограничения на распространение и юристы, которые сразу говорят «нет».

Поэтому компании идут обходными путями. Кто-то годами собирает собственные данные, кто-то договаривается с производителями оборудования, а кто-то уходит в синтетику.

Рентгеновские чемоданы действительно «фотошопят». Берут реальный снимок багажа. Берут 3D-модель ножа или другого предмета. И аккуратно встраивают одно в другое так, будто опасный объект действительно лежал внутри. Этот подход называется Threat Image Projection, или просто TIP.

В целом это работает. Модель начинает находить ножи быстрее. Количество примеров растёт без необходимости таскать настоящие опасные предметы по лабораториям. Но побочный эффект заключается в том, что нейросеть очень быстро привыкает к тому, как именно выглядят эти синтетические объекты.

Если в обучающем наборе нож почти всегда по центру изображения, хорошо виден и лежит отдельно, модель запоминает именно это. В реальности же нож может оказаться под ноутбуком, под курткой, под углом и ещё наполовину перекрыт зарядкой. Формально это тот же самый предмет, но для модели он уже выглядит «неправильно».

В какой-то момент она начинает уверенно говорить: «такого я раньше не видела». Это известная проблема разрыва между обучающими данными и реальным миром — то, что в машинном обучении называют domain gap.

0b664add702b6c41d096e25c55f45759.png

Дальше модель могут поставить на другой интроскоп, и результаты снова меняются. Отличается уровень шума, контраст, цветовая схема, энергия излучения. Для нас это выглядит как немного другая картинка, но для нейросети это уже другие данные, к которым она не готова. В машинном обучении это называют domain shift, и для рентгеновских изображений это одна из основных проблем.

Поэтому в реальных системах искусственный интеллект почти никогда не принимает окончательных решений. Он просматривает поток изображений и отмечает участки, которые выглядят нетипично или требуют особого внимания, а дальше уже человек это интерпретирует. Искусственный интеллект остается вспомогательным инструментом, нуждающимся в постоянном совершенствовании и новых данных.

Также необходимо научится решать еще одну задачу, а именно находить опасные предметы у которых формы нет вовсе.

Глава 4: Задача без формы

Оружие распознавать проще, потому что у него есть форма и геометрия, за которые можно зацепиться и человеку, и алгоритму. Взрывчатые вещества обладают крайне вариативной морфологией. Их внешний облик может варьироваться бесконечно, поскольку они способны принимать любую форму, смешиваться с различными материалами и успешно мимикрировать под повседневные предметы.

Интроскоп в этой ситуации делает ровно то, что умеет. Он показывает материал, но не даёт ответа о безопасности. Компьютерное зрение здесь тоже ограничено. Оно хорошо работает с формой и границами, а у взрывчатки их обычно нет. В результате данных недостаточно, чтобы уверенно отличить опасное от обычного.

d5ccb6e08c8d27b06e63da5615563c08.png

Поэтому в реальных системах не ограничиваются одной картинкой. Помимо обычного рентгеновского изображения используют двухэнергетический анализ, который позволяет грубо оценить состав материала. В некоторых системах дополнительно пытаются вычислить эффективный атомный номер вещества.

Более продвинутый вариант это компьютерная томография. КТ-сканер не даёт одну проекцию, а строит объёмную модель содержимого чемодана. Это упрощает анализ плотностей и уменьшает влияние перекрытий. По этой причине КТ постепенно становится стандартом досмотра в аэропортах. Но даже при этом проблема не исчезает.

Важно помнить, что особенность взрывчатых веществ заключается в том, что они представляют собой субстанции, способные изменять свою конфигурацию и интегрироваться в самые разнообразные среды, теряя индивидуальные геометрические черты. Система может сказать, что материал похож на опасный, но не может утверждать это наверняка.

С данными для обучения ИИ ситуация ещё сложнее. Реальных изображений с настоящими взрывчатыми веществами почти нет. Работа с ними опасна и жёстко регулируется. Поэтому модели обучают на лабораторных образцах, имитациях и синтетических данных. Любые подозрения в итоге всё равно проверяет человек. На практике досмотр работает как оценка риска. Если вероятность превышает заданный порог, багаж отправляют на дополнительную проверку. Окончательное решение снова остаётся за человеком.

Эффективность поиска оружия обусловлена наличием специфичных контуров и геометрии, тогда как выявление взрывчатых веществ осложняется отсутствием уникальных визуальных маркеров и возможностью интеграции в окружающие материалы.

Эпилог: В котором багаж возвращается владельцу

Современные интеллектуальные системы выполняют больше вспомогательную функцию, оперативно отмечая аномалии и подозрительные зоны на изображениях, оставляя право окончательного выбора за квалифицированным специалистом. Совместная деятельность человека и искусственного интеллекта демонстрирует синергию, позволяющую достичь лучших результатов благодаря объединению сильных сторон обеих сторон.

fcd3e20eb2f67621827ad7ae440bf3f2.png

Система будет развиваться и дальше. КТ-сканеры постепенно становятся стандартом, данные становятся разнообразнее, синтетические примеры ближе к реальности. При этом оператор становится больше аналитиком изображений, чем просто сторонним наблюдателем.

Но у этого процесса нет финальной точки. Методы досмотра меняются, злоумышленники тоже адаптируются, а физика по-прежнему не даёт однозначных ответов. В таких системах безопасность всегда остаётся оценкой риска.

Источник

Отказ от ответственности: Статьи, размещенные на этом веб-сайте, взяты из общедоступных источников и предоставляются исключительно в информационных целях. Они не обязательно отражают точку зрения MEXC. Все права принадлежат первоисточникам. Если вы считаете, что какой-либо контент нарушает права третьих лиц, пожалуйста, обратитесь по адресу service@support.mexc.com для его удаления. MEXC не дает никаких гарантий в отношении точности, полноты или своевременности контента и не несет ответственности за любые действия, предпринятые на основе предоставленной информации. Контент не является финансовой, юридической или иной профессиональной консультацией и не должен рассматриваться как рекомендация или одобрение со стороны MEXC.

Вам также может быть интересно

Как мы собрали среду для AI-ассистированной разработки приложений Битрикс24

Как мы собрали среду для AI-ассистированной разработки приложений Битрикс24

Привет, меня зовут Владимир Верхотуров, я занимаюсь DevRel в Битрикс24, а именно обеспечиваю связь внешних разработчиков (партнёры/клиенты) и внутренних команд,
Поделиться
ProBlockChain2026/01/26 13:00
ETHZilla сменила стратегию и купила авиационные двигатели после распродажи Ethereum

ETHZilla сменила стратегию и купила авиационные двигатели после распродажи Ethereum

Поддерживаемая Питером Тилем DAT-компания ETHZilla приобрела два авиационных двигателя CFM56-7B24 за $12,2 млн. Сделка прошла через специально созданную дочерн
Поделиться
Forklog2026/01/26 17:01
Канадский доллар незначительно снизился перед решением Банка Канады по процентной ставке – Scotiabank

Канадский доллар незначительно снизился перед решением Банка Канады по процентной ставке – Scotiabank

Пост CAD незначительно снизился перед решением Банка Канады по ставке – Scotiabank появился на BitcoinEthereumNews.com. Канадский доллар (CAD) ослаб, снизившись на незначительные 0,1% по отношению к USD перед двойным решением по ставкам BoC/ФРС в среду, сообщают главные стратеги по Форексу Scotiabank Шон Осборн и Эрик Теорет. Рынки ждут снижения Также широко ожидается, что Банк Канады снизит ставку на 25 базисных пунктов в 9:45 ET, а губернатор Маклем проведет пресс-конференцию в 10:30 ET. Как и в случае с ФРС, мы видим, что планка для голубиного сюрприза от BoC несколько повышена, учитывая, что рынки фактически оценивают почти 29 базисных пунктов смягчения для сегодняшнего решения и почти 50 базисных пунктов смягчения к концу года. Коммуникация Маклема будет иметь решающее значение, поскольку рынки ожидают ключевых комментариев по инфляции и перспективам ценовой стабильности после последних изменений в торговой политике. Комментарии о финансовой ситуации Канады также будут тщательно изучены, учитывая объявление во вторник о дате выпуска федерального бюджета 4 ноября. Что касается фундаментальных показателей CAD, мы отмечаем стабилизацию спредов доходности. Наша оценка справедливой стоимости USDCAD в настоящее время составляет 1,3561 и по-прежнему демонстрирует значительное расхождение с текущими уровнями спот-рынка, однако масштаб остаточного значения, по-видимому, сужается. "Техническая картина USD/CAD, похоже, стала более решительно медвежьей после прорыва во вторник уровня поддержки тренда 50-дневной скользящей средней (1,3772). Индекс относительной силы также опустился ниже 50 на медвежью территорию, и краткосрочный баланс рисков благоприятствует дальнейшему снижению и прорыву через недавнюю поддержку в середине 1,37. Мы ожидаем краткосрочный диапазон между 1,3700 и 1,3800." Источник: https://www.fxstreet.com/news/cad-down-marginally-into-the-boc-rate-decision-scotiabank-202509171145
Поделиться
BitcoinEthereumNews2025/09/18 00:50