OpenAI представила эталонную платформу для оценки эффективности ИИ-агентов в обнаружении, устранении и даже эксплуатации уязвимостей безопасности в криптовалютахOpenAI представила эталонную платформу для оценки эффективности ИИ-агентов в обнаружении, устранении и даже эксплуатации уязвимостей безопасности в криптовалютах

OpenAI противопоставляет ИИ-агентов друг другу для тестирования смарт-контрактов методом красной команды

2026/02/19 09:26
6м. чтение
Openai Pits Ai Agents Against Each Other To Red-Team Smart Contracts

OpenAI представила эталонную платформу, направленную на измерение того, насколько эффективно ИИ-агенты могут обнаруживать, смягчать и даже использовать уязвимости безопасности в криптовалютных смарт-контрактах. Проект под названием "EVMbench: Evaluating AI Agents on Smart Contract Security" был выпущен в сотрудничестве с Paradigm и OtterSec, двумя организациями с глубокими знаниями в области безопасности блокчейна и инвестиций. Исследование оценивает ИИ-агентов на основе тщательно отобранного набора из 120 потенциальных слабостей, взятых из 40 аудитов смарт-контрактов, стремясь количественно оценить не только возможности обнаружения и исправления, но и теоретический потенциал эксплуатации этих агентов в контролируемой среде.

Ключевые выводы

  • EVMbench тестирует ИИ-агентов на 120 уязвимостях, отобранных из 40 аудитов смарт-контрактов, делая акцент на уязвимостях из конкурсов аудита с открытым исходным кодом.
  • Среди протестированных моделей Claude Opus 4.6 от Anthropic лидировал со средней наградой за обнаружение в 37 824 $, за ним следовали OC-GPT-5.2 от OpenAI с 31 623 $ и Gemini 3 Pro от Google с 25 112 $.
  • OpenAI представляет эталонное тестирование как шаг к измерению производительности ИИ в "экономически значимых средах", а не только в учебных задачах, подчеркивая реальные последствия для атакующих и защитников в ландшафте безопасности криптовалют.
  • Исследователи отмечают, что смарт-контракты защищают активы на миллиарды долларов, подчеркивая стратегическую ценность инструментов на базе ИИ как для наступательных, так и для оборонительных действий.
  • Отраслевые наблюдатели связали эти разработки с более широкими дискуссиями о платежах на основе ИИ и роли стейблкоинов в повседневных транзакциях, при этом крупные руководители прогнозируют рост использования агентов в ближайшие годы.
  • Контекст такой работы подчеркивается данными об инцидентах криптовалютной безопасности 2025 года, которые показывают продолжающийся поток средств через уязвимости и атаки, усиливая спрос на надежные механизмы аудита и защиты на базе ИИ.

Награды за обнаружение для ИИ-агентов подробно описаны в PDF-файле OpenAI, сопровождающем исследование, который также описывает методологию оценки и сценарии, используемые для моделирования реальных рисков смарт-контрактов. Авторы подчеркивают, что хотя ИИ-агенты эволюционировали для автоматизации широкого спектра рутинных задач, оценка их производительности в "экономически значимых средах" необходима для понимания того, как они будут работать под давлением в производственных системах.

OpenAI отмечает, что ожидает, что агентные технологии расширят сферу платежей и расчетов, включая стейблкоины, используемые в автоматизированных рабочих процессах. Обсуждение платежей на базе ИИ выходит за рамки тестирования безопасности к более широкому вопросу о том, как автономные системы будут участвовать в повседневной финансовой деятельности. Собственные прогнозы компании предполагают, что агентные платежи могут стать более распространенными, закрепляя возможности ИИ в практических случаях использования, затрагивающих повседневные потребительские транзакции.

Одновременно с результатами тестирования генеральный директор Circle Джереми Аллэйр публично спрогнозировал, что миллиарды ИИ-агентов могут совершать транзакции со стейблкоинами для повседневных платежей в течение следующих пяти лет. Это мнение пересекается с повторяющейся темой в криптовалютных кругах: потенциалом криптовалюты стать родной валютой ИИ-агентов, нарратив, который получил заметное внимание со стороны отраслевых лидеров и инвесторов. Хотя такие прогнозы остаются спекулятивными, основная тенденция ясна — автоматизация ИИ переходит от лаборатории к транзакционному уровню, где она может изменить то, как ценность перемещается по сетям.

Исследование появилось в момент, когда безопасность криптовалют продолжает оставаться значительным фактором риска для инвесторов. Данные о нападении на криптовалютные фонды в 2025 году — где злоумышленники похитили примерно 3,4 миллиарда $ — подчеркивают срочность улучшенных инструментов и более быстрых, более надежных механизмов исправления. Платформа EVMbench позиционируется, в частности, как способ измерить, могут ли ИИ-агенты значимо способствовать оборонительным возможностям в масштабе, сокращая возможности эксплуатации и ускоряя смягчение угроз.

Для создания эталонного теста исследователи использовали 120 тщательно отобранных уязвимостей, охватывающих 40 аудитов смарт-контрактов, причем многие слабости восходят к вызовам аудита с открытым исходным кодом. OpenAI утверждает, что эталонный тест поможет отслеживать прогресс ИИ в распознавании и смягчении слабостей на уровне контрактов в масштабе, предлагая стандартизированный способ сравнения будущих моделей ИИ по мере их развития. Исследование также дает представление о том, как ИИ может применяться для нормализации оценки рисков в широком диапазоне архитектур смарт-контрактов, а не фокусироваться исключительно на изолированных случаях.

Смарт-контракты не были созданы для людей: Dragonfly

В одновременной ветке на X Хасиб Куреши, партнер Dragonfly, утверждал, что обещание криптовалюты заменить имущественные права и традиционные контракты так и не материализовалось не потому, что технология провалилась, а потому, что она никогда не была разработана с учетом человеческой интуиции. Он подчеркнул постоянный страх, связанный с подписанием крупных транзакций в среде, где кошельки-опустошители и другие векторы атак остаются постоянной угрозой, в резком контрасте с относительно более плавным опытом традиционных банковских переводов.

Куреши утверждает, что следующий этап криптовалютных транзакций может быть обеспечен кошельками с посредничеством ИИ и самоуправляемыми. Такие кошельки будут отслеживать риски, управлять сложными операциями и автономно реагировать на угрозы от имени пользователей, потенциально снижая трения и страх, которые характеризуют крупные переводы сегодня.

Более широкий вывод из этой ветки заключается в том, что ИИ-агенты могут сыграть критическую роль в трансформации взаимодействия людей с криптовалютой — переходе от ручных, подверженных ошибкам транзакций к автоматизированным, учитывающим риски процессам, которые могут масштабироваться с принятием. По мере того как ИИ-агенты начинают демонстрировать большую компетентность в решении проблем безопасности, пользователи могут увидеть улучшенную надежность и устойчивость в рабочих процессах децентрализованных финансов, даже когда базовые технологии продолжают созревать.

На что обратить внимание далее

  • Публикация и независимая репликация полного набора данных EVMbench на дополнительных моделях и архитектурах ИИ.
  • Более широкое принятие рабочих процессов аудита с помощью ИИ аудиторами, биржами и проектами DeFi, стремящимися укрепить позиции безопасности.
  • Исследования агентных кошельков и автономных потоков платежей, включая регулятивные и соответствующие соображения для активов, управляемых ИИ.
  • Последующие эталонные тесты, сравнивающие больше систем ИИ по мере выпуска новых версий, отслеживающие улучшения в точности обнаружения и скорости исправления.

Источники и проверка

  • OpenAI: EVMbench: Evaluating AI Agents on Smart Contract Security — PDF: https://cdn.openai.com/evmbench/evmbench.pdf
  • OpenAI: Introducing EVMbench — https://openai.com/index/introducing-evmbench/
  • Потери криптовалютной безопасности в 2025 году (освещение отчетности): https://cointelegraph.com/news/crypto-3-4-billion-losses-2025-wallet-hacks
  • Dragonfly: Хасиб Куреши об ИИ и крипто UX (пост в X): https://x.com/hosseeb/status/2024136762424185208
  • Лидерство Китая в области ИИ и последствия для криптовалют (анализ): https://cointelegraph.com/news/china-ai-lead-future
  • AI Eye — разработки IronClaw и ИИ-ботов в освещении Polymarket: https://cointelegraph.com/magazine/ironclaw-secure-private-sounds-cooler-openclaw-ai-eye/

Ключевые цифры и следующие шаги

Исследование EVMbench демонстрирует, что большие языковые модели и связанные ИИ-агенты начинают выполнять значимую работу по безопасности в области смарт-контрактов с четко измеримыми различиями между моделями. Лидерство Claude Opus 4.6 в средних наградах за обнаружение сигнализирует о том, что определенные архитектуры могут быть более искусными в обнаружении и смягчении уязвимостей в сложной логике контрактов, в то время как другие отстают, предлагая спектр возможностей, которые исследователи, вероятно, захотят усовершенствовать. Включение нескольких отраслевых партнерств в проект подчеркивает растущий консенсус в том, что безопасность на базе ИИ и автоматизированное управление рисками могут стать необходимыми для масштабирования в децентрализованных средах.

По мере развития области наблюдатели будут следить за тем, как быстро ИИ-агенты могут перейти от обнаружения к исправлению, и могут ли эти агенты надежно работать в живых системах без внесения новых рисков. Разговор о кошельках на базе ИИ и автономных платежах затрагивает более широкий набор вопросов, касающихся управления безопасностью, согласия пользователей и нормативного согласования. Если траектория, предложенная OpenAI и ее партнерами, продолжится, инструменты с помощью ИИ могут стать основным компонентом будущей криптоинфраструктуры, меняя как расчет рисков, так и пользовательский опыт значимыми способами. Следующий раунд эталонных тестов вместе с реальными развертываниями поможет определить, насколько быстро это видение материализуется и какие меры безопасности должны его сопровождать.

Эта статья была первоначально опубликована как OpenAI Pits AI Agents Against Each Other to Red-Team Smart Contracts на Crypto Breaking News – вашем надежном источнике криптовалютных новостей, новостей Bitcoin и обновлений блокчейна.

Возможности рынка
Логотип Smart Blockchain
Smart Blockchain Курс (SMART)
$0.004384
$0.004384$0.004384
-2.20%
USD
График цены Smart Blockchain (SMART) в реальном времени
Отказ от ответственности: Статьи, размещенные на этом веб-сайте, взяты из общедоступных источников и предоставляются исключительно в информационных целях. Они не обязательно отражают точку зрения MEXC. Все права принадлежат первоисточникам. Если вы считаете, что какой-либо контент нарушает права третьих лиц, пожалуйста, обратитесь по адресу service@support.mexc.com для его удаления. MEXC не дает никаких гарантий в отношении точности, полноты или своевременности контента и не несет ответственности за любые действия, предпринятые на основе предоставленной информации. Контент не является финансовой, юридической или иной профессиональной консультацией и не должен рассматриваться как рекомендация или одобрение со стороны MEXC.

Быстрое чтение

Еще

Цена Conway Research (CONWAY) в сравнении с ценой Bitcoin (BTC) дает инвесторам четкое представление о том, как этот развивающийся мемкоин соотносится с крупнейшей криптовалютой. Поскольку BTC остается эталоном крипторынка, анализ динамики цен CONWAY vs BTC выявляет относительную силу, волатильность и возможности для трейдеров, ищущих прогнозы цены Conway Research и данные для сравнения цен Bitcoin.

Сравнение цены Conway Research (CONWAY) с ценой Ethereum (ETH) предлагает ценную перспективу для трейдеров и инвесторов. Поскольку ETH является второй по величине криптовалютой по рыночной капитализации и краеугольным камнем децентрализованных финансов, анализ его производительности по сравнению с CONWAY помогает выявить как конкурентные преимущества, так и потенциальные возможности роста.