Claude Mythos — нова ШІ-модель від Anthropic — одночасно є потужним інструментом кіберзахисту та ідеальним помічником у кібератаках. Світ кібербезпеки отримав інструмент, здатний одночасно посилити захист ІТ-систем і дати хакерам нові можливості для зламів.
Поява нової ШІ-моделі Mythos пройшла майже непомітно для звичайних користувачів, які звикли працювати із ChatGPT, Claude чи Gemini. Натомість у світі кіберзахисту вона викликала шалений інтерес і внесла хаос у ШІ-стратегію США1. Міністр фінансів США Скотт Бессент і голова Федеральної резервної системи Джером Пауелл після анонсу організували термінову зустріч з керівниками банків2, щоб попередити про кіберризики, які виникли після появи цього інструменту. Та й «реліз» Claude Mythos — це не зовсім точний опис появи нової моделі. Він не був відкритий для широкого доступу — Anthropic залишила модель у режимі закритого тестування для обмеженого кола партнерів3. Причиною стали її розширені можливості у сфері кібербезпеки, які потенційно дозволяють не тільки знаходити критичні вразливості в системах, а й використовувати їх для атак. Що таке Mythos і чому про цю модель так багато говорять фахівці, дотичні до цифрової безпеки?
(Не)публічний реліз Claude Mythos
Історія Mythos розпочалася з неочікуваного. У березні 2026 року дослідники з LayerX Security та Кембриджського університету виявили4, що через неправильну конфігурацію CMS компанії Anthropic у відкритому доступі опинилися близько 3 тисяч внутрішніх файлів, зокрема чернетки блогу та матеріали про Claude Mythos. Компанія пояснила це «людською помилкою» в налаштуваннях свого інструменту керування контентом.
Витік розкрив ключові деталі: нова модель, відома також під кодовою назвою Capybara, значно перевершила попередню версію Claude Opus 4.6 у сферах кібербезпеки, кодування й академічного міркування. Та найважливішим у витоку виявилося попередження — у чернетці прямо йшлося про те, що модель може дозволити кібератакам поширюватися набагато швидше, ніж захисники встигатимуть їм протидіяти.
Сьомого квітня Anthropic офіційно анонсувала5 Claude Mythos Preview в межах програми Glasswing6 і відкрила доступ до неї обмеженому колу партнерів: Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, Linux Foundation, Microsoft, NVIDIA, Palo Alto Networks та низці інших компаній, які працюють або підтримують критичне програмне забезпечення. Це було потрібно для того, аби дати провідним технологічним компаніям час підготувати свою інфраструктуру до нових загроз. Glasswing — це внутрішня програма Anthropic для закритого тестування її найризикованіших і найпотужніших ШІ-моделей у контрольованому середовищі. Її суть полягає в тому, що нові моделі не випускаються у публічний доступ одразу, а проходять перевірку в ізольованому режимі серед вузького кола великих технологічних і кібербезпекових партнерів. У межах Glasswing компанія оцінює не лише якість відповідей моделі, а й потенційні ризики, зокрема здатність знаходити вразливості, автоматизувати експлойти або використовуватися для кібератак.
Важливо зрозуміти: Anthropic не навчала Mythos спеціально для хакерських атак. У дослідженнях компанії показано7, що моделі не навчаються шкідливій поведінці напряму — вони оптимізуються для виконання різноманітних завдань. Водночас у процесі навчання може виникати reward hacking (спосіб виконання завдання, поставленого перед моделлю, відмінний від того, як задумав розробник). Іншими словами, reward hacking — це явище, в якому система знаходить способи «обійти» поставлене перед нею завдання. Reward hacking може узагальнюватися і призводити до ширших форм небажаної поведінки, зокрема обману, відходу від правил і саботажу у тестових середовищах. Тож Anthropic не навчала Mythos зламувати системи навмисно — але в процесі оптимізації модель змогла самостійно виробити стратегії обходу обмежень, які узагальнилися до ширших форм небажаної поведінки.
Що вміє Mythos і чому це небезпечний ШІ-винахід?
Британський Інститут безпеки штучного інтелекту (AISI) провів власне тестування Mythos Preview і опублікував результати 13 квітня 2026 року8. У змаганнях типу CTF — де потрібно знаходити та зламувати слабкі місця систем — модель показала результати, яких раніше не досягав жоден ШІ-інструмент: на завданнях рівня «експерт» вона справлялась у 73% випадків. AISI також розробила спеціальний 32-кроковий сценарій зламу корпоративної мережі — «The Last Ones». Щоб реалізувати його, людині-фахівцю потрібно близько 20 годин. Mythos стала першою моделлю, що пройшла його від початку до кінця — у трьох спробах із десяти.
Для порівняння: Claude Opus 4.6, попередня модель від Anthropic, впоралася з цим алгоритмом в 16 кроків із 32 необхідних для зламів. Це серйозне покращення, проте ще не апокаліпсис: модель Mythos все ще помилялась у більшості спроб і не змогла впоратися зі складнішими сценаріями. Водночас особливо вразила здатність моделі знаходити раніше невідомі вразливості — так звані zero-day. За час тестування Anthropic виявила тисячі критичних дір у всіх великих операційних системах і браузерах типу zero-day, тобто таких, про які не було відомо раніше і для яких не існувало оновлень, що виправляли ці «дірки». Серед них — помилка у FFmpeg9, яка існувала 16 років і пережила понад 5 мільйонів автоматизованих перевірок. Або критична вразливість10 в OpenBSD, що залишалася непоміченою 27 років: вона потенційно дозволяла хакеру дистанційно вимикати сервери. Mozilla офіційно повідомила11, що у Firefox 150 було закрито 271 вразливість, знайдену ранньою версією Mythos Preview.
Дослідники Центру з вивчення технологій та безпеки (CETaS) при Інституті Алана Тюрінґа — одного з провідних британських аналітичних центрів у цій сфері — опублікували незалежну оцінку вмінь моделі в сфері кібербезпеки12. Директор CETaS Олександр Бабута зазначив, що компанії вже зараз можуть використовувати Mythos не лише для пошуку вразливостей у власних системах, а й для їхнього усунення13.
Очевидці згаданої зустрічі очільників фінансових інституцій США із керівниками найбільших американських банків говорили про «істерику»14, яку викликала поява Mythos. Генеральний директор Anthropic Даріо Амодей попередив15, що є лише 6–12 місяців, аби залатати десятки тисяч виявлених вразливостей — до того, як китайські ШІ-моделі досягнуть схожих можливостей.
Водночас експерти зазначили й інші тривожні факти: експерименти з Mythos показали14, що ШІ прискорює пошук вразливостей, але компанії все одно витрачають тривалий час — дні й тижні — на їхнє усунення.
Mythos: небезпека реальна чи перебільшена
Нова ШІ-модель від Anthropic стала зручним інструментом для журналістів і тих, хто наголошує на небезпеці штучного інтелекту. Такі люди, говорячи про Mythos, не пропустили можливість вкотре налякати «машинами, що захоплять світ». Mythos далеко до цих крайнощів, проте й вважати, що ця модель є черговою ітерацією інструментів на кшталт ChatGPT, теж не варто.
Реальним ризиком Mythos є те, що завдяки цій моделі знижується поріг входу для зловмисників у тіньову індустрію кіберзламів. Раніше пошук та використання zero-day вразливостей потребували вузькоспеціалізованих знань, доступних лише найкращим фахівцям. Mythos або її аналоги, які неминуче з’являться, здатні дати ці можливості людям з мінімальною технічною підготовкою.
Павло Бєлоусов, фахівець з кібербезпеки, експерт гарячої лінії з цифрової безпеки «Надійно», пояснює: «Поки що звичайний користувач з нульовою технічною базою все ще не запустить складну атаку, а от тих, хто мав мінімальний фундамент, — ШІ прискорить та значно підсилить. І все це вже відбувалось із наявними моделями, ще до Mythos».
Друга небезпека — кардинальна зміна темпу атак. Павло Бєлоусов пише про це так: «Зараз ШІ на озброєнні хакера — це як принтер у руках фальшивомонетника у 90-х. Ще три роки тому багато чого робилося вручну, потім підсилилося завдяки ШІ, а зараз все це ще й максимально якісно покращиться, масштабується й персоналізується. Хто не підготується, тому буде боляче».
Варто також пригадати, що за словами16 представників Anthropic, понад 99% знайдених за допомогою Mythos вразливостей ще не виправлено. Публікувати їх було б безвідповідально — але це означає, що прямо зараз у широко використовуваному програмному забезпеченні існують відомі Anthropic дірки, про які ніхто інший не знає. На додачу, Anthropic відкрито визнає17, що її нинішніх методів безпеки може бути недостатньо для наступних, ще потужніших версій ШІ. Дослідник Ніколас Карліні зазначив18, що за два тижні роботи з Mythos знайшов більше помилок у програмному забезпеченні, ніж за все попереднє професійне життя. Масштаб прихованих ризиків ми, можливо, ще навіть не можемо повністю уявити.
Джин уже вийшов із пляшки. Як далі розвиватиметься кібербезпека?
Хоча поки Anthropic контролює користування Mythos, цей контроль уже дає тріщини. За даними Bloomberg, невелика група користувачів отримала19 несанкціонований доступ до неї, до того ж це відбулося того самого дня, коли Anthropic оголосила про обмежене тестування. Це стало можливим через витік від стороннього підрядника, якого компанія найняла для перевірки своїх моделей. Anthropic підтвердила розслідування, але наголосила: доказів того, що витік вийшов за межі середовища підрядника, немає. Утім, за наявними даними, та сама група зберігає доступ і до інших ще не випущених моделей компанії.
Але головне — навіть без Mythos атаки із залученням ШІ-інструментів вже відбуваються. Нещодавно Google зафіксувала перший відомий випадок20, коли хакери використали ШІ для створення zero-day експлойту — інструменту для обходу двофакторної автентифікації, розрахованого на масове застосування, для якого ще не існувало оновлень, які б його знешкоджували. Ні Gemini, ні Mythos у цій атаці не застосовувалися — хакери скористались іншою, публічно доступною моделлю. Саме це і є найтривожніший сигнал: поріг входу для таких атак уже впав — ще до появи найпотужнішого інструменту на ринку.
Реліз Mythos варто розглядати не як ізольовану подію, а як прояв системного зсуву в кібератаках та цифровому захисті. Штучний інтелект вже давно використовується в кібербезпеці, але переважно як допоміжний інструмент для виявлення аномалій або автоматизації рутинних перевірок. Mythos робить якісний стрибок: вперше ШІ демонструє здатність автономно проходити повний ланцюжок атаки — від розвідки до захоплення системи. Дослідники Центру технологій та безпеки Тюрінґського інституту звертають увагу на окремий, менш очевидний ризик: якщо Mythos-клас моделей більше не можна буде обмежувати та контролювати, як це відбувається в межах Project Glasswing, ситуація докорінно зміниться. Тим паче, що відкриті моделі, які можна завантажити й використовувати без моніторингу, вже з’являються.
Окремим вектором тривоги залишається геополітичний вимір. Якщо Anthropic змогла створити Mythos, подібні можливості неминуче з’являться й у інших гравців — можливо, з менш відповідальним підходом до безпеки. Китай, за численними оцінками, активно розробляє власні потужні моделі. Саме тому частина аналітиків вважає, що обмеження доступу до Mythos — це правильний крок, але він лише перший у довгому шляху формування нових норм і стандартів для ШІ у сфері безпеки.
Публічні дискусії навколо Mythos нерідко зосереджені на корпоративних ризиках і державних рішеннях — але в небезпеці навколо Mythos існує цілком практичний вимір для кожного. Павло Бєлоусов стверджує: «Якщо зараз люди реально почнуть дотримуватися існуючих правил безпеки — оновлення ПЗ (а не відкладання на тижні та місяці), двофакторна автентифікація всюди, а не тільки на пошті — це все ще врятує пересічного користувача. Але це дійсно треба використовувати. Звичне правило «якщо виглядає як мій друг і говорить голосом мого друга — це мій друг» вже не діє. ШІ здатен генерувати переконливі діпфейк-відео та клони голосу в промислових масштабах. І якщо раніше орфографічні помилки чи незграбний переклад у листі були ознакою фішингу — тепер буде навпаки: саме такі неточності стануть маркером того, що текст писала людина, а не машина».
«Теза про те, що нікому та нічому не можна довіряти, стає основним підходом у виявленні підробок голосу, відео, які завдяки ШІ зараз вже ставляться на потік. Аргумент про те, що “я нікому не цікавий, тому мені нема чого ховати” хибний завжди, а зараз це вже звучить як заклик до атаки. Базові правила цифрової гігієни не змінились, але їх важливість зросла в рази. ШІ-інструменти не скасовують двофакторну автентифікацію, оновлення програмного забезпечення та обережність з підозрілими посиланнями — навпаки, без цього мінімуму ризики тепер неспівмірно вищі. Паранойя, яка раніше здавалась перебільшенням, сьогодні стає базовим рівнем цифрової гігієни», — підсумовує він.
Майбутнє кіберзахисту аналітики прогнозують без особливого оптимізму. Дослідники Bloomsbury Intelligence and Security Institute вважають21: у найближчі місяці кількість відомих, але незакритих вразливостей зростатиме — організації просто не встигатимуть латати їх у темпі, з яким ШІ їх знаходить. У середньостроковій перспективі поява схожих можливостей в інших розробників зробить стратегію обмеженого доступу дедалі менш ефективною — і відкриє двері для недержавних акторів, яким ШІ суттєво знижує поріг входу для складних атак. У довгостроковій — більш нестабільне кіберсередовище, де переваги від використання ШІ для захисту розподілятимуться нерівномірно: добре забезпечені структури виграють, решта — ні.
Проте технології завжди створювали нові загрози — і завжди знаходилися відповіді на них. Замки з’явилися разом зі зламниками, антивіруси — разом із вірусами. Питання не в тому, чи вдасться зупинити ШІ-атаки повністю, а в тому, чи вдасться утримати баланс. Для цього потрібні три речі одночасно: технічні стандарти, які не відстають від можливостей моделей; міжнародна координація, яка не дозволяє перетворити кіберпростір на зону без правил; і особиста відповідальність кожного, хто користується цифровими інструментами. Джин справді вийшов із пляшки. Але це не означає, що правила більше не діють. Це означає, що їх виконання стало питанням виживання, а не вибору.