Цьогоріч Нобелівську премію розділили між собою навпіл американець Девід Бейкер з Медичного університету Говарда Г’юза і британці Деміс Гассабіс та Джон Джампер з британської Google DeepMind, відповідно, за комп’ютерне проєктування білка і прогнозування білкової структури. Цікаво, що двоє із лауреатів не є ані хіміками, ані біологами: вони математики, а точніше — архітектори штучного інтелекту. Однак саме їм пощастило створити унікальний інструмент для аналізу і синтезу будь-якого білка, наявного зараз або ще не отриманого у жодній лабораторії. На думку Нобелівського комітету, саме поєднання методів двох очолюваних лауреатами дослідницьких груп розкрило перед ученими далекосяжні перспективи — від можливості з’ясувати природу значної кількості інфекційних і генетичних захворювань і запобігти ним аж до створення у пробірці унікальних білків із заданими наперед властивостями. До того ж робити це не наосліп, послуговуючись лише інтуїцією дослідника і щасливим збігом обставин, а за створеними машиною детальними рецептами. Звучить складно і дещо фантастично.
З хімічної точки зору, білки — це звичайний поліамід, речовина, яка складається із залишків , з’єднаних між собою так званою пептидною групою —(CO)NH— у довгі ланцюжки. На відміну від синтетичних поліамідних сполук, таких як капрон, білки часто називають поліпептидами. Маси молекул деяких із них вражаючі. Наприклад, далеко не найдовша молекула людського білка фібриногена, завдяки якому кров згортається і не дає людині померти від кровотечі, приблизно у 20 тисяч разів важча за молекулу води. Ще однією суттєвою відмінністю поліпептидів від звичайного поліамідного волокна є те, що останнє формується переважно із залишків однієї амінокислоти, натомість молекула білків може містити залишки одразу декількох амінокислот. Попри те, що природних, так званих стандартних амінокислот лише 20, число можливих варіантів білкових молекул сягає справді астрономічних величин: на сьогодні містить близько 200 мільйонів сполук. Скільки їх, ще не ідентифікованих, залишилося у загадках Всесвіту, не знає ніхто. Але це не єдина складність.
Головна проблема полягає в тому, що білкові молекули, як і більшість складних органічних сполук, існують у вигляді не витягнутих вздовж скелету ниток, а, обертаючись у місцях міжатомних зв’язків, можуть утворювати різні просторові форми. Хіміки називають ці форми конформаціями. У шкільному курсі хімії розповідають, що навіть така проста молекула, як циклогексан (C₆H₁₂) може приймати цілих п’ять , що ж мовити про молекули, число атомів яких сягає сотень тисяч? До того, якщо конформації циклогексану не мають принципової різниці для хіміків-технологів, які використовують його як сировину для виробництва вже згаданого капрону, то від просторової конфігурації білків напряму залежить їхня реакційна здатність у складних біохімічних реакціях. Справді, у деяких конформаціях реагент просто не зможе дістатися до цільового атома внаслідок суто просторових утруднень.
Утім, виявляється, що молекули білків, на відміну від їхніх органічних сородичів, завжди займають одну обрану конформацію — найвигіднішу для реакційної здатності. Деякі з них залишаються лінійними, деякі згортаються у кульки-глобули, деякі утворюють інші доволі химерні тривимірні структури. До того ж молекули займають це положення прямо в процесі створення під час , не перебираючи навмання усі можливі варіанти в суворій відповідності до послідовності амінокислотних залишків у ланцюжку. З’ясувати, як саме ті чи інші білки згорнуться і в якому саме стані перебувають під час взаємодії з , виявилося нетривіальною задачею, яку досі вирішували доволі складним, незручним і тривалим методом . Так вдалося встановити тривимірну структуру близько 0,1% відомих білків. Погодьтеся, величина не надто надихає, зважаючи на те, що впритул цим питанням займалися науковці багатьох країн світу аж з 1970-х років. У 1992 році був навіть започаткований міжнародний конкурс на найкращий метод передбачення тривимірної структури білків () за відомими послідовностями амінокислот. Утім, довгий час так-сяк це вдавалося зробити хіба що у половині випадків. Здавалося, що задача не має вирішення.
У 1952 році американський письменник Раймонд Джоунс опублікував науково-фантастичне оповідання «Рівень шуму», в якому описав, як низку провідних фізиків переконали у можливості створення генератора антигравітації, ідеї, яка безумовно суперечить чинній фізичній теорії. І ті, хто повірив у докази, хитро сфальсифіковані урядом, змогли створити такий пристрій. Хитрість полягала ще й у тому, що згадані фізики не були вузькими фахівцями у галузі досліджень гравітації. Інтереси цьогорічного нобелівського лауреата Деміса Гассабіса пролягали ще далі від сфери біохімії. За фахом програміст, у конкурсі CASP Гассабіс вбачав можливість удосконалити трансформерні алгоритми власного варіанту штучного інтелекту під назвою AlphaFold. І його команда досягла суттєвого успіху: на черговому етапі конкурсу CASP їхній варіант ШІ правильно передбачив 60% структур. Однак це була «стеля» для тодішнього AlphaFold.
Друге дихання проєкту надав ще один програміст Джон Джампер, який приєднався до Google DeepMind у 2017 році. Маючи значний досвід з комп’ютерного моделювання білків і багаторічні напрацювання у цій галузі, він додав те, чого бракувало групі Гассабіса — специфічні знання з біохімії і структури білків. Наступний AlphaFold 2, побудований за принципом , навчили на величезній кількості баз даних, змушуючи його самотужки перевіряти власні результати. Комбінуючи різні амінокислоти й щоразу перевіряючи розрахунково зміни отриманих внаслідок цього теоретичних сполук, ШІ відкидав неприйнятні варіанти, однак не нехтував ними в подальших ітераціях. Здається, впираючись у нездоланний парадокс, ми так само повертаємося до думок, які спочатку відкинули як абсурдні. Через три роки Джампер і Гассабіс презентували модель, яка точно передбачає тривимірну структуру білків з точністю більше ніж 90%. Перебуваючи у загальному доступі, AlphaFold 2 став неодмінним інструментом всіх дослідників у галузі біохімії білків.
Девід Бейкер із Вашингтонського університету Сіетла, натомість, — не новачок у біохімії. Вивченню структури білків він присвятив усю свою кар’єру, однак, віддаючи перевагу уявному експерименту і штучному інтелекту. Так само як існують любителі збирати комп’ютерні операційні системи з вихідного коду, на кшталт Linux from Scratch, Бейкер — прихильник конструювання білків ab initio, тобто з простих речовин. Його власний варіант ШІ для прогнозування білкової структури під назвою Rosetta також ставав йому в пригоді й навіть брав участь у конкурсі CASP. Нобелівська ідея прийшла трішки пізніше. Бейкеру спало на думку перевернути свою модель догори дриґом: навіщо передбачати, відкидаючи масу хибних варіантів, якщо можна змусити штучний інтелект одразу сконструювати білок «правильно». А якщо Rosetta робитиме це в улюблений Бейкером спосіб ab initio, то пов’язаних із використанням наявних у природі фрагментів білків хиб можна уникнути. До ШІ було підключено вже знайомі нам трансформери й невдовзі вона видала перший результат. Групі Бейкера залишилося тільки повторити за Rosetta усі кроки в натурі, й на столі дослідників з’явився перший білок заданої структури із заданою ними послідовністю амінокислотних залишків.
Нові поліпептидні матеріали із заданими властивостями — аж до здатності проводити нервові імпульси чи, скажімо, прикріплюватися вибірково до мембран спотворених раком клітин, ізолюючи їх від здорової тканини, — вже не ввижаються аж надто фантастичними. Здається, це стане перспективою кількох наступних років, зважаючи на те, що інструменти Гассабіса, Джампера і Бейкера загальнодоступні для науковців усього світу.
А далі, уявіть собі на хвильку, що нові, невідомі Природі білки, які не транслювалися досі жодним організмом, можуть стати основою для нових видів живого. І ці нові види цілеспрямовано створюватиме людина, подекуди буркаючи на свого колегу — штучний інтелект. Аби тільки встигнути вбудувати в нього азімівські Три Закони роботехніки!