Головна
Статті
Як ШІ змінює рецензування науки

Озвучена стаття Погляд — 18 грудня, 2025

Як ШІ змінює рецензування науки

ТЕКСТ:

shi_v_nauci — ІЛЮСТРАЦІЇ: Олександра Джиганська / @alexandradzh

Система рецензування десятиліттями працювала як головний фільтр довіри в науці. Не ідеальний, часто повільний, інколи несправедливий. Але все ж такий, що дозволяє спільноті домовлятися, які наукові результати варто вважати надійними. Сьогодні цей механізм входить у нову фазу, бо штучний інтелект (ШІ) став не просто інструментом для авторів, а потенційним учасником усієї екосистеми оцінювання наукового доробку. І ця трансформація відбувається у момент, коли рецензування і без того працює на межі можливостей.

Цього року з’явились одразу кілька сигналів, що трансформація вже не теоретична. По-перше, опитування IOP Publishing у 2025 році показало, що близько третини рецензентів уже використовують інструменти ШІ, а ставлення до їхнього впливу швидко поляризується¹.

По-друге, проблема ШІ як замінника рецензента перестала бути лише моральною дилемою. У листопаді 2025 року в Nature повідомили про дискусію довкола рецензування провідної конференції з машинного навчання — Міжнародної конференції з навчання подань (International Conference on Learning Representations ICLR 2026), де незалежний аналіз довів, що 21% рецензій могли бути повністю згенеровані ШІ². Реакція спільноти була показовою не стільки самими числами, скільки тим, що підозри виникали через типові симптоми машинного письма, зокрема, надмірну багатослівність, розмиті формулювання, інколи — навіть вигадані посилання. Це виглядає як перша велика публічна стрес-перевірка рецензування матеріалів наукових конференцій у добу великих мовних моделей.

По-третє, процес рецензування раптом отримав ще й вимір кібербезпеки. У нещодавньому препринті³ зафіксовано випадки, коли автори приховували в статтях невидимі для людини інструкції, розраховані на те, що рецензент використає велику мовну модель для аналізу рукопису. Промпти на кшталт «дати позитивну рецензію» були заховані білим текстом чи іншими техніками. Автори статті розцінили це не як невинний експеримент, а як нову форму маніпуляції процедурою оцінювання.

І, нарешті, є четвертий, майже символічний сигнал часу: запуск формату конференції, де і статті, і рецензії створювалися агентними системами ШІ⁴. Організатори подають це як пісочницю для перевірки меж машинного авторства і машинного оцінювання. Для нас це не стільки модель неминучого майбутнього, скільки експериментальна лабораторія: що саме ми хочемо вимірювати рецензією — змістовний науковий прорив чи відповідність формальним шаблонам якості?

У цій статті спробуємо розкласти трансформацію рецензування на зрозумілі рівні: де ШІ реально може бути корисним помічником, де він створює ризики для довіри й конфіденційності, і чому нова проблема не лише в тому, що чат-боти пишуть рецензії.

Що таке рецензування і чому воно перебувало в кризі ще до появи генеративного ШІ?

Рецензування у найпростішому сенсі — це домовленість наукової спільноти про контроль якості. Перед публікацією роботу читають незалежні експерти, вказують на помилки, просять додаткові докази, перевіряють логіку і новизну. Ідея в тому, щоб знання проходили через «сито» колег, а не лише базувалися на авторському ентузіазмі. Але на практиці це також система людської праці, яка тримається на часі, мотивації та відчутті професійного обов’язку. Коли ці ресурси виснажуються, «сито» не зникає, воно просто починає пропускати більше шуму або працювати повільніше. Саме це багато редакторів і дослідників останніми роками називають кризою рецензування⁵.

Потік рукописів зростає швидше, ніж готовність рецензентів брати нові запити. У публічних дискусіях про майбутнє видавничої системи цей дисбаланс описують як «виснаження рецензента» (reviewer fatigue)⁶. Дедалі більше науковців відмовляються від запрошень або рецензують формально, без глибокого занурення. На рівні великих журналів і видавництв це вже переростає в структурну проблему, яка підштовхує до пошуку технічних прискорювачів.

Дослідження про мегарецензентів показує, що в системі є невелика група людей, які роблять непропорційно великий обсяг рецензування, і при цьому більшість самих рецензентів вважають, що кращі стимули і визнання могли б підвищити готовність рецензувати⁷. Це означає, що криза відображає не лише збільшення кількості рукописів, а й те, як саме рецензування вписане в академічні кар’єри та винагороди.

Окрім цього, в багатьох галузях з’являється більше складних міждисциплінарних робіт, де потрібні різні типи експертизи. Для редактора це може означати два-три рецензенти замість одного, а для системи загалом — збільшення залучення людських годин на кожен опублікований текст. Погляд на сучасні реформи рецензування підкреслює, що без зміни процесів і стимулів ця модель дедалі важче масштабуватиметься⁸.

На цьому тлі генеративний ШІ виглядає не як модна іграшка, а як «автоматизований костиль» для системи, яка вже кульгала від перевантаження. Він обіцяє швидкі резюме рукописів, структуровані зауваження, перевірки на відповідність вимогам журналу, допомогу з мовою і навіть попередній скринінг для редакторів. Але важливо не переплутати причину і наслідок: ШІ входить у процес рецензування не тому, що наука раптом повірила в технологічну досконалість моделей, а тому що стара система дедалі гірше справляється з темпом публікацій⁹. І саме ця вимога визначатиме, чи стане ШІ для рецензування розумним підсилювачем якості. Чи просто швидким способом латати дірки в перевантаженій інфраструктурі.

Опублікуй або згинь! — подкаст «Пост правди»

Подвійна трансформація: ШІ змінює не тільки науку, а й оцінювання науки

Паралельно з дискусією про те, чи можуть інструменти генеративного ШІ допомагати рецензентам, відбувається інша зміна: дедалі більше статей потребують рецензування не лише як текстів, а як ШІ-систем. Для значної частини сучасних робіт у медицині, біології, соціальних науках або комп’ютерній інженерії ШІ — це не інструмент написання, а ядро методології: модель, що ухвалює рішення, прогнозує, класифікує чи узагальнює дані¹⁰. І це змінює саме запитання, які має ставити рецензент. Не «Чи добре написано?», а «Чи адекватно описані дані і навчання?», «Чи коректно оцінена похибка й узагальнюваність?», «Чи не є результати артефактом вибірки або налаштувань?». На цьому тлі поява нових чеклистів і рекомендацій щодо звітності про використання генеративного ШІ є логічною відповіддю системи на методологічний зсув¹¹.

Цей «другий фронт» трансформації добре видно на рівні глобального порядку денного. Тема цьогорічного тижня рецензування (Peer Review Week 2025), «Переосмислення рецензування в еру ШІ», фіксує структурні зміни: ШІ одночасно впливає і на те, як ми рецензуємо, і на те, що саме ми рецензуємо¹².

Іншими словами, сьогодні рецензування стикається з подвійним викликом. Система має навчитися працювати з новими ШІ-інструментами, і водночас виробити компетентність і стандарти для оцінювання науки, у якій алгоритми вже стали повноправними методами дослідження.

Як ШІ входить в редакційний процес?

Якщо уявити рецензування як ланцюг виробництва довіри, то генеративний ШІ входить у нього одразу в кількох вузлах. І переважно — там, де є найбільше рутини або дефіциту часу. Саме тому правильніше говорити не про великі мовні моделі, які пишуть рецензії, а про дорожню карту всього процесу, де інструменти можуть допомагати редакторам і рецензентам виконувати різні типи завдань із різним рівнем ризику. Водночас більшість редакцій, які обережно експериментують зі ШІ, розглядають його як спосіб підсилити якість і швидкість структурних перевірок, а не як автоматичного суддю новизни чи значущості результатів¹³.

1. Тріаж і редакторська оцінка.

Перший контакт рукопису з журналом часто вирішує долю роботи за лічені дні. Тут ШІ потенційно найбільш природний, бо він може швидко підсумовувати текст, виділяти ключові елементи, перевіряти відповідність формальним вимогам або сигналізувати про відсутні компоненти. Так редактори отримують структурну навігацію, яка економить час на десятках рукописів. Наукова дискусія також підтверджує, що використання великих мовних моделей як інструменту виділення потрібних елементів чи прискорення рутинних кроків може підвищити ефективність, але потребує тестування стандартів і обережності¹³.

2. Підбір рецензентів.

Тут ШІ може виступати як розумний пошуковик експертизи для зіставлення тем, ключових слів і контекстів. Цей сценарій видається перспективним ще й тому, що проблема вчасного призначення рецензентів — одна з найболючіших у сучасному процесі рецензування. Але навіть у цьому, здавалося б, технічному завданні є ціннісна складова. Рандомізоване дослідження¹⁴ показало: якщо велику мовну модель використовувати за замовчуванням, без явної інструкції враховувати різноманіття, вона схильна пропонувати переважно чоловіків і науковців із країн із високим доходом. Коли ж до запиту додають DEI-підказку (Diversity, Equity, and Inclusion — різноманіття, справедливість та інклюзія), добір стає значно гендерно та географічно різноманітнішим. Важливо, що за базовими показниками наукової продуктивності (на кшталт кількості публікацій, цитувань та індексу Гірша) між цими групами потенційних рецензентів істотної різниці не виявили. Тобто йдеться не про зниження планки заради різноманіття, а про корекцію алгоритму, який без додаткових правил просто відтворює наявні структурні перекоси. Це доказ того, що нейтральний алгоритм без добре продуманих правил у рецензуванні — міф.

3. Чеклисти якості.

Це етап із найменшим конфліктом. ШІ може допомагати з перевірками звітності, структури методів, коректності форматів посилань чи базових статистичних вимог. Моделі добре працюють як системи нагадування і виявлення формальних прогалин, які люди через втому або неуважність можуть пропустити. Це не замінює експертну оцінку достовірності, але знижує ризик технічних дір.

4. Стислий конспект для рецензента.

Ще один відносно безпечний сценарій — це автоматичні резюме або структури рукопису, які допомагають рецензенту швидше зрозуміти логіку статті, сформувати список запитань і не витрачати перші години на реконструкцію задуму автора¹³. У найкращій версії це економить час для уважного читання методів, даних і висновків.

5. Метааналіз і редакторські висновки.

Коли є кілька рецензій, ШІ може допомогти редактору узгодити їх. Тобто виділити точки згоди і розбіжності, зробити короткий підсумок для автора. Але саме тут важливо не перейти межу. Інструменти ШІ можна використовувати для систематизації, але не для делегування рішення.

Отже, найменш конфліктні та найреалістичніші на сьогодні сценарії — це структурні, рутинні та організаційні функції. Вони адресують реальну втому системи і можуть підвищити якість процесу. Натомість оцінювання новизни, значущості та етичної складності дослідження залишається територією людського судження. Принаймні доти, доки спільнота не домовиться про правила, прозорість і відповідальність у гібридному рецензуванні.

Як рецензенти реально використовують ШІ?

На рівні щоденної практики бачимо, що генеративний ШІ у рецензуванні вже став помітною поведінковою реальністю, проте ще не перетворився на норму з усталеними правилами.

Емпіричне підтвердження цьому дає звіт IOP Publishing¹. Опитування охопило 348 дослідників, яких запрошували як активних рецензентів або авторів у журналах видавництва. 32% респондентів повідомили, що вже використовували ШІ для підтримки рецензування. Оцінки впливу генеративного ШІ розійшлися: 41% очікують позитивного ефекту, 37% — негативного, а частка нейтральних позицій зменшилася. Показово й те, що соціальна легітимність автоматизованих рецензій залишається обмеженою: 57% були б незадоволені, якби генеративний ШІ написав рецензію на їхню статтю, і 42% — навіть якщо ШІ лише підсилював людський текст.

Генеративний ШІ у рецензуванні швидко стає практикою. Ми бачимо не консенсус, а нормативну боротьбу між потребою розвантажити систему і страхом втратити людську відповідальність за якість досліджень.

Нові інструменти — нові ризики

Сьогодні до класичних ризиків генеративного ШІ, на кшталт галюцинування, загроз конфіденційності і надмірної ввічливості, додався новий, майже несподіваний вимір. Процес рецензування раптом отримав нові атаки, знайомі з кібербезпеки. Якщо в процесі оцінювання з’являється велика мовна модель як інструмент, то текст рукопису може спробувати керувати цим інструментом. І це змінює саму логіку довіри в системі.

Отже, автори вставляють у рукопис приховані інструкції для великих мовних моделей. Часто це роблять білим текстом або шрифтом мінімального розміру, так щоб людина їх не помітила, а машина прочитала. Зміст таких інструкцій може містити прохання дати позитивну рецензію або не згадувати недоліки взагалі.

Влітку 2025 року на arXiv виявили цілу низку таких препринтів, і частину з них планували зняти або виправити¹⁵. Це спроба обдурити ШІ-інструменти, які деякі рецензенти можуть використовувати для допоміжного аналізу рукописів. У статті «Приховані промпти в рукописах експлуатують рецензування за допомогою штучного інтелекту» випадок із arXiv інтерпретується як нова форма порушення доброчесності, а не як невинний експеримент³. А робота¹⁶ показує, що такі приховані ін’єкції можуть бути ефективними проти різних моделей і різних шаблонів промптів під час рецензування. Особливо якщо рецензент надто покладається на великі мовні моделі.

Традиційне рецензування будувалося на припущенні, що людина оцінює текст. Навіть якщо людина була втомлена або упереджена, рукопис не мав прямого каналу впливу на її когнітивний інструмент.

З великими мовними моделями все інакше. Якщо рецензент використовує модель як швидкий конспект, то рукопис отримує можливість вбудувати інструкцію в середовище оцінювання. Тобто процес може перетворитися на намагання керувати інструментом, яким оцінюють текст. І це — зміна архітектури загроз у системі наукової довіри.

Отже, у систему доведеться додати технічний скринінг на приховані інструкції. Так само, як ми давно додаємо перевірки на плагіат. Крім цього, потрібні чіткі редакторські правила щодо використання ШІ рецензентами. Великі видавці вже рухаються у цьому напрямку. Elsevier і Nature Portfolio, наприклад, наголошують, що рецензенти не повинні завантажувати конфіденційні рукописи в зовнішні генеративні інструменти, щоб не порушувати угоди про конфіденційність і права авторів^17,18.

Нові ризики використання генеративного ШІ в рецензуванні не обмежуються питанням, хто написав рецензію. Вони починаються значно раніше. З того, як саме текст рукопису взаємодіє з інструментами, які ми допускаємо до процесу оцінювання. І в цьому випадку технологічна інновація змушує науку запозичити частину логіки безпеки, щоб зберегти довіру до досліджень.

Чи впливає ШІ на якість рецензії?

Найцікавіше питання в цих трансформаціях полягає в тому, чи збігається логіка ШІ-рецензій з людською. Перші дослідження говорять, що збігається лише частково.

У препринті «Коли твій рецензент — велика мовна модель» автори порівнюють ШІ-оцінки з людськими рецензіями на наборах робіт із двох відомих конференцій ICLR 2023 і NeurIPS 2022¹⁹. Автори показують, що моделі загалом краще узгоджуються з людьми щодо сильніших робіт, але мають тенденцію завищувати оцінки слабшим. Це важлива деталь для культури якості, оскільки автоматизований оптимізм може підривати здатність системи відсіювати сирі результати досліджень.

Ще один висновок із цього дослідження — великі мовні моделі чутливі до інструкцій, зашитих в тексти, і такі промпти можуть зміщувати акценти рецензії. Це перегукується з ширшим занепокоєнням про розмиття межі між асистуванням і делегуванням судження, яке підтверджують також і інші дослідження²⁰.

Отже, навіть коли рецензії видаються формально коректними, ШІ може непомітно змістити акценти, винагороджуючи відповідність структурі, а не новизну. Це не аргумент проти використання великих мовних моделей, а аргумент за обережний дизайн ролей, в якому людина має оцінювати значущість і науковий сенс.

ШІ вже став частиною екосистеми рецензування. І головне питання сьогодні — де саме його роль легітимна і корисна. Глобальна дискусія говорить про те, що ШІ має доповнювати, а не замінювати експертне судження.

Найбезпечніша зона — інфраструктурні та рутинні задачі, на кшталт перевірки структури статті, мови, навігації текстом. Натомість оцінка новизни, значущості та методологічної надійності має залишатися людською відповідальністю.

Якщо академічне середовище не переорієнтує стимули з кількості публікацій на якісне рецензування та оцінювання, ШІ залишиться лише зручним пластирем на перевантаженій моделі.

Найімовірніше, ми прийдемо до гібридної норми з прозорими правилами і технічним скринінгом. Але без цього легко скотитися в сірий режим недекларованих практик. Або, навпаки, перейти до безпеки як стандарту, де аудити і захист від ШІ-маніпуляцій стануть такою ж рутиною, як перевірка на плагіат.

Найбільший ризик — не в тому, що ШІ пише рецензії, а в тому, що ми можемо непомітно змінити критерії хорошої науки.

Посилання:

0:00/0:00

Статті, які можуть вас зацікавити

Озвучена стаття Погляд — 29 квітня

Чому нам потрібна популяризація математики для життя, професії та національної безпеки. Блог Ірини Єгорченко

Стаття Погляд — 06 серпня

Наука не продається, а те, що продається, — не наука. Блог Ірини Єгорченко

Стаття Погляд — 04 квітня

Історія курей та науки

Стаття Суспільство — 06 листопада