Вчені Центру регулювання геноміки (CRG) представили інноваційний інструмент пояснювального штучного інтелекту — CANYA, здатний аналізувати хімічну «мову» білків.
Завдяки аналізу понад 100 000 синтетичних фрагментів білків у дріжджових клітинах, CANYA ідентифікує мотиви, що провокують або стримують утворення амілоїдних агрегатів. Як зазначає д-р Майк Томпсон, «ми створили справді випадкові фрагменти білків, включаючи версії, яких не існує в природі».
Особливість CANYA полягає в її прозорості рішень, що вигідно відрізняє її від традиційних «чорних скриньок» штучного інтелекту. Вона поєднує елементи конволюційних моделей (аналіз локальних патернів) та моделей уваги (оцінка значущості мотивів у глобальному контексті). Як зауважив проф. Бен Лехнер, «поєднання великомасштабного генерування даних з ШІ може прискорити дослідження».
Загалом CANYA виявила, що водовідштовхувальні амінокислоти сприяють згущенню, тоді як заряджені амінокислоти можуть поводитися непередбачувано, залежно від контексту. Вчені прагнуть перейти від бінарної класифікації до прогнозування швидкості агрегації, що має значення для терапії нейродегенеративних хвороб. «Це лише перший крок, але наша робота показує, що розшифрувати мову агрегації білків можливо», — підсумовує д-р Болоньєзі.
Результати мають важливе значення для біомедицини і біотехнології, зокрема у фармацевтиці, де агрегація білків часто порушує стабільність ліків. За словами Болоньєзі, «якщо терапевтичний білок починає агрегувати, виробництво партії може бути зірване». Дослідження фінансували провідні наукові установи Європи, що підкреслює його стратегічне значення для майбутніх досліджень людських хвороб.