Biomedical Chemistry: Research and Methods 20120, 3(3), e00129

СОДЕРЖАНИЕ

ВВЕДЕНИЕ

МАТЕРИАЛЫ И МЕТОДЫ

РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ

СОБЛЮДЕНИЕ ЭТИЧЕСКИХ СТАНДАРТОВ

ФИНАНСИРОВАНИЕ

КОНФЛИКТ ИНТЕРЕСОВ

ДОПОЛНИТЕЛЬНЫЕ МАТЕРИАЛЫ

ЛИТЕРАТУРА

Рисунок 1 Структура тиотропия с указанием выделенных фармокофорных точек (A) и примеры структур (B, C) и общих элементов структур (D-F) с известными значениями Ki для M1-M5 холинорецепторов.

Рисунок 2 Сравнение наблюдаемых и предсказанных значений pKi при тестировании. A. Предсказание для выборки M2 по уравнению, полученному для выборки M1, M3, M4, M5. B. Предсказание для выборки M3 по уравнению, полученному для выборки M1, M2, M3, M5. C. Предсказание для выборки из чётных номеров выборки M1, M2, M3, M4, M5 по уравнению, полученному для нечётных номеров. D. Предсказание для выборки из нечётных номеров выборки M1, M2, M3, M4, M5 по уравнению, полученному для чётных номеров.

Таблица 1Структуры ацетилхолиновых мускариновых рецепторов, представленные в PDB [4].

Таблица 2Показатели обучения и тестирования моделей линейной регрессии по выборкам для отдельных рецепторов и их комбинаций.

Обобщённая модель предсказания константы ингибирования мускариновых холинорецепторов M1-M5

А.В. Микурова1*, В.С. Скворцов1,2, В.В. Григорьев2

1Научно-исследовательский институт биомедицинской химии имени В. Н. Ореховича,
119121, Москва, Погодинская ул., 10; *e-mail: a.v.mikurova@ibmc.msk.ru
2Институт физиологически активных веществ,
142432, Московская область, Черноголовка, Северный проезд, 1

Ключевые слова: мускариновые ацетилхолиновые рецепторы; ингибиторы; конкурентное ингибирование; докинг; вычислительные методы; молекулярная динамика; QSAR

DOI: 10.18097/BMCRM00129

ВВЕДЕНИЕ

Ацетилхолиновые мускариновые рецепторы (М-холинорецепторы) представляют собой группу белков, которые принимают участие в регуляции когнитивных процессов, оказывают влияние на работу желез внутренней секреции, управляют работой гладкой мускулатуры, а также контролируют двигательную активность [1]. Разные варианты (подтипы) рецепторов имеют различную локализацию в тканях организма и часто рассматриваются как важные биомишени, ингибиторы которых можно использовать в качестве лекарственных средств для лечения целого спектра патологических состояний [2]. Причём, важно рассматривать селективность связывания того или иного соединений (потенциального или реального лекарственного средства), чтобы избежать возможных побочных реакций в организме [3]. Ранее нами уже была опубликована работа, в которой исследована возможность создания набора компьютерных моделей для предсказания набора констант ингибирования (Ki) для четырёх из пяти М-холинорецепторов (M1-M4) [4]. В работе использовали моделирование комплексов методом молекулярного докинга с последующей симуляцией молекулярной динамики и создание линейных уравнений, основанных на энергетических параметрах, рассчитанных методом MM-PBSA/MM-GBSA. Однако за прошедшее время в Protein Data Bank (PDB) [5] стала доступна 3D структура M5 рецептора [6]. Кроме того, в настоящей работе использована расширенная выборка соединений – ингибиторов M1-M5 рецепторов, а также введены дополнительные правила отбора вариантов докирования, основанные на априорном знании о структуре комплексов с гомологичными лигандами.

Основной задачей, как и в предыдущей работе, было создание набора моделей для оценки параметров конкурентного ингибирования относительно метил-скополамина произвольного лиганда к набору М-холинорецепторов (M1, M2, M3, M4 и M5).

МАТЕРИАЛЫ И МЕТОДЫ

3D cтруктуры рецепторов и подготовка данных

На момент подготовки статьи из 5 М-холинорецепторов человека 4 (M1, M2, M4 и M5) имели известную 3D-структуру, доступную в PDB [6-8] (табл. 1).

Закрыть окно
Таблица 1. Структуры ацетилхолиновых мускариновых рецепторов, представленные в PDB [4].

Кроме того, известна структура ещё одного рецептора (M3-холинорецептора) крысы [9]. Как видно из таблицы 1, аминокислотные последовательности рецепторов существенно различаются. Следует также отметить, что трёхмерная структура, строго говоря, получена для химерных рецепторов, у которых внемембранная часть заменена на фрагмент другого белка, который, в свою очередь, позволяет сохранить архитектуру мембранной части рецептора [6-9]. Только структуры рецепторов M1 (код в PDB 5CXV) и M2 (3UON) пригодны для молекулярного моделирования без дополнительных подготовительных процедур. Для рецепторов M4 (5DSG) и M5 (6OL9) элементы петель с неразрешёнными координатами были заделаны простым подбором петель, подходящих по конфигурации, средствами программы SYBYL-X [10]. Аминокислотные остатки, входящие в состав данных петель, находятся далеко от места связывания, и их реконструкция обеспечивает восстановление целостности структуры, что является необходимым условием для проведения молекулярной динамики, которая играет большую роль в нашей работе. Структура M3 холинорецептора человека была построена ранее на основании рецептора крысы (4DAJ) [4].

Важно, что 4 из 5 рецепторов представлены в виде комплексов с тиотропием (Tiotropium, (1α,2β,4β,7β)-7-[(гидроксиди-2-тиэнилацетил)окси]-9,9-диметил-3-окса-9-азониатрицикло[3.3.1.02,4]нонан), а рецептор M2 с соединением (3R)-1-азабицикло[2.2.2]окт-3-ил(гидрокси)ди(фенил)ацетат ((3R)-1-azabicyclo[2.2.2]oct-3-yl hydroxy(diphenyl)acetate), хоть и отличным химически, но имеющим общие (или схожие по свойствам) с тиотропием структуры, позволяющие выделить набор фармакофорных мотивов, положение которых в комплексе может быть использовано как вторичный фильтр для отбора гипотез положения лиганда, полученных молекулярным докингом. В нашей работе использовали (рис.1А): 2 преимущественно гидрофобных цикла, положительно заряженный атом азота и положение OH группы в центральной части молекулы. Выбор обусловлен тем, что у большинства структур, использованных в работе, можно было выделить как минимум три аналогичных фармакоформных фрагмента (рис. 1). В основном были представлены все четыре, но в отдельных случаях отсутствовал один из циклов, либо центральная OH-группа при наличии карбонильной (в качестве фармакофорной точки использовали положение атома кислорода).

Поскольку все имеющиеся структуры представляют из себя комплексы с известными ингибиторами, то подготовка включала в себя простую минимизацию в поле сил TRIPOS [10] для расчёта электростатических взаимодействий для рецептора; в дальнейшем для низкомолекулярных ингибиторов использовалась схема частичных зарядов из мерковского поля сил [10].

Рисунок 1. Структура тиотропия с указанием выделенных фармокофорных точек (A) и примеры структур (B, C) и общих элементов структур (D-F) с известными значениями Ki для M1-M5 холинорецепторов.

Данные по ингибиторам с известными значениями Ki.

В настоящей работе были использованы 3 набора данных для нескольких групп соединений [11-13] (см. дополнительные материалы), отличительной особенностью которых является то факт, что для большей части значения Ki известны для 2-х холинорецепторов (M2 и M3), а для примерно трети из них - для трёх-пяти холиновыхрецепторов человека. Примеры базовых структур представлены на рисунке 1. Важно, все данные были получены на одном наборе клеточных линий, и величина Ki была оценена при помощи одного метода [14] – ингибированию связывания меченого метилскополамина (Всего для M1 холинорецептора известно 34 наблюдения, при этом диапазон значений pKi, используемый для дальнейших расчётов, составлял от 6.7 до 9.8 логарифмических единиц. Для выборок M2-M5 известны соответственно 86 наблюдений (диапазон pKi 5.3-12.5), 108 (6.1-12.5), 28 (5.9-10.3) и 28 (5.4-9.9) наблюдений. Общим недостатком выборок для M1, M4 и M5 холинорецепторов были их небольшие размеры. Для всех выборок также имеется проблема с неравномерным распределением данных, большая часть которых соответствует узкому диапазону в 2 логарифмические единицы.

Процедура моделирования комплексов и расчёта параметров для создания предсказательных моделей

Комплексы ингибиторов с рецепторами моделировали по единой схеме, уже описанной ранее [4], с некоторыми модификациями:

  1. Докирование программой Dock 7 [15] с использованием встроенной оценочной функции и отбором до 100 лучших вариантов после кластеризации результатов (RMS=2.0 Ǻ).
  2. Отбор из 100 вариантов лучшего по соответствию положения фармакофорных мотивов относительно их положения в исходном комплексе с тиотропием или (3R)-1-azabicyclo[2.2.2]oct-3-yl hydroxy(diphenyl)acetate по сумме квадратов расстояния между мотивами, но не более 2 Ǻ для каждой пары.
  3. Оптимизация полученного варианта комплекса (единственного) при помощи программы Amber18 [16] многостадийной процедурой:

    a. формирование бокса водного окружения (модель воды TIP3);

    b. оптимизация свободной энергии комплекса минимизацией в поле сил «aF02» до 1000 итераций в периодически граничных условиях;

    c. симуляция молекулярной динамики с последовательным разогревом системы (50 пс, с шагом в 2 фс), выравниванием давления (50 пс), уравновешиванием системы (0.2 нс) и симуляцией продуктивной динамики (1 нс).

  4. На последнем этапе молекулярной динамики на основании полученной траектории модулем MMPBSA [17] были рассчитаны параметры для 50 последовательных состояний. Расчёт энтропийных вкладов проводили только для трансляционного (TSTRA) и ротационного (TSROT) вкладов. Расчёт колебательного ( Параметр TSVIB не расчитывали.
  5. Параметры, рассчитанные модулем MMPBSA, были использованы в качестве независимых переменных для создания уравнений, предсказывающих pKi = -log(Ki). Сольватационную составляющую вычисляли как методам Poisson-Boltzmann (PB), так и методом Generalized Born (GB) [17]. При этом в уравнениях использовали оба набора данных (по 2 компонента из каждого метода, всего 4). Оба варианта дополняют друг друга и, в среднем, часто дают лучший результат. Таким образом, в работе использованы 9 переменных в качестве независимых: 4 упомянутых выше, а так же молекулярный вес, изменение величин электростатического взаимодействия (ELE), ван-дер-ваальсовых взаимодействий (VDW), TSTRA и TSROT.

Для построения предсказательных моделей были использованы простые уравнения линейной регрессии. Так как в результате для таких уравнений было использовано 9 независимых переменных, то малые размеры выборок для , не позволяющим остановиться на 5 независимых уравнениях. Выборки сливали между собой, однако при этом число независимых переменных увеличивалось за счёт введения индикаторных переменных, принимавших значение 1, если наблюдение бралось из выборки для конкретного рецептора и 0 для остальных рецепторов (так, если в выборки объединяли данные для 3 рецепторов, добавляли 2 индикаторные переменные).

Для выполнения расчетов был использован гибридный высокопроизводительный вычислительный комплекс Федерального исследовательского центра «Информатика и управление» Российской Академии Наук (ФИЦ ИУ РАН) [18] IBM на базе CPU Power9 и графических ускорителей Nvidia Tesla V100.

РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ

Основные результаты работы на различных этапах представлены в таблице 2. Важно отметить, что в работе не ставилась задача любой ценой получить комплекс лиганда с белком, удовлетворяющий условию сходства по положению в кристалле с тиотропием для определённых фармакофорных мотивов. Более того, например, для соединений, соответствующих базовой структуре на рисунке 1F, сделать это однозначно нельзя (трёхчленный цикл имеет заместители с выраженной асимметрией, дающие как минимум два варианта положения в кристалле), так что они были вынуждено отброшены, чтобы не привносить в модели элемент произвола. При тестировании подобной группы соединений следует рассматривать несколько групп вариантов, содержащих больше фармакофорных элементов. Всего после процедуры докирования из 284 возможных вариантов комплексов было отобрано 199, причём, автоматизированный докинг не нашёл решения для 17 вариантов, а остальные 68 не совпадали с заданным расположением фармакофорных групп.

Закрыть окно
Таблица 2. Показатели обучения и тестирования моделей линейной регрессии по выборкам для отдельных рецепторов и их комбинаций.

Рассмотрим сначала результаты для отдельных выборок (табл. 2). Результаты для выборок M1, M4 и М5 не могут считаться значимыми, так как, несмотря на хорошие показатели при обучении (кроме M1), тест на случайное перемешивание данных показывает величину усреднённого R2 в диапазоне от 0.3 до 0.51. Косвенно это указывает, что в данном случае возможно переобучение, связанное с малыми размерами и неравномерностью распределения данных. Для выборок M1 и M5 об этом свидетельствует и процедура скользящего контроля методом выбрасывания по одному (Q2 меньше 0.2). Для выборок M2 и M3 этот эффект отсутствует (усреднённый R2 обучения при случайном перемешивании 0.09 и 0.12 соответственно). Процедура скользящего контроля показывает результат ниже порогового значения (Q2=0.6), но близкий к нему. В тоже время тест на перекрёстное предсказание в ряде случаев демонстрирует результат даже лучше ожидаемого (например, предсказание для выборок M2 и M3 по уравнению, построенному для выборки M4). Это позволило ожидать, что при слиянии выборок можно получить результат, как минимум, не хуже.

Как видно из таблицы 2, проблема переобучения, связанная с размерами выборки, для комбинированных выборок отсутствовала, несмотря на то, что число независимых переменных было увеличено. Однако, если в общей выборке отсутствовали данные из выборок M2 или M3, сохранялась существенная неравномерность в распределении данных. Так как тестовой выборки для суммирующей данные по всем 5 рецепторам не было, то провели контрольный эксперимент, разделив её пополам на чётные и нечётные номера после ранжирования по значению pKi. Для выборок, в которых полностью отсутствовали данные для одного из рецепторов, R2 предсказания был около 0.5 (рис. 2A и 2B), что уже позволяет отличить сильные ингибиторы холинорецепторов от слабых. Деление же общей выборки пополам (R2 предсказания не меньше 0.68, рис. 2С и 2В) позволяет ожидать, что для схожих по структуре химических соединений, при условии наложения дополнительного ограничения при отборе вариантов после докинга, можно ранжировать их как минимум на 3 класса: сильные, средние и слабые ингибиторы. Так как различные комбинации выборок дают в двух типах тестовых экспериментов R2 предсказания на уровне от 0.6 до 0.7, то это, вероятно, предельная точность предсказания, которую можно получить на рассматриваемом наборе данных. При этом среднее значение ошибки предсказания 0.55 единицы логарифмической шкалы, а максимальная ошибка 1.65 единицы при ширине диапазона значений pKi в 4.7 единицы.

Рисунок 2. Сравнение наблюдаемых и предсказанных значений pKi при тестировании. A. Предсказание для выборки M2 по уравнению, полученному для выборки M1, M3, M4, M5. B. Предсказание для выборки M3 по уравнению, полученному для выборки M1, M2, M3, M5. C. Предсказание для выборки из чётных номеров выборки M1, M2, M3, M4, M5 по уравнению, полученному для нечётных номеров.
D. Предсказание для выборки из нечётных номеров выборки M1, M2, M3, M4, M5 по уравнению, полученному для чётных номеров.

Таким образом, было показано, что внесение априорного знания в процедуру отбора вариантов докирования позволяет в случае ацетилхолиновых мускариновых рецепторов построить общую модель предсказания величины pKi на основе особенностей связывания химического соединения с конкретным рецептором.

СОБЛЮДЕНИЕ ЭТИЧЕСКИХ СТАНДАРТОВ

Настоящая статья не содержит каких-либо исследований с участием людей или с использованием животных в качестве объектов.

ФИНАНСИРОВАНИЕ

Работа выполнена в рамках государственного задания на 2020 год (тема № 0090-2017-0020). Адаптация программного обеспечения под гибридную платформу Power9 в ЦОД ФИЦ ИУ РАН выполнена при поддержке гранта РФФИ № 18-29-03100.

КОНФЛИКТ ИНТЕРЕСОВ

Авторы заявляют об отсутствии конфликта интересов.

ДОПОЛНИТЕЛЬНЫЕ МАТЕРИАЛЫ

К данной статье приложены дополнительные материалы, свободно доступные на сайте журнала (http://dx.doi.org/10.18097/BMCRM00129).

ЛИТЕРАТУРА

  1. Eglen, R. M. (2006). Muscarinic receptor subtypes in neuronal and non-neuronal cholinergic function. Autonomic and Autacoid Pharmacology, 26(3), 219-233. DOI
  2. Langmead, C. J., Watson, J., & Reavill, C. (2008). Muscarinic acetylcholine receptors as CNS drug targets. Pharmacology & therapeutics, 117(2), 232-243. DOI
  3. Freedman, S. B., Dawson, G. R., Iversen, L. L., Baker, R., & Hargreaves, R. J. (1993). The design of novel muscarinic partial agonists that have functional selectivity in pharmacological preparations in vitro and reduced side-effect profile in vivo. Life sciences, 52(5-6), 489-495. DOI
  4. Mikurova, A., Skvortsov, V., & Raevsky, O. (2018). Computational Evaluation of Selectivity of Inhibition of Muscarinic Receptors M1-M4. Biomedical Chemistry: Research and Methods, 1(3), e00072. DOI:10.18097/BMCRM00072>/li>
  5. Berman, H. M., Westbrook, J., Feng, Z., Gilliland, G., Bhat, T. N., Weissig, H., ... & Bourne, P. E. (2000). The protein data bank. Nucleic acids research, 28(1), 235-242. DOI
  6. Vuckovic, Z., Gentry, P. R., Berizzi, A. E., Hirata, K., Varghese, S., Thompson, G., van der Westhuizen, E.T., Burger, W.A.C., Rahmani, R., Valant, C., Langmead, C.J., Lindsley, C.W., Baell, J.B., Tobin, A.B., Sexton, P.M., Christopoulos, A., Thal D.M. (2019). Crystal structure of the M5 muscarinic acetylcholine receptor. Proceedings of the National Academy of Sciences, 116(51), 26001-26007. DOI
  7. Thal, D. M., Sun, B., Feng, D., Nawaratne, V., Leach, K., Felder, C. C., ... & Kobilka, T. S. (2016). Crystal structures of the M1 and M4 muscarinic acetylcholine receptors. Nature, 531(7594), 335. DOI
  8. Haga, K., Kruse, A. C., Asada, H., Yurugi-Kobayashi, T., Shiroishi, M., Zhang, C., ... & Kobayashi, T. (2012). Structure of the human M2 muscarinic acetylcholine receptor bound to an antagonist. Nature, 482(7386), 547. DOI
  9. Kruse, A. C., Hu, J., Pan, A. C., Arlow, D. H., Rosenbaum, D. M., Rosemond, E., ... & Shaw, D. E. (2012). Structure and dynamics of the M3 muscarinic acetylcholine receptor. Nature, 482(7386), 552. DOI
  10. SYBYL-Х 2.1. Certara, Princeton, NJ, USA.
  11. Dei, S., Bellucci, C., Buccioni, M., Ferraroni, M., Guandalini, L., Manetti, D., ... & Romanelli, M. N. (2007). Synthesis, affinity profile, and functional activity of muscarinic antagonists with a 1-methyl-2-(2, 2-alkylaryl-1, 3-oxathiolan-5-yl) pyrrolidine structure. Journal of medicinal chemistry, 50(6), 1409-1413. DOI
  12. Peretto, I., Forlani, R., Fossati, C., Giardina, G. A., Giardini, A., Guala, M., ... & Raveglia, L. F. (2007). Discovery of diaryl imidazolidin-2-one derivatives, a novel class of muscarinic M3 selective antagonists (Part 1). Journal of medicinal chemistry, 50(7), 1571-1583. DOI
  13. Peretto, I., Fossati, C., Giardina, G. A., Giardini, A., Guala, M., La Porta, E., ... & Santoro, E. (2007). Discovery of diaryl imidazolidin-2-one derivatives, a novel class of muscarinic M3 selective antagonists (Part 2). Journal of medicinal chemistry, 50(7), 1693-1697. DOI
  14. Scapecchi, S., Marucci, G., Matucci, R., Angeli, P., Bellucci, C., Buccioni, M., ... & Teodori, E. (2001). Structure–activity relationships in 2, 2-diphenyl-2-ethylthioacetic acid esters: unexpected agonistic activity in a series of muscarinic antagonists. Bioorganic & medicinal chemistry, 9(5), 1165-1174. DOI
  15. Kuntz, I. D., Blaney, J. M., Oatley, S. J., Langridge, R., & Ferrin, T. E. (1982). A geometric approach to macromolecule-ligand interactions. Journal of molecular biology, 161(2), 269-288. DOI
  16. Case, D. A., Cheatham, T. E., Darden, T., Gohlke, H., Luo, R., Merz, K. M., ... & Woods, R. J. (2005). The Amber biomolecular simulation programs. Journal of computational chemistry, 26(16), 1668-1688. DOI
  17. Massova, I., & Kollman, P. A. (2000). Combined molecular mechanical and continuum solvent approach (MM-PBSA/GBSA) to predict ligand binding. Perspectives in drug discovery and design, 18(1), 113-135. DOI
  18. Federal Research Center Computer Science and Control of Russian Academy of Sciences [Electronic resource]: site. - Moscow: FRC CS RAS.- URL: http://hhpcc.frccsc.ru (application date: 03/09/2020)