Biomedical Chemistry: Research and Methods 2018, 1(3), e00072
К 40-летию Института физиологически активных веществ РАН

СОДЕРЖАНИЕ

ВВЕДЕНИЕ

МАТЕРИАЛЫ И МЕТОДЫ

РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ

БЛАГОДАРНОСТИ

ЛИТЕРАТУРА

Рисунок 1 Внешний вид ацетилхолинового мускаринового рецептора человека M2. Красным выделена структура химерной вставки. Место связывания лиганда (структура лиганда окрашена по типу атомов) расположено на существенном удалении от химерной вставки.

Рисунок 2 Сравнение последовательностей ацетилхолинового мускаринового рецептора крысы и человека. Красным выделены различия в последовательности. Часть последовательности, заменённая в химерном белке, подчеркнута.

Рисунок 3 Предсказание выборки 2 (красный) по модели, обученной на выборке 1 (синий). Рецептор M3.

Рисунок 4 Предсказание для выборок по рецепторам M1, M2 и M4 по модели, обученной на выборке рецептора M3.

Таблица 1 Структуры ацетилхолиновых мускариновых рецепторов, представленные в PDB.

Таблица 2 Антагонисты ацетилхолиновых мускариновых рецепторов.

Таблица 3 Показатели обучения моделей линейной регрессии по отдельным рецепторам.

Таблица 4 Предсказательная способность моделей при кросс-рецепторном предсказании (R2).

Компьютерная оценка селективности ингибирования
мускариновых рецепторов M1-M4

А.В. Микурова1,2*, В.С. Скворцов1,2, О.А. Раевский1

1Институт физиологически активных веществ Российской академии наук 142432 Черноголовка Московской обл., Северный проезд, 1; *e-mail: a.v.mikurova@ibmc.msk.ru
2Научно-исследовательский институт биомедицинской химии имени В. Н. Ореховича, 119121, Москва, Погодинская ул. 10

Ключевые слова: мускариновые ацетилхолиновые рецепторы; ингибиторы; конкурентное ингибирование; докинг; вычислительные методы; молекулярная динамика; QSAR

DOI: 10.18097/BMCRM00072

ВВЕДЕНИЕ

Ацетилхолиновые мускариновые рецепторы представляют собой группу белков, которые вовлечены в самые разные физиологические процессы. Hапример, они принимают участие в регуляции когнитивных процессов; оказывают влияние на работу желез внутренней секреции; управляют работой гладкой мускулатуры; а также контролируют двигательную активность [1]. Причём, разные варианты рецепторов имеют различную локализацию в тканях организма. Таким образом, мускариновые рецепторы являются важными биомишенями, ингибиторы которых рассматриваются как лекарственные средства для лечения целого спектра патологических состояний [2]. В этой связи становится особенно важным фактор селективности связывания того или иного соединения, для минимизации возможных побочных реакций в организме [3].

В настоящее время вычислительные методы широко используются для поиска молекулярных структур, обладающих биологической активностью по отношению к заданным рецепторам. Одним из ключевых направлений в это области является предсказание различных характеристических параметров для молекулы на основании данных молекулярного докинга и молекулярной динамики. Данный подход продемонстрировал высокую эффективность в более ранних работах [4]. Очевидно, что предсказание набора констант ингибирования (Ki) для определенного лиганда относительно максимально полного набора белков как потенциальных мишеней может стать инструментом, который, с одной стороны, может помочь найти высокоселективные структуры как прототипы для будущих лекарственных средств, а с другой - отбросить на ранних стадиях разработки структуры с потенциально широким спектром побочных явлений.

Основной задачей данной работы было создание набора моделей для оценки параметров конкурентного ингибирования относительно метилскополамина произвольного лиганда к набору ацетилхолиновых мускариновых рецепторов M1, M2, M3 и M4. К сожалению, на момент выполнения работы 3D структура рецептора M5 (или гомолога достаточно близкого для успешного моделирования) была неизвестна.

МАТЕРИАЛЫ И МЕТОДЫ

3D cтруктуры рецепторов и подготовка данных

Из 5 ацетилхолиновых мускариновых рецепторов человека три (M1, M2 и M4) имеют известную 3D структуру, доступную в PDB [5,6] (табл. 1).

Закрыть окно
Таблица 1. Cтруктуры ацетилхолиновых мускариновых рецепторов, представленные в PDB.

Кроме того, ещё один рецептор (M3) имеет известную структуру для рецептора крысы [7]. В настоящей работе мы будем рассматривать только эти 4 рецептора. Несмотря на то, что идентичность рецептора M5 в случае сравнения с M1 достигает 60% при минимальном пороге для успешного моделирования по гомологии в 35% [8], модель данного рецептора может вызвать много вопросов. Дело в том, что трёхмерная структура, строго говоря, получена для химерных, а не реальных рецепторов; в таком варианте внемембранная часть заменена на фрагмент другого белка, который, в свою очередь, позволяет сохранить архитектуру мембранной части рецептора [5-7]. В нашем случае при моделировании комплексов рецепторов с ингибиторами это не имеет значения, так как место связывания ингибитора существенно удалено от химерной части, и при моделировании она не влияет на ингибитор (рис. 1).

Рисунок 1. Внешний вид ацетилхолинового мускаринового рецептора человека M2. Красным выделена структура химерной вставки. Место связывания лиганда (структура лиганда окрашена по типу атомов) расположено на существенном удалении от химерной вставки.

Только структура рецепторов M1 и M2 (использован файл 3UON из Protein Data Bank [9]) пригодна для молекулярного моделирования без модификаций структур. В случае рецептора M4 последовательность разрешена не полностью, в зонах петель, соединяющих основные альфа-спирали, имеются разрывы. Они были заделаны простым подбором петель, подходящих по конфигурации, средствами программы SYBYL-X [10]. Аминокислотные остатки, входящие в состав данных петель, также находятся далеко от места связывания, и их восстановление обеспечивает восстановление целостности структуры, что является необходимым условием для проведения молекулярной динамики, которая играет большую роль в нашей работе. Структура рецептора M3 (файл 4DAJ) была подвергнута виртуальному мутагенезу с целью восстановить на её основе последовательность (и структуру) рецептора человека. Следует отметить, что реальных аминокислотных замен меняющих, например, заряд или локальную гидрофобность (рис. 2), не так уж много, к тому же существенная их часть локализуется в зоне, заменённой на химерную часть, которая, естественно не модифицировалась.

Рисунок 2. Сравнение последовательностей ацетилхолинового мускаринового рецептора крысы и человека. Красным выделены различия в последовательности. Часть последовательности, заменённая в химерном белке, подчеркнута.

Так как все имеющиеся структуры представляют из себя комплексы с известными ингибиторами, то подготовка включала в себя простую минимизацию в поле сил TRIPOS [10] для расчёта электростатических взаимодействий для рецептора. Для низкомолекулярных ингибиторов использовалась схема частичных зарядов из мерковского поля сил [11].

Данные по ингибиторам с известными значениями Ki.

В настоящей работе используются 2 набора данных (табл. 2), отличительной особенностью которых является то, что значения Ki как минимум в 2/3 выборки доступны для всей линейки ацетилхолиновых мускариновых рецепторов человека.

Закрыть окно
Таблица 2. Антагонисты ацетилхолиновых мускариновых рецепторов.

Кроме того, обе выборки были получены на одном и том же наборе клеточных линий, и величина Ki оценивалась одним методом [12] по конкуренции с меченым метилскополамином. Выборка 1 [13] представляет собой коллекцию данных из различных источников, однако, оценка Ki, насколько можно судить по анализу источников, проводилась единообразно. Её достоинством также является относительно широкий диапазон данных - более 4-х логарифмических единиц. К сожалению, основной недостаток выборки 2 [14] – узкий диапазон значений Ki (меньше 2-х логарифмических единиц). В то же время, данные для второй выборки были получены одной группой в ходе выполнения единого проекта. Общим недостатком выборок являются их небольшие размеры.

Процедура моделирования комплексов и расчёта параметров для создания предсказательных моделей.

Комплексы ингибиторов с рецепторами моделировались по единой схеме:

  1. Докирование программой Dock 6.4 [15] с использованием встроенной оценочной функции и отбором 3 лучших вариантов после кластеризации результатов (RMS = 2.0 Å).
  2. Каждый из 3-х полученных вариантов оптимизировался при помощи программы Amber16 [16] многостадийной процедурой:

    a. формирование бокса водного окружения (модель воды TIP3);

    b. оптимизация свободной энергии комплекса минимизацией в поле сил «Amber 02» до 1000 итераций в периодически граничных условиях;

    c. симуляция молекулярной динамики с последовательным разогревом системы (100 пс, с шагом в 2 фс), выравниванием давления (100 пс), уравновешивания системы (0.5 нс), симуляция продуктивной динамики (1 нс).

  3. На последнем этапе молекулярной динамики на основании полученной траектории модулем MMPBSA были рассчитаны параметры для 25 последовательных состояний с использованием методов MMPBSAили MMGBSA, включая расчёт энтропийных вкладов.
  4. Параметры, рассчитанные модулем MMPBSA, были использованы в качестве независимых переменных для создания уравнений предсказывающих pKi= -log(Ki). Сольватационную составляющую вычисляли как методом Poisson-Boltzmann (PB), так и методом Generalized Born (GB) [17]. При этом в уравнениях использовали оба набора данных (по 4 компонента из каждого метода). Оба варианта дополняют друг друга и, в среднем, часто дают лучший результат. В работе использованы: молекулярный вес, изменение величины электростатического взаимодействия (ELE); величины ван-дер-ваальсовых взаимодействий (VDW); рассчитанные модулем NMODE [17] значения трансляционного(TSTRA), ротационного (TSROT) и колебательного (TSVIB) энтропийных вкладов. При этом последний параметр в силу своей вариативности оказался бесполезен. Возможно, это связано с недостаточной продолжительностью вычислений, установленных в модуле MMPBSA по умолчанию. Однако, увеличивать продолжительность вычислений в данном случае сильно затратно по времени. Расчёт этого параметра занимает более половины всего вычислительного времени для каждого конкретного комплекса.

Для построения предсказательных моделей использовались простые уравнения линейной регрессии. Так как в результате для таких уравнений было использовано 9 независимых переменных, то малые размеры выборок были серьёзным препятствием. Эту проблему преодолели, используя в качестве наблюдений все 25 состояний для любого из ингибиторов, полученных при динамике. Каждому из этих 25 состояний соответствовало одно и то же значение pKi.

Для выполнения расчетов был использован гибридный высокопроизводительный вычислительный комплекс ФИЦ ИУ РАН [18] IBM Minsky (2xPower8, 4хTesla P100). Так как часть вычислений не могла быть выполнена на GPU, был написан набор макросов для балансировки нагрузки сервера. Среднее время расчётов на 1 комплекс составило 46 мин для вычислений на GPU и 4 ч на CPU.

РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ

Основной проблемой при анализе результатов докирования стала проблема выбора «правильного» комплекса. Достоверного на 100% способа отбора не существует, к тому же, в ряде случаев процедура докирования вообще не нашла решения (табл. 2). Выбор по оценочной функции докинга или последующей оценке энергетических параметров, полученных методом MMPBSA, в данном случае не помогает из-за больших размеров белка, плотной упаковки в районе места связывания и имеющихся полостей по соседству. Единственный возможный путь в данном случае – применить отбор вариантов по подобию: имеется группа похожих по структуре лигандов из одного химического ряда, следовательно, структуры их комплексов должны быть относительно похожи. Учитывая, что в нашем случае структура комплекса подвергается длительной процедуре оптимизации, нас, в основном, интересовало, чтобы положение молекулы, полученное в результате докирования, занимало соответствующее место, а молекулы в пределах одного гомологичного ряда располагали общую часть относительно похоже, в надежде на то, что оптимизация потом «дотянет» лиганд до нужной конформации. В результате (табл. 3) были отброшены ещё несколько вариантов.

В таблице 3 приведены параметры построенных корреляционных уравнений.

Закрыть окно
Таблица 3. Показатели обучения моделей линейной регрессии по отдельным рецепторам.

Уравнения «обучались» на наборе из 25 состояний для каждой из молекул выборки (общий вариант). Таким образом, даже при самом минимальном наборе молекул в выборке формально число наблюдений многократно превышало число независимых переменных (9). В тоже время, как при оценке качества обучения, так и при использовании тестовых выборок для каждой молекулы получали набор из 25 предсказаний, на основе которых вычисляли среднее значение. Предсказательную силу моделей оценивали путём перекрёстного предсказания между выборками 1 и 2. Сравнение зон предсказания (на рис. 3 для рецептора М3) показывает правильность сделанного предсказания. Та же картина характерна для всех рецепторов.

Рисунок 3. Предсказание выборки 2 (красный) по модели, обученной на выборке 1 (синий). Рецептор M3.

Было проведено также сравнение предсказательной силы уравнений при кроcс-рецепторном предсказании (табл. 4).

Закрыть окно
Таблица 4. Предсказательная способность моделей при кросс-рецепторном предсказании (R2).

Однако удовлетворительного результата получено не было. Несмотря на то, что даже в этом случае можно различить слабые и сильные ингибиторы (рис. 4), достоверность таких предсказаний невысока.

Рисунок 4. Предсказание для выборок по рецепторам M1, M2 и M4 по модели, обученной на выборке рецептора M3.

Создание же объединённой выборки даже при использовании индикаторных переменных, характеризующих к какому рецептору относятся данные, не даёт при обучении удовлетворительного результата.

Тем не менее, использование данных уравнений, рассчитанных для каждого из рецепторов, позволяет при некоторых априорных ограничениях предсказать pKi со средней точностью 0.65 логарифмической единицы. И таким образом возможно построить профиль действия любого соединения на ацетилхолиновые мускариновые рецепторы человека. При наличии же предполагаемого профиля действия становится возможным более эффективное планирование экспериментов по тестированию новых соединений и выявлению возможных побочных явлений на ранней стадии разработки лекарственных средств.

БЛАГОДАРНОСТИ

Работа выполнена в рамках государственного задания на 2018 год (тема № 0090-2017-0020). Подготовка   и   отладка   программного   обеспечения    выполнялась при    поддержке    гранта    РФФИ № 18-29-03100.

ЛИТЕРАТУРА

  1. Eglen, R. M. (2006). Muscarinic receptor subtypes in neuronal and non?neuronal cholinergic function. Autonomic and Autacoid Pharmacology, 26(3), 219-233. DOI
  2. Langmead, C. J., Watson, J., & Reavill, C. (2008). Muscarinic acetylcholine receptors as CNS drug targets. Pharmacology & therapeutics, 117(2), 232-243. DOI
  3. Freedman, S. B., Dawson, G. R., Iversen, L. L., Baker, R., & Hargreaves, R. J. (1993). The design of novel muscarinic partial agonists that have functional selectivity in pharmacological preparations in vitro and reduced side-effect profile in vivo. Life sciences, 52(5-6), 489-495. DOI
  4. Mikurova, A. V., Rybina, A. V., & Skvortsov, V. S. (2016). Prediction of selective inhibition of neuraminidase from various influenza virus strains by potential inhibitors. Biomeditsinskaya khimiya, 62(6), 691-703. DOI
  5. Thal, D. M., Sun, B., Feng, D., Nawaratne, V., Leach, K., Felder, C. C., ... & Kobilka, T. S. (2016). Crystal structures of the M1 and M4 muscarinic acetylcholine receptors. Nature, 531(7594), 335.
  6. Haga, K., Kruse, A. C., Asada, H., Yurugi-Kobayashi, T., Shiroishi, M., Zhang, C., ... & Kobayashi, T. (2012). Structure of the human M2 muscarinic acetylcholine receptor bound to an antagonist. Nature, 482(7386), 547.
  7. Kruse, A. C., Hu, J., Pan, A. C., Arlow, D. H., Rosenbaum, D. M., Rosemond, E., ... & Shaw, D. E. (2012). Structure and dynamics of the M3 muscarinic acetylcholine receptor. Nature, 482(7386), 552.
  8. Blundell, T., Carney, D., Gardner, S., Hayes, F., Howlin, B., Hubbard, T., ... & Sutcliffe, M. (1988). Knowledge?based protein modelling and design. European Journal of Biochemistry, 172(3), 513-520. DOI
  9. Berman, H. M., Westbrook, J., Feng, Z., Gilliland, G., Bhat, T. N., Weissig, H., ... & Bourne, P. E. (2000). The protein data bank. Nucleic acids research, 28(1), 235-242. DOI
  10. SYBYL-X 2.1. Certara, Princeton, NJ, USA.
  11. Halgren, T. A. (1996). Merck molecular force field. II. MMFF94 van der Waals and electrostatic parameters for intermolecular interactions. Journal of Computational Chemistry, 17(5/6), 520-552. DOI
  12. Scapecchi, S., Marucci, G., Matucci, R., Angeli, P., Bellucci, C., Buccioni, M., ... & Teodori, E. (2001). Structure–activity relationships in 2, 2-diphenyl-2-ethylthioacetic acid esters: unexpected agonistic activity in a series of muscarinic antagonists. Bioorganic & medicinal chemistry, 9(5), 1165-1174. DOI
  13. Alexander, S. P., Christopoulos, A., Davenport, A. P., Kelly, E., Marrion, N. V., Peters, J. A., ... & Southan, C. (2017). The Concise Guide to PHARMACOLOGY 2017/18: G protein-coupled receptors. British journal of pharmacology, 174(S1). DOI
  14. Dei, S., Bellucci, C., Buccioni, M., Ferraroni, M., Guandalini, L., Manetti, D., ... & Romanelli, M. N. (2007). Synthesis, affinity profile, and functional activity of muscarinic antagonists with a 1-methyl-2-(2, 2-alkylaryl-1, 3-oxathiolan-5-yl) pyrrolidine structure. Journal of medicinal chemistry, 50(6), 1409-1413. DOI
  15. Kuntz, I. D., Blaney, J. M., Oatley, S. J., Langridge, R., & Ferrin, T. E. (1982). A geometric approach to macromolecule-ligand interactions. Journal of molecular biology, 161(2), 269-288. DOI
  16. Case, D. A., Cheatham, T. E., Darden, T., Gohlke, H., Luo, R., Merz, K. M., ... & Woods, R. J. (2005). The Amber biomolecular simulation programs. Journal of computational chemistry, 26(16), 1668-1688. DOI
  17. Massova, I., & Kollman, P. A. (2000). Combined molecular mechanical and continuum solvent approach (MM-PBSA/GBSA) to predict ligand binding. Perspectives in drug discovery and design, 18(1), 113-135. DOI
  18. Federal Research Center Computer Science and Control of Russian Academy of Sciences [Electronic resource]: site. - Moscow: FRC CS RAS.- URL: http://hhpcc.frccsc.ru (application date: 09/12/2018)