AutoDock | |
---|---|
Тип | Молекулярное моделирование |
Разработчик | Scripps Research Institute[en] |
Написана на | C / C++ |
Операционная система | Windows, macOS, Linux, Solaris |
Последняя версия | 4.2.6 (2012-08-04) |
Состояние | активное |
Лицензия | GPL2+ (AutoDock 4) / ASL 2.0 (AutoDock Vina) |
Сайт | autodock.scripps.edu |
AutoDock — пакет программ предназначенный для автоматизированного молекулярного докинга. В основном применяется для белок-лигандного докинга, в том числе, с учётом подвижных остатков белка, Autodock также используется для «слепого докинга», когда активный сайт белка не известен.
AutoDock — один из пакетов программ позволяющих предсказывать связывание маленьких молекул с белками известной структуры. Настоящие дистрибутивы AutoDock включают в себя два поколения ПО: AutoDock 4 и AutoDock Vina. Является свободным программным обеспечением, последняя 4-я версия которого распространяется в соответствии с открытым лицензионным соглашением GNU General Public License, AutoDock Vina доступна под Apache license.
На данный момент используется примерно 29000 пользователями по всему миру. В 2006 г. была наиболее цитируемой программой докинга, в январе 2011 г. индекс цитирования ISI Citation Index указал на более чем 2700 опубликованных работ, в которых были предоставлены ссылки на первичные источники AutoDock.
AutoDock поддерживается и разрабатывается лабораториями The Scripps Research Institute и Olson Laboratory.
Создан в 1990 году. Первая версия базируется на силовом поле Amber. Скоринг функция является суммой потенциала Леннарда-Джонса, энергии водородных связей, электростатических взаимодействий. Начиная с самой первой версии, Autodock представляет собой совокупность 2х программ: Autodock — собственно программа, проводящая докинг и Autogrid — программа, позволяющая рассчитывать сетки потенциалов. Для каждой макромолекулы (рецептора) достаточно рассчитать сетки потенциалов для каждого типа атомов один раз, что позволяет запускать расчеты для любого лиганда, состоящего из этих атомов. В реализации доступны алгоритмы монте карло и метод имитации отжига[1].
Появилось много улучшений, сопутствующих программ для параллельных запусков. Новый алгоритм для улучшения поиска, в случае лигандов с большим количеством степеней свободы, основан на принципе разделяй и властвуй. Улучшен алгоритм локальной оптимизации[2].
Для оптимизации поиска впервые был применен комбинированный генетический алгоритм LGA[3]. Новая скоринг функция, калибрующаяся на 30 белок-лигандных комплексах[4].
AutoDock 4 представляет собой совокупность 2х программ: Autogrid — производит расчет потенциала поля сил в узлах сетки вокруг белка для каждого типа атома. Autodock подбирает наиболее энергетически выгодное расположение лиганда в узлах сетки[5].
Добавлен учёт возможной подвижности боковых цепей. Это достигнуто за счет разделения белка в два файла. Одна часть считается статичной, другая подвижной. Со статической частью работают с помощью подсчета энергии AutoGrid, с подвижной работают теми же методами, что и с лигандом.
Созданы новые типы атомов, например, галогены и основные ионы металлов.
Улучшена скоринг функция. Калибровка на 250 структурах из PDBBind. Появился autodocktols[6] — специальное программное обеспечение, для подготовки файлов к докингу[7].
В добавок ко всему прочему, сетка потенциалов может быть визуализирована, что, например, может помочь химикам-синтетикам в поиске наиболее крепко связывающегося лиганда.
Добавлена более прозрачная опция контроля вывода программы, позволяющая делать небольшой вывод для скрининга, и выводить отчет для более глубокого анализа.
Некоторые ошибки при исполнении программы, выводившие предупреждение в предыдущих версиях, теперь останавливают программу. Это сделано в ответ на нужды скрининга, при котором пользователь может не заметить появляющихся предупреждений.
Учёт электростатических взаимодействий между не связанными атомами в лиганде теперь по умолчанию включено. Также включение/отключение возможно при помощи команды intelec on/off[8].
Существует ассоциированный с Autodock графический интерфейс AutoDockTools (ADT), который помогает анализировать докинг и выбирать связи в лиганде, которые будут считаться подвижными.
ADT позволяет:
— Видеть и вращать молекулы в формате 3D,
— Добавлять молекулы водорода, как полярные, так и не полярные,
— Ассоциировать частичные заряды атомов с лигандами и макро молекулами,
— Обозначать подвижные связи в лиганде, с использованием графической версии AutoTors,
— Настраивать DPF, GPF файлы,
— Запускать AutoGrid и AutoDock,
— Выводить и визуализировать результат работы AutoDock
и многое другое…[9]
AutoDock Vina является новым поколением ПО, разработанным Molecular Graphics Lab. Показывает значительные улучшения средних показателей accuracy-метрики в предсказании сайтов связывания, так же заметно увеличение скорости работы в два раза, по сравнению с AutoDock 4.1. Принципиально новая скоринг функция, основанная на алгоритме X-Score[10], которая разработана с учётом развития мультипроцессорных систем[11].
За счет различий в погрешностях и самих используемых функций скоринга, используемых в AutoDock 4 и AutoDock Vina, программы могут показывать различные результаты на одних данных.
AutoDock Vina не требует выбора типов атома и предварительного расчёта сеток потенциалов, сетки создаются только для тех типов атомов, что присутствуют в лиганде.
Модель физических взаимодействий, использующаяся для предсказания энергии взаимодействия молекул, считает эту энергию суммой энергий взаимодействий между всеми парами неделимых элементов. За неделимые элементы взяты атомы, каждый из которых описывается своими координатами и типом. Остальные же характеристики рассчитываются в соответствии с его окружением[8].
Оценка энергии упрощена за счет рассмотрения так называемого поля сил вокруг белка, которое для каждой точки пространства определяет силу взаимодействия белка с помещенным в эту точку атомом. Причем, для каждого типа атома создается отдельное поле.
Полуэмпирическая формула свободной энергии поля сил, с помощью которой AutoDock оценивает энергию взаимодействия атомов, содержит как слагаемые, отвечающие молекулярно-механическим взаимодействиям, так и эмпирические слагаемые, оценивающие взаимодействие с водой. Это отличается от традиционного молекулярно-механического поля сил, которое также основывается на попарных взаимодействиях, но обычно явно использует молекулы воды, чтобы оценить вклад сольватации. Предназначением эмпирической свободной энергии является учёт сложных вкладов энтальпии и энтропии в энергию, с помощью ограниченного числа легко подсчитываемых слагаемых[8].
Свободная энергия взаимодействия полагается равной разнице между суммой энергий лиганда и белка в разделенном не связанном состоянии, и энергии комплекса лиганд-белок.
Подсчет энергии комплекса разбит на две стадии:
Формула свободной энергии поля сил включает 6 слагаемых, отвечающих всевозможным попарным взаимодействиям и оценке потери конформационной энтропии при связывании:
В данном равенстве, L соответствует лиганду, а P обозначает белок в комплексе лиганд-белок. Однако, данный метод работает для любых типов молекул в комплексе.
Первые два члена являются оценкой внутримолекуляной энергии лиганда в связанной и не связанной с белком конформациях; следующие два члена являются оценкой изменения внутримолекулярной энергии белка. Изменение межмолекулярной энергии находится в третьей скобке.
Парные слагаемые содержат оценку Ван-дер-Ваальсовых сил притяжения/отталкивания, водородные связи, электростатику и десольватацию:
Взвешивающие коэффициенты W подобраны так, чтобы минимизировать различие оценки энергии связывания с экспериментальными данными.
Первый член — типичный 6/12 потенциал для Ван-дер-Ваальсовых сил притяжения/отталкивания. Параметры A и B взяты из поля сил AMBER. Второй член отвечает направленным водородным связям, основным на 10/12 потенциале.
Параметры C и D взяты такие, что минимум энергии в −5ккал/моль достигается на расстоянии 1.9 Å для O-H и N-H, и минимум в −1 ккал/моль достигается при расстоянии 2.5 Å для S-H. Направленность взаимодействия водородной связи E(t) зависит от угла t отклонения от идеальной геометрии связывания. Направленность далее улучшена ограничением количества водородных связей, доступных для каждой точки сетки, числом водородных связей, что могут быть сформированы.
Электростатические взаимодействия оценены экранированым Кулоновским потенциалом, таким же, что использовался в AutoDock 3.
Последний член отвечает за потенциал энергии сольватации, зависящий от объёма атомов, окружающих данный атом, взвешенное сольватационным параметром (S) и экспоненциальным выражением, зависящим от расстояния. Взвешивающий фактор расстояния принят равным σ = 3.5 Å[12].
Файлы с расширением .pdb являются основным форматом хранения информации о конформации и строении молекул. Такие файлы получают из экспериментальных данных полученных рентгеновской кристаллографией или ЯМР-спектроскопией, либо методами предсказания структуры молекул. Самым крупным банком данных 3-D структур в формате .pdb является protein data bank.
Начиная с версии AutoDock 4 процедура докинга требует два файла в формате .pdbqt; один для рецептора, другой для лиганда. Преобразование файлов .pdb в формат .pdbqt возможно с помощью программы AutoDock Tools[9].
Файлы pdbqt содержат следующую информацию:
Если в белке необходимо учитывать подвижность некоторых аминокислот, то создается третий файл, содержащий информацию об атомах в подвижных частях белка.
Докинг с использованием AutoDock 4 разбивается на 5 этапов:
Докинг проводится в кубическую область внутри рецептора (docking box).
С помощью AutoGrid для рецептора создается набор бинарных файлов — сеток потенциалов. Они описывают для каждого атома, входящего в docking box, его потенциал взаимодействия с пробным атомом определённого химического элемента. Сколько нужно элементов определяется химическим составом лигандов, с которыми требуется провести докинг. На каждый вид химического элемента создается по 1-2 файла[12].
AutoDock, используя эти файлы, проводит докинг. Лиганд, помимо совокупности атомов, связей и зарядов, внутри autodock описывается набором чисел — положением в docking box, поворотом всех активных торсионных углов. Autodock оптимальным образом перебирает все возможные комбинации этих чисел, чтобы в итоге найти самое оптимальное с точки зрения энергии взаимодействия с рецептором положение лиганда в docking box. Поэтому в качестве docking box обычно выбирают куб со стороной 10-30 ангстрем таким образом, чтобы он включал в себя активный центр рецептора.
Полный перебор всех возможных положений в активном центре и всех конформаций лиганда — очень время- и ресурсо-затратная задача. Для этого в Autodock применяются алгоритмы поиска глобального минимума: монте карло, имитации отжига, генетические алгоритмы: LGA.
Пример работы Autodock 4.2:
В результате работы Autodock для одного лиганда получается dlg файл. В нём записан подробный отчет о работе программы. Он содержит в себе результаты каждого конкретного запуска с конечным положением лиганда (структура лиганда записана в формате pdbqt), определённой энергией затраченным на расчет временем:
BEGINNING LAMARCKIAN GENETIC ALGORITHM DOCKING
Run: 198 / 200
Date: Sun Apr 27 18:19:56 2008
Output level is set to 1.
Creating an initial population of 500 individuals.
Assigning a random translation and a random orientation to each of the 500 individuals.
Beginning Lamarckian Genetic Algorithm (LGA), with a maximum of 10000000
energy evaluations.
Generation: 100 Oldest's energy: -3.254 Lowest energy: -3.254 Num.evals.: 465685 Timing: Real= 0.01s, CPU= 0.01s, System= 0.00s
Generation: 200 Oldest's energy: -3.258 Lowest energy: -3.258 Num.evals.: 930783 Timing: Real= 0.01s, CPU= 0.01s, System= 0.00s
Generation: 300 Oldest's energy: -3.258 Lowest energy: -3.258 Num.evals.: 1395938 Timing: Real= 0.01s, CPU= 0.00s, System= 0.00s
Generation: 400 Oldest's energy: -3.289 Lowest energy: -3.289 Num.evals.: 1841909 Timing: Real= 0.01s, CPU= 0.01s, System= 0.00s
Generation: 500 Oldest's energy: -3.307 Lowest energy: -3.307 Num.evals.: 2293760 Timing: Real= 0.00s, CPU= 0.01s, System= 0.00s
Generation: 600 Oldest's energy: -3.307 Lowest energy: -3.307 Num.evals.: 2751641 Timing: Real= 0.01s, CPU= 0.01s, System= 0.00s
Generation: 700 Oldest's energy: -3.308 Lowest energy: -3.308 Num.evals.: 3198004 Timing: Real= 0.01s, CPU= 0.01s, System= 0.00s
Generation: 800 Oldest's energy: 207607.188 Lowest energy: -3.313 Num.evals.: 3653584 Timing: Real= 0.01s, CPU= 0.01s, System= 0.00s
Generation: 900 Oldest's energy: -3.314 Lowest energy: -3.314 Num.evals.: 4113757 Timing: Real= 0.01s, CPU= 0.01s, System= 0.00s
Generation: 1000 Oldest's energy: -3.314 Lowest energy: -3.314 Num.evals.: 4574886 Timing: Real= 0.00s, CPU= 0.01s, System= 0.00s
Generation: 1100 Oldest's energy: -3.314 Lowest energy: -3.314 Num.evals.: 5037904 Timing: Real= 0.01s, CPU= 0.01s, System= 0.00s
Generation: 1200 Oldest's energy: -3.314 Lowest energy: -3.314 Num.evals.: 5483971 Timing: Real= 0.01s, CPU= 0.01s, System= 0.00s
Generation: 1300 Oldest's energy: -3.314 Lowest energy: -3.314 Num.evals.: 5939687 Timing: Real= 0.01s, CPU= 0.00s, System= 0.00s
Generation: 1400 Oldest's energy: -3.314 Lowest energy: -3.314 Num.evals.: 6398825 Timing: Real= 0.01s, CPU= 0.00s, System= 0.00s
Generation: 1500 Oldest's energy: -3.314 Lowest energy: -3.314 Num.evals.: 6850116 Timing: Real= 0.00s, CPU= 0.01s, System= 0.00s
Generation: 1600 Oldest's energy: -3.314 Lowest energy: -3.314 Num.evals.: 7296265 Timing: Real= 0.01s, CPU= 0.01s, System= 0.00s
Generation: 1700 Oldest's energy: -3.314 Lowest energy: -3.314 Num.evals.: 7747442 Timing: Real= 0.01s, CPU= 0.01s, System= 0.00s
Generation: 1800 Oldest's energy: -3.314 Lowest energy: -3.314 Num.evals.: 8189692 Timing: Real= 0.01s, CPU= 0.01s, System= 0.00s
Generation: 1900 Oldest's energy: -3.314 Lowest energy: -3.314 Num.evals.: 8646513 Timing: Real= 0.01s, CPU= 0.01s, System= 0.00s
Generation: 2000 Oldest's energy: -3.314 Lowest energy: -3.314 Num.evals.: 9097712 Timing: Real= 0.02s, CPU= 0.01s, System= 0.00s
Generation: 2100 Oldest's energy: -3.314 Lowest energy: -3.314 Num.evals.: 9559184 Timing: Real= 0.00s, CPU= 0.01s, System= 0.00s
Final-Value: -3.315
Run completed; time taken for this run:
Real= 1m 01.77s, CPU= 1m 01.76s, System= 0.00s
6:20 58" p.m., 04/27/2008
Total number of Energy Evaluations: 10003206
Total number of Generations: 2196
FINAL LAMARCKIAN GENETIC ALGORITHM DOCKED STATE
_______________________________________________
State: 7.500 9.610 -6.446 -0.058 0.619 0.784 157.287
DOCKED: MODEL 198
DOCKED: USER Run = 198
DOCKED: USER DPF = fucose.2OBS_v4.dpf
DOCKED: USER
DOCKED: USER Estimated Free Energy of Binding = -3.31 kcal/mol [=(1)+(2)+(3)-(4)]
DOCKED: USER Estimated Inhibition Constant, Ki = 3.72 mM (millimolar) [Temperature = 298.15 K]
DOCKED: USER
DOCKED: USER (1) Final Intermolecular Energy = -3.31 kcal/mol
DOCKED: USER vdW + Hbond + desolv Energy = -3.32 kcal/mol
DOCKED: USER Electrostatic Energy = +0.01 kcal/mol
DOCKED: USER (2) Final Total Internal Energy = +0.00 kcal/mol
DOCKED: USER (3) Torsional Free Energy = +0.00 kcal/mol
DOCKED: USER (4) Unbound System's Energy = +0.00 kcal/mol
DOCKED: USER
DOCKED: USER
DOCKED: USER NEWDPF move fucose.pdbqt
DOCKED: USER NEWDPF about 16.516399 11.864500 -8.193000
DOCKED: USER NEWDPF tran0 7.500210 9.609984 -6.445766
DOCKED: USER NEWDPF quaternion0 -0.057288 0.606502 0.768178 0.196913
DOCKED: USER NEWDPF axisangle0 -0.058432 0.618614 0.783519 157.286960
DOCKED: USER NEWDPF quat0 -0.058432 0.618614 0.783519 157.286960 # deprecated
DOCKED: USER
DOCKED: REMARK 0 active torsions:
DOCKED: REMARK status: ('A' for Active; 'I' for Inactive)
DOCKED: USER x y z vdW Elec q Type
DOCKED: USER _______ _______ _______ _____ _____ ______ ____
DOCKED: ROOT
DOCKED: ATOM 1 C1 FUC B 1 6.967 9.452 -7.966 -0.10 -0.00 +0.303 C
DOCKED: ATOM 2 C2 FUC B 1 6.884 10.670 -6.981 -0.18 -0.01 +0.244 C
DOCKED: ATOM 3 C3 FUC B 1 6.889 10.171 -5.507 -0.35 +0.01 +0.220 C
DOCKED: ATOM 4 C4 FUC B 1 8.190 9.395 -5.257 -0.28 +0.01 +0.212 C
DOCKED: ATOM 5 C5 FUC B 1 8.281 8.227 -6.264 -0.29 -0.00 +0.151 C
DOCKED: ATOM 6 C6 FUC B 1 9.594 7.454 -6.112 -0.37 -0.00 +0.035 C
DOCKED: ATOM 7 O1 FUC B 1 5.693 8.669 -7.961 -0.04 +0.01 -0.187 OA
DOCKED: ATOM 8 O2 FUC B 1 5.714 11.421 -7.235 -0.14 +0.04 -0.215 OA
DOCKED: ATOM 9 O3 FUC B 1 6.809 11.260 -4.595 -0.61 -0.04 -0.218 OA
DOCKED: ATOM 10 O4 FUC B 1 9.308 10.266 -5.403 -0.81 +0.00 -0.218 OA
DOCKED: ATOM 11 O5 FUC B 1 8.173 8.726 -7.623 -0.14 -0.00 -0.327 OA
DOCKED: ENDROOT
DOCKED: TORSDOF 0
DOCKED: TER
DOCKED: ENDMDL
________________________________________________________________________________
Результаты определённой энергии доступны в виде совокупности слагаемых скоринг функции, а также конечной энергии взаимодействия ΔG ккал/моль, а также константы ингибирования Ki.
DOCKED: USER Estimated Free Energy of Binding = -11.16 kcal/mol [=(1)+(2)+(3)-(4)]
DOCKED: USER Estimated Inhibition Constant, Ki = 6.64 nM (nanomolar) [Temperature = 298.15 K]
DOCKED: USER
DOCKED: USER (1) Final Intermolecular Energy = -15.00 kcal/mol
DOCKED: USER vdW + Hbond + desolv Energy = -14.46 kcal/mol
DOCKED: USER Electrostatic Energy = -0.53 kcal/mol
DOCKED: USER (2) Final Total Internal Energy = -1.18 kcal/mol
DOCKED: USER (3) Torsional Free Energy = +3.84 kcal/mol
DOCKED: USER (4) Unbound System's Energy = -1.18 kcal/mol
После этого показан результат кластеризации, и далее отдельно вынесен результат для каждого кластера показана населенность (Num in cluster), лучшая энергия (Lowest binding energy), к какому конкретно запуску она относится (Run):
CLUSTERING HISTOGRAM
____________________
________________________________________________________________________________
| | | | |
Clus | Lowest | Run | Mean | Num | Histogram
-ter | Binding | | Binding | in |
Rank | Energy | | Energy | Clus| 5 10 15 20 25 30 35
_____|___________|_____|___________|_____|____:____|____:____|____:____|____:___
1 | -3.44 | 150 | -3.44 | 2 |##
2 | -3.42 | 63 | -3.41 | 42 |#x42
3 | -3.42 | 187 | -3.40 | 83 |#x83
4 | -3.38 | 115 | -3.36 | 33 |#x33
5 | -3.32 | 128 | -3.31 | 37 |#x37
6 | -3.28 | 122 | -3.27 | 3 |###
_____|___________|_____|___________|_____|______________________________________
Собственно результатами являются энергия ΔG и положение лиганда в активном центре рецептора.
Разница энергий лигандов в первом приближении показывает, насколько один лиганд лучше связывается рецептором, чем другой. Положение лиганда в активном центре позволяет предсказывать механизм связывания[14].
AutoDock находит применение в следующих областях:
— Дизайн лекарств,
— Белок-белковый докинг,
— Исследования химических процессов.
Autodock широко применяется в научном сообществе как программа для молекулярного докинга, так и для виртуального скрининга больших библиотек соединений (например ZINC)[15].
С его помощью нашли ингибиторы ВИЧ протеазы[16].
Autodock (в основном Vina) широко применяется в большом числе автоматических систем виртуального скрининга[17][18][19].
World Community Grid предлагает свою помощь в получении бесплатной вычислительной мощности для ускорения исследований, проводимых на основе AutoDock.
AutoDock запущен в работу на основе World Community Grid со следующими проектами:
— FightAIDS@Home от The Scripps Research Institute[20],
— Discover Dengue Drugs — Together от The University of Texas Medical Branch[21],
— Help Fight Childhood Cancer[22],
— Influenza Antiviral Drug Search[23],
— GO Fight Against Malaria[24].
ADAM, CIM, DARWIN, DIVALI, DOCK, DockVision, EUDOC, FlexX, FLOG, FTDOCK, GOLD, Hammerhead, LOGON, LUDI, MCDOCK, Produce, PRO LEADS, QXP, SZNDOCK, Soft Docking[25]
Данная страница на сайте WikiSort.ru содержит текст со страницы сайта "Википедия".
Если Вы хотите её отредактировать, то можете сделать это на странице редактирования в Википедии.
Если сделанные Вами правки не будут кем-нибудь удалены, то через несколько дней они появятся на сайте WikiSort.ru .