Порядок расчета молекулярных дескрипторов в программном продукте Dragon
Вычисление топологических, информационных индексов и дескрипторов других классов представляет собой относительно простую задачу ручного счета лишь для малых систем. В тех же случаях когда речь идет о крупных молекулах, содержащих десятки атомов, такой расчет может оказаться трудоемким. К сожалению, авторам известна только одна современная компьютерная программа DRAGON, которая позволяет вычислять более трех тысяч всевозможных дескрипторов 22 классов. Немаловажным ее достоинством является то, что она свободно распространяется [64].
Алгоритм работы с программным продуктом DRAGON заключается в следующем. На первом этапе производится визуализация молекулярной структуры соединений из исследуемого ряда в программе ChemDraw. Затем полученная база данных конвертируется в форматы программы Chem3D [65]. С помощью этой программы производится минимизация энергии каждого вещества методом ММ2. Все обработанные файлы сохраняются в формате MDLMOL (.MOL). Дальнейшая работа ведется в программе DRAGON. В ней выбирается функция CALCULATE DESCRIPTORS, производится поиск нужных файлов и их выделение. Далее производится расчет всех типов дескрипторов. В завершении выполняем следующую функцию сохранения: SAVE DESCRIPTORS. txt. На следующем этапе производится открытие файла «Дескрипторы» с расширением .txt с помощью программы EXСEL. Здесь производится расчет значений корреляции значений дескрипторов с целевой функцией. Далее производятся основные линеаризующие преобразования, представленные в главе 2 с целью поиска характера зависимости между выходными параметрами и дескрипторами. Производится отсеивание неинформативных дескрипторов. Из всех дескрипторов выбираются имеющие наибольшее значение коэффициента линейной корреляции (данное значение определятся исследователями самостоятельно исходя из общего анализа взаимосвязи исследуемых свойств веществ и дескрипторов. Выбранные дескрипторы используются в качестве независимых переменных при построении регрессионных моделей вида
y=k1x1+k2x2+…+knxn
Заключение по первой главе
В настоящее время наиболее полную базу данных по описанию молекулярной структуры молекулы формирует программный комплекс
DRAGON, рассчитывающий дескрипторы 22 классов, которые в дальнейшем могут быть использованы для построения прогностических моделей с любым математическим аппаратом в качестве входных (независимых) переменных.
Дата добавления: 2016-07-09; просмотров: 1159;