Появление качественно новых экспериментальных технологий в таких областях современной биологии, как геномика, транскриптомика, протеомика, клеточная биология, нанобиоинженерия и др. привело к экспоненциальному росту объемов экспериментальных данных, требующих систематизации и осмысления. Новые методы интеллектуального анализа данных призваны решить задачу интеграции первичных экспериментальных данных, которые слабо связаны, плохо структурированы, имеют разную степень полноты и сами по себе не позволяют реконструировать полноценный портрет изучаемой биологической системы или процесса. Одной из таких сложных и не решенных задач является задача выявления закономерностей организации регуляторных районов генов. Для решения этой задачи нами разработан интегрированный метод извлечения знаний ExpertDiscovery, обнаруживающий комплексные закономерности организации регуляторных районов генов эукариот. В качестве элементарных сигналов для построения комплексных сигналов система использует различные характеристики, обнаруженные, например, другими методами извлечения знаний. Объединяя закономерности, обнаруженные на всех уровнях исследования, система ExpertDiscovery позволяет построить иерархическую модель регуляторных районов специфической группы генов.
The appearance of advanced experimental technologies in such fields of modern biology as genomics, transcriptomics, proteomics, cell biology, nanobioengineering, est. resulted in exponential growth of experimental data, that need to be analyzed and mined. The new methods of intelligent data analysis are challenged to solve the task of integration of primary raw experimental data, that are poorly consistent and structured, contain gaps, and separately can’t reconstruct completely the biologic system or process. We developed the integrated data mining method ExpertDiscovery, discovering the complex regularities of eukaryotic DNA regulatory regions organization. As the elementary signals to build the complex signals the system takes the different DNA characteristics, obtained, for instance, by another data mining tools. Using the regularities, discovered on the levels of research, the system allows to construct the hierarchical model of regulatory regions of specific group of genes.