Симметричные структуры в нуклеотидных последовательностях сайтов инициации репликации ДНК прокариот тема диссертации и автореферата по ВАК РФ 03.00.04, кандидат биологических наук Акберова, Наталья Ивановна

  • Акберова, Наталья Ивановна
  • кандидат биологических науккандидат биологических наук
  • 1999, Казань
  • Специальность ВАК РФ03.00.04
  • Количество страниц 123
Акберова, Наталья Ивановна. Симметричные структуры в нуклеотидных последовательностях сайтов инициации репликации ДНК прокариот: дис. кандидат биологических наук: 03.00.04 - Биохимия. Казань. 1999. 123 с.

Оглавление диссертации кандидат биологических наук Акберова, Наталья Ивановна

СОДЕРЖАНИЕ

стр.

5

ГЛАВА 1. ОБЗОР ЛИТЕРАТУРЫ

1.1. Структура сайтов инициации репликации ДНК

1.2. Методы исследования генетических текстов функциональных сайтов

ГЛАВА 2. ОБЪЕКТЫ И МЕТОДЫ

2.1 ОБЪЕКТЫ

2.2 МЕТОДЫ

2.2.1. метод анализа симметрии генетического текста

2.2.2. метод оценки значимости выявленных элементов симметрии для функции оп

ГЛАВА 3. РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ

3.1.Симметричные структуры в нуклеотидных последовательностях прокариотических оп

3.2. Классификация изучаемых последовательностей, основанная на вхождение в них симметричных структур

3.2.1.Классификация множества генетических текстов по признаку вхождения симметричных структур

3.2.2. Соответствие классификации изучаемых последовательностей, основанной на вхождение в них симметричных структур, содержательным классификациям

3.3.Построение симметрийных консенсусов оп

3.3.1. Симметрийный консенсус для последовательностей группы

E.coli

3.3.2. Сравнение симметрийного консенсуса с экспериментальными данными о строении ori

3.3.2.1.Сайты связывания с белками, участвующими в инициации репликации ДНК

3.3.2.2. В симметрийные консенсусы входят все типы экспериментально обнаруженных структурных элементов ori прокариот

3.3.3. Симметрийный консенсус для последовательностей рода Pseudomonas

3.3.4. Сравнение симметрийных консенсусов, построенных для последовательностей группы E.coli и последовательностей рода Pseudomonas. 74 3.4. Использование симметриных консенсусов для распознавания ori 76 3.4.1 .«Экспериментальный» образ ori 77 3.4.2. «Формальный» образ ori

ЗАКЛЮЧЕНИЕ

ЛИТЕРАТУРА

ПРИЛОЖЕНИЕ

116

Рекомендованный список диссертаций по специальности «Биохимия», 03.00.04 шифр ВАК

Введение диссертации (часть автореферата) на тему «Симметричные структуры в нуклеотидных последовательностях сайтов инициации репликации ДНК прокариот»

ВВЕДЕНИЕ

Актуальность темы. Репликация ДНК, один из фундаментальных процессов, отличающий живые существа от неживой природы, контролируется на уровне инициации. Инициация репликации сложный многостадийный процесс, требующий участия многих белков, происходит в определенных участках хромосомы, которые называют сайтами инициации репликации или origin, orí. У прокариот инициация репликации ДНК происходит в единственном orí, тогда как у эукариот на каждой хромосоме существуют множественные orí репликации ДНК. Термин origin употребляется для обозначения двух различающихся понятий:

1). точечной позиции на хромосоме, в которой происходит встраивание первого нуклеотида дочерней цепи ДНК, т.е. понятие origin служит для обозначения точки начала, старта синтеза дочерней цепи ДНК;

2). так обозначают генетический элемент, который контролирует инициацию и определяет позиции сайтов инициации, что соответствует репликатору или сайту инициации репликации.

У прокариот эти два понятия перекрываются, совпадают, т.к. orí прокариот являются цис-действующими хромосомными репликаторами, которые содержат точки начала синтеза дочерних цепей.

Выяснение структуры ori важно для понимания молекулярных механизмов регуляции инициации репликации. Множество исследований посвящено решению этой фундаментальной проблемы современной биологии. Разработка новых экспериментальных методов привела к накоплению большого количества данных, проясняющих некоторые детали молекулярных механизмов регуляции инициации репликации ДНК. Об этом свидетельствуют результаты международной конференции по прокариотическим и эукариотическим репликонам ,^во Франции (International Jacques Monod Conference on Prokaryotic and Eukaryotic

Replicons, France, June 18-22, 1995) [Huberman J.A., 1995]. Проблемам репликации ДНК эукариот была посвящена конференция лаборатории в Колд-Спринг-Харборе 1997 года, на которой в большинстве представленных работ особый акцент был сделан на выяснении природы репликаторов эукариот, что, по мнению большинства исследователей, признано одной из самых актуальных проблем современной молекулярной биологии [Abstracts of CSH Meeting, 1997].

Кроме экспериментальных методов исследования процессов, в которых принимают участие определенные участки ДНК (таких как инициация репликации ДНК), в последние годы получили широкое распространение компьютерные методы. Целью этих методов, в частности, является теоретическое изучение строения первичной структуры ДНК, что очень важно для понимания её роли в исследуемом процессе. Такие исследования являются мощным инструментом, позволяющим сократить число дорогостоящих экспериментов и спланировать дальнейшие практические исследования. Особенно актуальной является разработка компьютерных методов исследования ori потому, что практические исследования инициации репликации ДНК трудоемки, результаты, как правило, трудно интерпретируемы в силу сложности используемых экспериментальных методов и самого предмета исследования.

По мере роста объемов банков генетической информации актуальной становится задача компьютерного анализа нуклеотидных последовательностей, которые можно рассматривать как генетические тексты. Представление о генетических текстах было введено в начале 70-х годов в работах Ратнера [ссылка в Ratner V.A., 1998]. Интерес к проблеме генетических текстов сильно возрос в связи с проблемой распознавания функциональных сайтов в геноме [Kel et al, 1995; Ponomarenko MP et al , 1997; Fickett, J.W., 1996]. Было предложено множество методов анализа тветических текстов, которые можно разделить на два класса: контекстные и контекстно-независимые. Контекстными являются широко

используемые консенсусные и матричные методы [Соловьев В.В и др., 1987; Bûcher Р., 1990; Karlin S, Brendel V., 1992; Quandt К. et al., 1995; Uberbacher E.C. et al, 1996; Chen Q.K. et al, 1997]. Контекстно-независимые методы более абстрактны [Brendel V. et al, 1986; Pevzner P.A. et al, 1989; Горбань и др., 1993; Martingale,С., Konopka, А.К, 1996].

Большинство методов распознавания функциональных областей генома основаны на использовании статистического подхода, что затрудняет их использование для практических потребностей экспериментальной молекулярной биологии. Основная проблема этих методов состоит в выборе вида распределения вероятностей той или иной статистики для оценки значимости полученных результатов. Хотя были предложены различные варианты моделей случайности, полученные на основе анализа большого количества текстов [Бородовский М.Ю., Певзнер П.А. , 1990; Сприжицкий Ю.А и др., 1988 ], однако корректность такого подхода не всегда удается обосновать. Для анализа генетических текстов функциональных областей необходимы контекстно-независимые методы, в которых в качестве формальных свойств последовательности используются внутренние свойства генетических текстов нестатистического характера. Известно, что повторы являются характерной чертой регуляторных районов генома как прокариот, так и эукариот [Day GR, Blake RD, 1982; Boulikas T, 1996 ] что предполагает их важность для функции этих регуляторных областей [Pearson et al, 1996; Boulikas T, Kong CF, 1993; Samadashwily GM et al , 1997]. В 1992 г. был предложен контекстно-независимый подход для анализа структуры генетического текста [Леонтьев А.Ю , 1992], основанный на выявлении внутренней симметрии текста, в котором в качестве характеристик генетического текста было предложено использовать наличие в них повторов 8-ми возможных типов симметрии. В данной работе такой симметрийный подход применяется для исследования генетических текстов .сайтов инициации репликации

прокариот и предлагается метод построения симметрийных консенсусов для изучения первичной структуры orí.

Интерес именно к первичной структуре сайта инициации репликации объясняется тем, что нуклеотидные последовательности этих сайтов у прокариот являются надежно установленным фактом. Построение моделей этих сайтов на уровне первичной структуры делает возможным выявления роли первичной структуры ДНК для функции инициации репликации. Очевидно, что анализ первичной структуры таких сложно устроенных функциональных сайтов, как прокариотические ori, позволит выявить в их нуклеотидных последовательностях структуры, необходимые для начальных этапов инициации, поскольку эти этапы должны быть наиболее сиквенс-специфичными. Кроме того, моделирование на уровне первичной структуры предполагает возможность непосредственного воздействия на процесс инициации репликации. Выявление участков нуклеотидной последовательности сайта инициации репликации, участвующих во взаимодействии с инициаторным белком, позволит изменять их с помощью методов современной молекулярной биологии (вставки и делеции оснований, направленный мутагенез), что означает возможность регулирования процессом инициации репликации. Цель и задачи:

Целью данной работы явилось выявление внутренней структуры сайта инициации репликации ДНК пркариот на уровне первичной структуры и установление, какую роль играют симметричные структуры генетических текстов этих сайтов в инициации репликации. Были поставлены следующие задачи:

1. Выявить повторы всех типов симметрии в генетических текстах сайтов инициации репликации ДНК прокариот.

2. Оценить эффективность симметрий как формальных признаков генетических текстов для функционально-значимой классификации^ изучаемых последовательностей.

3. Оценить эффективность предлагаемого симметрийного подхода для исследования структуры сайтов инициации репликации прокариот.

4. Построение формальной модели сайта инициации прокариот, пригодной для компьютерного распознавания orí в геноме прокариот.

Научная новизна:

Впервые предлагается контекстно-независимый, нестатистический метод для исследования структуры сайта инициации репликации и для классификации нуклеотидных последовательностей с функцией ori, основанный на внутренней симметрии нуклеотидных последовательностей.

Впервые было проведено систематическое исследование обобщенной симметрии генетических текстов 13-ти прокариотических сайтов инициации репликации и наряду с традиционно исследуемыми повторами ( простые и комплементарные) выявлены структуры обычно не рассматриваемых типов симметрии - КУ(пурин-пиримидин) и КМ (амино-кето)

Показана значимость для функции orí симметричных структур, выявленных в нуклеотидных последовательностях сайтов инициации репликации ДНК прокариот.

Практическая ценность:

Предложен контекстно-независимый метод анализа нуклеотидных последовательностей, основанный на внутренней симметрии генетического текста функциональных сайтов, который может быть использован для классификации последовательностей.

Предложенный метод позволяет выявлять в последовательности значимые для функции структуры.

Разработан метод описания симметричной структуры достаточно протяженных участков генетического текста (100-1000 и более), пригодный для создания образов распознавания функционального сайта в геноме.

ГЛАВА 1 ОБЗОР ЛИТЕРАТУРЫ

1.1. СТРУКТУРА САЙТОВ ИНИЦИАЦИИ РЕПЛИКАЦИИ ДНК.

Репликация ДНК, фундаментальный процесс, обеспечивающий передачу генетической информации от одного поколения к следующему, контролируется на уровне инициации.

У прокариот и низших эукариот имеются четкие сайты инициации репликации ДНК на хромосоме, в клетках высших эукариот инициация репликации происходит одновременно во множественных сайтах хромосомы. И в том, и в другом случае инициация сложный процесс, требующий участия многих белков.

Было предложено несколько моделей инициации репликации: теория репликона [Jacob et al, 1963], модель аккумулирования инициатора [Maaloe, Kjeldgaard, 1966; Mahaffy JM, Zyskind JW, 1989 ], модель разведения ингибитора [ Pritchard et al, 1969] и ауторепрессорная модель [Sompayrac, Maaloe, 1973]. Хотя эти модели предполагают различные типы контроля, все они утверждают существование триггерного белка, который включает, запускает инициацию. В настоящее время считается, что для инициации репликации необходимо взаимодействие репликатора, цис-элемента на хромосоме, и инициатора или транс-элемента, бежа или комплекса белков, узнающего репликатор [Brewer B.J., Fangman W.L., 1991; Stillman В. et al, 1992; Marahrens Y., Stillman В., 1994; Kelman Z., O'Donnell M., 1994; Hamlin J.L., Dijkwel P.A., 1995; Muzi-Falconi et al, 1996]. У прокариот инициатором является DnaA белок, а репликатором - сайты инициации репликации или origins [ Atlung et al, 1987; Mahafiy J.M., Zyskind J.W., 1989; Hansen F.G. et al, 1991; Ogasawara et al, 1991; Zyskind J.W., Smith D.W., 1992; Marians K.J., 1992; Skarstad K., Boye E., 1994; Herrick J. et al,1996].

Инициацию репликации прокариот принято описывать на примере Е. coli, т.к. именно на этом модельном объекте получено больше всего

сведений о строении ori. В норме репликация хромосомы Е. coli (4700 kb) начинается в участке, расположенном на 84,3 мин хромосомной карты, названном oriC, и инициация в этом случае зависит от DnaA белка [ Bramhill D., Kornberg А., 1988]. 10-40 мономеров DnaA белка, связанные с АТФ, связываются с oriC в присутствии бежа HU и IHF изменяют конформацшо ori [Sekimizu К. et al, 1987]. In vitro было показано, что образуется комплекс с соотношением 30 мономеров DnaA белка на oriC, в котором заняты все DnaA-боксы. [Margulies С., Kaguni J.M., 1996]. В результате присоединения DnaA белка к oriC образуется «открытый комплекс», в котором ДНК oriC частично расплетена в специфических районах в левой АТ-богатой части oriC [Bramhill, Kornberg, 1988; Baker, Kornberg, 1988; Gille, Messer, 1991], в результате становится возможной сборка реплисомы, организатором которой является DnaA белок [Messer W. et al., 1988]. Было показано, что домены DnaA белка взаимодействуют с DnaB белком, что ориентирует DnaB хеликазу в направлении движения репликационной вилки [Marszalek J. et al, 1996], становится возможным взаимодействие DnaC бежа с DnaB-белком , формируется пре-инициирующий (prepriming complex (преП) [Fminell et al, 1987, Sekimuzu et al, 1988] или препраймосома (preprimosome) [Masai et al, 1996]. Сюда же направляются праймаза (DnaG-белок) и холоэнзим ДНК-полимеразы Ш и формируется реплисома [Messer W. et al., 1988] В результате такого сложного взаимодействия запускается двунаправленный реплик анионный синтез [Kaguni JM et al, 1982].

Только фосфоршшрованные формы DnaA бежа способны к ИР. [Bramhill, D., Kornberg, А., 1988; Crooke Е et al, 1992]. Было показано, что АТФ необходима на самых ранних стадиях инициации репликации, в этом случае АТФ связана с сайтом DnaA бежа, имеющим высокое сродство к АТФ (high-affinity site ). Кроме этого, некоторое количество АТФ требуется на более поздних стадиях образования инициирующего комплекса, и эта АТФ взаимодействует с DnaA бежом в сайте с

пониженным сродством (low-affinity site) к АТФ [ Yung BY et al, 1990]. Имеются данные о том, что связывание с АТФ изменяет конформацию DnaA белка и таким образом регулирует его активность [ Mizushima Т et al, 1996; Kubota Т et al, 1997]. Недавно обнаружен негативный фактор инициации репликации, IdaA белок, инактивирующий DnaA белок, стимулируя гидролиз связанной с ним АТФ [ Mizushima Т et al, 1997;Kurokawa К et al, 1998]

В экспериментах на минихромосомах in vitro в отсутствии ДНК-лигазы были выявлены позиции точек старта репликационного синтеза на обеих цепях ДНК, которые находились близко к сайтам связывания DnaA белка (позиции 194/199 и 265/272 - на одной цепи и 209/219 и 254 - на другой ) [ Seufert, Messer, 1987]. Ранее этими же авторами были определены другие позиции старта репликационного синтеза: на ведущей цепи синтез стартовал в позициях с 248 по -44 минимального orí, на комплементарной цепи синтез начинался вне oriC, на несколько позиций левее от него [ Seufert, Messer, 1987]. В другой лаборатории при изучении репликационных вилок в системе с очищенными ферментами было показано, что концентрация праймазы определяет позиции старта репликационного синтеза. При низких концентрациях праймазы (8 пМ) наблюдался ассимметричный синтез ДНК, инициация происходила вне oriC, тогда как при высоких концентрациях праймазы (80 пМ) инициация происходила исключительно с oriC [Hiasa Н, Marians KJ, 1994].

Структурные элементы orí прокариот.

Сайты связывания с инициаторным DnaA белком (РпаА-боксыУ

Инициатор репликации DnaA белок является продуктом гена dnaA E.coli [Kaguni J.M., Kornberg A., 1984] с молекулярным весом 52.5 кД [Hansen F.G.et al, 1987]. Этот белок узнает определенные последовательности на хромосоме и специфически связывается с oriC в 4-х

сайтах связывания, названными DnaA-боксэми Rl, R2, R3 и R4 [Fuller R.S. et al, 1984; Braun et al, 1985]. Позже при футпринтинге ДНКазой I был определен пятый DnaA-бокс в oriC - Matsui box, М или R5 [Matsui et al, 1985]. С помощью метода гибридизации на фильтрах линейных фрагментов ДНК был определен 9-ти нуклеотидный консенсус DnaA бокса ТТАТМСАМА, где М= С/А [Fuller et al, 1984]. Любой 9ти-мер, отличающийся от него на 1 нуклеотид, считался DnaA-боксом. DnaA-боксы 5-ТТАТАСАСА и 5-ТТАТССААА, присутствующие в oriC, сильнее связываются с DnaA белком [Samitt et al., 1989]. Используя способность комплекса DnaA белок - DnaA-бокс блокировать осуществляемую РНК-полимер азой транскрипцию in vitro, определили новый более свободный консенсус: 5'-(T/C)(T/C)(A/T/C)T(A/C)C(A/G)(A/C^)(A/C), в котором жестко определенными являются четвертая и шестая позиции. В этом случае использовались DnaA-боксы, встречающиеся как в oriC, так и выявленные в промоторах различных генов E.coli, а кроме того DnaA-боксы из ori B.subtilis и различных плазмид и мутантные производные, отличающиеся от Е>паА-бокса 5'-ТТТТССАСА на один нуклеотид [ Schaefer С., Messer W., 1991]. Определение констант диссоциации при связывании DnaA бежа с двуцепочечными 21-мерными олигонуклеотидами, содержащими DnaA-боксы или их модифицированные версии показало, что специфическое связывание происходит с DnaA-боксом с последовательностью T(A/T)TNCACA, в котором пятая позиция не важна для связывания. Выяснилось также, что последовательности, фланкирующие DnaA-боксы, тоже влияют на связывание. Наличие шести нуклеотидов из последовательности oriC по обеим сторонам DnaA-боксов R1 и R4 на порядок увеличивало связывание DnaA бежа [Schaper S., Messer W., 1995].

Взаимодействие DnaA бежа с oriC приводит к изменению структуры ДНК в этой области, так присоединение одного мономера DnaA бежа изгибает ДНК на 40°, что важно для формирования правильной

пространственной структуры сайта инициации репликации ДНК [Schaper S., Messer W., 1995].

Неактивность DnaA-боксов, содержащих дезоксиуридин на той или другой цепи, показывает, что DnaA белок контактирует с обеими цепями ДНК, при этом осуществляет контакты как в большой, так и в малой бороздке, т.к. специфические к малой бороздке лиганды негативно влияют на формирование инициационного комплекса [Schaper S., Messer W., 1995].

Стоихиометрические измерения показали, что комплекс DnaA-белок - DnaA-бокс состоит из одного мономера DnaA белка на DnaA-бокс [Schaper S., Messer W., 1995].

Использование генетического подхода в изучении инициационного комплекса DnaA белок - oriC в лаборатории В. Мессера позволило определить , что вставки, изменяющие расстояние между ШаА-боксами, приводят к инактивации oriC. Однако, если делеция или вставка достигала 10 нуклеотидов, т.е. полного оборота спирали, между DnaA-боксами R2 и R3, или R3 и R4, то у таких мутантов origin функционировал [Messer et al, 1992; Woelker, Messer, 1993]. Это показывает, что для функции инициации репликации важна ориентация этих DnaA-боксов относительно оси спирали. Вставка же 10 нуклеотидов между АТ-богатым районом и DnaA-боксом R1, или между ШаА-боксами R1 и М, или М и R2 полностью подавляли инициацию репликации ДНК [Messer et al, 1992; Hsu et al, 1994]. Это указывает на то, что в левой части ori важна не столько ориентация DnaA-боксов относительно оси спирали, сколько конкретное расстояние между ними. Несмотря на исключительную роль DnaA белка в формировании инициационного комплекса и важность ориентации отдельных DnaA-боксов, точечные мутации (замена пары оснований) в одном DnaA-боксе в oriC фенотипически не проявляются, поскольку не изменяют способности origins к репликации in vivo и in vitro, хотя и влияют на связывание DnaA бежа с мутадаными ШаА-боксами, что было показано при помощи футпринтинга ДНКазой I ( pNase I footprinting )

DnaA-боксы взаимодействуют с DnaA белком по-разному. Хотя DnaA-бокс R3 и защищен DnaA белком в экспериментах по фугпринтингу ДНКазой 1 как на фрагментах ДНК [Holz et al, 1992], так и на суперспирализованных образцах [Woelker, Messer, 1993], но in vivo, в отличии от DnaA-боксов Rl, R2 и R4, он не связывается с DnaA белком на протяжении почти всего клеточного цикла [Samitt et al. 1989]. Константы связывания DnaA белка с отдельными DnaA-боксэми показали, что R1 и R4 сильнее всего связываются с DnaA белком, связывание с R2 - понижено, а с R3-6okcom - неспецифично [Schaper S., Messer W., 1995]. Хотя ранее непрямым методом терминации транскрипции в 1ас промоторе , напротив, было показано более сильное сродство DnaA белка к центральным DnaA-боксам R2 и R3, чем к фланкирующим R1 и R4 [Schaefer, Messer, 1991]. При определении электрофоретической подвижности в геле комплексов DnaA белок - oriC было показано, что связывание DnaA бежа с oriC происходит в определенном порядке: в первую очередь DnaA белок связывается с R4, затем - с R1, и самым последним связывается R3 [Margulies С., Kaguni J.M., 1996]. Более того, анализ мутантов показал, что инициация может происходить без связывания DnaA бежа с DnaA-боксом R3, хотя это приводит к нарушению регуляции репликации ДНК [Langer U et al, 1996]. Связывание DnaA бежа с DnaA-боксом R3 может быть критическим событием инициации на oriC, сигналом к началу инициации репликации, так как in vivo показано, что это происходит только в момент инициации хромосомной репликации, тогда как остальные DnaA-боксы связаны с DnaA бежом на протяжении всего клеточного цикла [Cassler М. R. et al, 1995]. Таким образом, для оптимальной организации инициационного комплекса и инициации репликации ДНК in vivo необходимо последовательное связывание всех индивидуальных DnaA-боксов с DnaA бежом [Langer U et al, 1996; Margulies С., Kaguni J.M., 19961

AT- богатый район orí

Слева от DnaA-бокса R1 расположена АТ-богатая область опС с тремя тандемными повторами в 13 нуклеотидов, названными 13-тимерами или итеронами (13mers, itérons), в которой происходит расплетание цепей и образование "открытого комплекса" в результате взаимодействия DnaA бежа с DnaA-боксами [Hwang, Kornberg, 1992; Gille, Messer 1991]. При помощи мутационных изменений была показана важность этого района для функции oriC in vivo и in vitro [Oka et al, 1980]. Применение методики с использованием КМп04 проб для одноцепочечных участков ДНК продемонстрировало DnaA-зависимое расплетание цепей в левой части oriC in vivo и in vitro [Messer W. et al, 1991]. Различают левый - L, средний - M и правый - R 13-тимеры, которые, несмотря на сходное строение, обладают разными свойствами. DnaA белок специфически взаимодействует с правым R и средним M повторами, мутации в них приводят к снижению инициации репликации [Hsu J et al, 1994]. Взаимодействие с левым L 13-мером - неспецифическое, допустимы замены нуклеотидов, важно сохранить АТ-содержание [Hwang, Kornberg, 1992а]. Электронная микроскопия показала, что мутации в 13ти-мерах не влияют на взаимодействие DnaA бежа с DnaA-боксами [Crooke Е et al 1993]. С этими повторами специфически связывается IciA белок и при этом подавляет инициацию репликации [ Hwang, Kornberg, 1992; Wei Т, Bernander R, 1996]. На основании этих и других экспериментов был сделан вывод, что этот участок on является комплексным генетическим элементом [Kowalski D., Eddy M.J.,1989], выполняющим две важные функции: он содержит сайты, узнаваемые белками, и обладает нестабильностью спирали, которая играет существенную роль в ИР [Kowalski D. et al, 1988]. Наряду со структурными элементами orí, такими как сайты белкового узнавания и спейсеры, был определен новый, важный для функции ori цис-действующий ДНК-рашдетающий элемент - DUE (DNA unwinding element), который ассоциируется с левым L и средним M 13-тимерами

[Kowalski D. et al, 1988]. Следует отметить, что хотя DUE встречается в АТ-богатом участке, только содержание АТ-пар само по себе нельзя использовать для его определения, так как из нескольких АТ-богатых районов, обнаруженных в последовательности oriC у E.coli [Meijer et al, 1979], свойствами DUE обладает только один, расположенный в области 13-тимеров. Это говорит о том, что расплетание ДНК в этом участке в какой-то мере определяется последовательностью нуклеотидов, а не просто их содержанием, хотя по крайней мере для повтора L было показано, что эта сиквенсспецифичность очень нестрогая [Kowalski D., Eddy M.J.,1989].

Минимальный oriC

Используя делеционный анализ, в экспериментах с клонированным на плазмидах и минихромосомах oriC была оределена последовательность ДНК в 232- 254 нп, содержащая всю цис-информацию об инициации репликации, названная минимальным oriC [Oka et al, 1980; Tabata S et al, 1983]. Срукгуру минимального oriC составляют область связывания DnaA белка с сайтами связывания, ОпаА-боксами, и область,где происходит расплетание и локальное расхождение цепей ДНК в результате такого связывания [Oka et al, 1984; Skarstad К., Boye Е., 1994].

Минимальный ori характеризуется полностью консервативными последовательностями ( DnaA-боксы, R 13ти-мер) [Takeda Y. et al, 1982], которые разделены консервативными по длине для нескольких Eubacteriaceae спейсерами [ Zyskind et al, 1983, Zakrzewska-Czerwinska J., 1995]. Однако, в генетической системе с замещенным хромосомным oriC было показано, что клетки, несущие делецию R4 в хромосомном oriC являются жизнеспособными, кроме того вставка 2 kb фрагмента в Hindlll сайт между DnaA-боксэми R3 и R4 в хромосомном oriC не приводит к функциональным изменениям, тогда как вставка такого же фрагмента полностью инактивирует клонированный oriC. На основании результатов этих экспериментов был сделан вывод о необязательности DnaA-бокса R4

для инициации хромосомной репликации, т.е. последовательность oriC, участвующая в инициации хромосомной репликации, отличается от так называемого минимального oriC, который был определен в экспериментах с клонированным на минихромосомах и плазмидах oriC [Bates D. В. et al, 1995].

Сайты связывания с другими белками

Кроме ШаА-белка с oriC взаимодействуют и другие белки.

Сходные с гистонами белки, взаимодействующие с oriC.

В оптимальных условиях (t 37С°) DnaA белок сам по себе может вызывать локальное расплетание в 13-мерном районе oriC E.coli [Skarstad et al, 1990 ], однако обычно требуется ассистирование, помощь сходных с гистонами белков, таких как HU и IHF [integration host factor], которые в 510 раз увеличивают инициацию репликации с oriC [Arai К., et al, 1981а; Allen G.C., Kornberg А., 1993]. Считается, что эти белки изгибают ДНК в oriC и таким образом помогают образованию открытого комплекса. Однако, недавно было показано, что расплетание цепей ДНК в левой части oriC происходит независимо от присутствия или отсутствия инициирующих белков, является спонтанным событием и определяется только последовательностью ДНК. A DnaA и IHF белки лишь стабилизируют локальное расхождение цепей ДНК перед инициацией репликации [Polaczek Р et al, 1998]

а) Ни белок

Ни белок является белком - помощником, в его присутствии ОпаА белок связывается с опС и изменяет его конформацию [Аш, К., е1 а1, 1981а; А11еп^ О.С, & КогпЬе^ А. 1993]. Ни белок неспецифически

взаимодействует с oriC [Капо Y et al 1991]. Даже низкой концентрации HU бежа (5 molecules/oriC) достаточно для стимуляции инициации репликации действия [Skarstad et al, 1990].

б) MF белок (integration host factor)

IHF белок изгибает ДНК в специфическом сайте [Polaczek Р 1990] с консенсусом atcaannnnttr [Roth A et al, 1994]. Сайт связывания с IHF расположен в oriC между DnaA-боксэми R1 и M [Messer W.; et al., 1992]. Кроме того, IHF участвует в регуляции экспрессии генов на уровне инициации транскрипции [. Parekh BS ,. Hatfield GW, 1996]

в) FIS белок

Еще один сходный с гистонами белок, FIS белок (factor for inversion stimulation) участвующий в сайт-специфических рекомбинационных процессах, имеет уникальный сайт связывания в oriC между R2 и R3, ближе к R3 [Gille et al, 1991]. Определен консенсус сайта связывания FIS белка:

G ТА А ТА С nn nn nn nn

T CG T CG A [Messer et al, 1992]

Как FIS белок влияет на инициацию репликации ДНК, не совсем ясно. В лаборатории Messer считают, что FIS белок является важным компонентом инициирующего комплекса, помогающим DnaA белку расплетать ДНК. На oriC плазмидах было показано, что мутации в сайте связывания Fis белка, снижающие связывание, инакгивируют репликацию с таких ori [Roth et al, 1994]. Fis белок сгибает ДНК в своем сайте связывания, придаая сайту ИР необходимые для инициации очертания [Messer et al, 1992]. В других работах, напротив, продемонстрирована негативная роль очищенного Fis „.белка на регуляцию инициации репликации с oriC in vitro [Hiasa H, Marians KJ, 1994;Wold S. et al, 1996].

Авторы сделали вывод, что Fis белок предотвращает формирование корректной структуры инициирующего комплекса, создавая альтернативную структуру, подавляющий инициацию комплекс. У fis-мутантов нарушен контроль репликации, полностью нарушена синхронизация инициации репликации [Gille et al, 1991; Skarstad К., Boye E.,1994]. Поскольку сайт связывания Fis бежа расположен близко к DnaA-боксу R3, было сделано предположение, что Fis белок препятствует связыванию DnaA бежа с DnaA-боксом R3 на протяжении клеточного цикла [Gille et al, 1991]. Недавно было показано, что Fis белок связывается с dnaAp2 промотором , является его репрессором и таким образом регулирует инициацию репликации [Froelich JM et al, 1996]

Негистоновые белки, взаимодействующие с orí.

а). IciA белок

IciA белок был обнаружен Хвангом и Корнбергом при скрининге oriC на связывающиеся с ним белки. IciA белок имеет мол. массу 33 ГОа, связывается с тремя 13ти-мерами и блокирует расплетание и локальное расхождение цепей ДНК в этом районе [Hwang, Romberg 1992; Hwang, Kornberg 1992а]. Если DnaA белок уже связался с 13мерами, то IciA белок не оказывает никакого влияния на последующие события. Интересно, что клетки с нехваткой или сверхпродукцией IciA бежа фенотипически не отличаются от нормальных. Возможно, это связано результат действия протеазы Do, которая расщепляет IciA белок [Yoo S J et al, 1993] Имеются данные, что IciA белок контролирует экспрессию dnaA гена, действуя как репрессор транскрипции [Lee YS et al, 1996].

б). Rob белок (right oriC binding)

Скарстадом с соавторами был обнаружен белок, взаимодействующий с правой частью oriC, названный Rob белком [Skarstad K et al, 1993]. Rob белок с мол. массой 3-kDa специфически связывается с правой частью oriC

справа от DnaA-бокса R4. В клетке присутствует около 5000 мономеров бежа. Функции его неизвестны. Ген rob, отвечающий за синтез Rob бежа, локализован на 99.8 min на карте Е. coli. Последовательность Rob бежа гомологична некоторым регуляторным белкам, содержащим helix-turn-helix мотив

Негативная регуляция инициации репликации Как большинство биологических процессов инициация репликации ДНК регулируется гомеостатическим соотношением позитивных и негативных факторов. Если основной ori-узнающий DnaA белок является положительным регулятором инициации репликации, то на роль негативного регулятора претендует SeqA белок [Baker ТА, 1994 von Freiesleben U et al, 1994; Lu M. et al, 1994; Boye E et al , 1996], который наряду с Dam бежом важен для регуляции инициации репликации и участвует в синхронизации репликации в клеточном цикле [Bahloul A. et al, 1996]. Для взаимодействия обоих этих бежов с ДНК необходим сайт gate, и важен статус метилирования ДНК [Landoulsi A et al , 1989;] Последовательность oriC содержит 11 сайтов gate [Rein Т. et al, 1997], 9 из которых консервативны для областей инициации репликации прокариот [Zyskind J.W., Smith D.W., 1986]. В норме инициация репликации происходит на полностью метилированном Dam бежом oriC. В процессе репликации все gate-сайты переводятся в гемиметилированную форму, с которыми связывается SeqA белок [Brendler Т. et al, 1995]. В таком гемиметилированном состоянии oriC связан с внешней мембраной, что препятствует взаимодействию oriC с DnaA-бежом [ Marians K.J., 1992]. Таким образом происходит секвестрирование orí до завершения полной репликации хромосомы и блокирование следующих раундов ИР [Bahloul А. et al, 1996; Bogan et al, 1997].

. В опытах in vivo было показано, что SeqA белок непосредственно влияет на биохимические события, происходящие на oriC: во-первых, SeqA

белок подавляет образование пре-инициируещего комплекса ( pre-priming complex); во-вторых, SeqA белок может подавлять репликацию с уже образовавшегося инициирующего комплекса, не разрушая его; в-третьих, SeqA белок влияет на зависимость репликационной системы от концентрации DnaA бежа. Эти результаты предполагают, что SeqA белок участвует в сборке инициирующего комплекса на oriC, и позже влияет на поведение этого комплекса [Wold et al, 1998 ].

Делеционным анализом было показано, что для функции инициации репликации наиболее важно взаимодействие SeqA бежа со 150-тинуклеотидным сегментом в левой части oriC, где встречается, по данным Слэйтера с соавторами, 8 gatc-cairroB[ Slater S. et al, 1995]. Анализ футпринтов oriC с клеточной мембраной показал, что для такого взаимодействия важна левая часть oriC, но определен сегмент большой длины, где расположены 10 сайтов Dam-метилирования [Herrick J et al, 1994]. Иммунофлюоресцентная микроскопия показала, что SeqA белок связан с мембраной [ Hiraga S et al, 1998].

DnaA-независимая репликация В определенных условиях хромосома Е. coli может реплицироваться независимо от DnaA бежа и oriC, репликация в таких случаях называется SDR (stable DNA replication), т.к. она стабильно продолжается в отсутсвии белкового синтеза [Kogoma Т., Lark К.G., 1975; Asai T., Kogoma T., 1994]. Конститутивная SDR (cSDR, constitutive SDR) устойчива к хлорамфениколу, но чувствительна к действию рифампицина и может происходить только в отсутствии RNase H, т.е. проявляется у rnhA-мутантов [Kogoma Т., 1986]. Считается, что инициация репликации начинается в таком случае с R-петель (R-loops), которые стабильны в отсутствии RNase H [X. Hong et al, 1995]. Инициация репликации может происходить при cSDR в нескольких сайтах>названных oriK, и зависит от RecA бежа [Kogoma Т et al, 1994].

При SOS-ответе на различные воздействия среды у Е. coli активизируется другой тип SDR - индуцибельная SDR или iSDR (inducible SDR). iSDR устойчива к действию как хлорамфеникола, так и рифампицина, и начинается в сайтах, названных oriM [Asai Т., Kogoma Т., 1994; Asai Т., Kogoma Т., 1994а], которые находятся в oriC и terC районах хромосомы [Magee T.R. et al, 1992]. Было показано, что в oriC имеется по крайней мере два iSDR-ориджина: oriMlA, который локализуется между BamHI и Avail сайтами, и oriMlB, находящийся между Avail и Hindin сайтами [Asai Т. et al, 1994].

Анализ ферментов, участвующих в SDR репликации, показал, что инициатором в таком случае служит белок п' или PriA белок, который узнает специфическую шпилечную структуру, названную n'-сайт или n'-pas (primosome assembly site) [Shlomai J., Kornberg, A., 1980; Lee E.H. et al, 1990; Zavitz K.H., Marians K.J., 1991]. Последовательность PriA бежа консервативна для многих прокариот [Masai Н., Arai К., 1995]. PriA-зависимая репликация хромосомы Е. coli происходит только при определенных условиях, например, при повреждении ДНК, и зависит от белков, которые необходимы для адаптации клетки к изменению среды. Это позволяет считать такой путь инициации репликации адаптационным приспособлением, позволяющим выживать в трудных условиях [ Masai Н., Arai К., 1996].

Сайты инициации репликации других прокариот.

Кроме oriC E.coli были выделены и охарактеризованы сайты инициации хромосомной репликации других прокариот: Salmonella typhimurium [Zyskind JW, Smith DW, 1980], Enterobacter aerogenes , Klebsiella pneumoniae [Cleary Ж et al, 1982], Erwinia carotovora [Takeda Y et al, 1982], Vibrio harveyi [ Zyskind JW et al, 1983], Pseudomonas aeruginosa и Pseudomonas putida [ Yee TW, Smith DW, 1990;], Bacillus subtilis [Moriya S et al, 1992], Caulobacter crescentus [Marczynski GT, Shapiro L, 1993],

Mycobacterium smegmatis [ Qin MH et al, 1997] , трех видов Streptomyces -S.antibioticus, S.chrysomallus и S. lividans [Jakimowicz D et al, 1998]. Во всех этих orí были выявлены множественные сайты связывания с инициаторным DnaA белком, что свидетельствует об универсальной роли этого белка в инициации репликации бактерий [Yoshikawa Н, Ogasawara N, 1991; Marczynski GT, Shapiro L, 1993; Qin MH et al, 1997; Jakimowicz D et al, 1998]. Однако, помимо сходных черт были выявлены различия в строении индивидуальных хромосомных orí. Например, в последовательности orí Caulobacter crescentus обнаружены уникальные мотивы [Marczynski GT, Shapiro L, 1993]. Хромосомный ориджин Bacillus subtilis отличается от других тем , что его последовательность содержит ген, кодирующий dnaA белок[Мопуа S et al , 1992]. Для хромосомных orí видов Streptomyces характерно отсутствие трех 13-тимеров, не ясно, как происходит расплетание цепей ДНК и где собирается праймосома [Jakimowicz D et al, 1998]. Отличаются разные хромосомные orí по способности функционально комплементировать друг друга, так, например, ori обоих видов Pseudomonas не способны инициировать репликацию в клетках E.coli, и наоборот, oriC E.coli не функционирует в псевдомонадах [Smith DW et al, 1991]. Не способны функционировать в клетках E.coli также orí Bacillus subtilis и Caulobacter crescentus [Marczynski GT, Shapiro L, 1993], a ori пяти энтеробактерий проявляют свою функцию в клетках E.coli [ Zyskind JW et al, 1983]. На основании этого бактериальные ori были разделены на классы: ori энтеробактерий объединены в одну группу, ori Pseudomonas - в другую, отдельные классы представляют ori Bacillus subtilis и Caulobacter crescentus.

Модели сайта инициации репликации В работах Юдифь Зискинд было проведено сравнительное изучение нуклеотидных последовательностей хромосомных ori репликации ДНК эубактерий. Для пяти эубактерий была предложена консенсусная

последовательность длиной 254 нуклеотида, в которой в 122 позициях нуклеотидная замена не приводила к потере функции ori [Zyskind JW et al, 1983]. Были выделены кластеры позиций с полной консервативностью, четыре 9-тинуклеотидных повтора , 8 gate сайтов, и спейсерные участки [Zyskind JW, Smith DW, 1992].

Анализ пространственной организации ДНК в о репликации показал, что сайты связывания с инициаторным белком лежат в дискретном участке с изгибом ДНК( discrete domains of DNA bending), тогда как прямые повторы находятся в четко ограниченном участке с необычными свойствами ( anti-bent domain ) [Eckdahl TT, Anderson JN, 1990].

Мессером с соавторами была предложена модель oriC-DnaA инициационного комплекса, в которой мономеры DnaA белка регулярно расположены в правой части oriC [R1-R4] на фиксированном расстоянии в 34А , a Fis и IHF белки отвечают за сгибание ДНК и за очертания комплекса [Messer et al, 1992].

Таким образом, анализ экспериментальных данных показывает, что репликация контролируется на уровне инициации, которая представляет собой сложный процесс, требующий участия многих бежов.

Имеются четкие сайты инициации репликации на ДНК, по крайней мере, у прокариот и низших эукариот. Структура сайта инициации репликации у прокариот характеризуется следующими свойствами:

- наличие сайтов связывания с инициаторным бежом (бежами);

- консервативность расстояний между этими сайтами;

- наличие легко расплетаемого участка.

Это означает, что для структуры генетического текста области генома, отвечающей за инициацию репликации, должны быть характерны прерывность, а также консервативность расстояний между функционально важными фрагментами.

1.2. МЕТОДЫ ИССЛЕДОВАНИЯ ГЕНЕТИЧЕСКИХ ТЕКСТОВ ФУНКЦИОНАЛЬНЫХ САЙТОВ

С появлением первой расшифрованной нуклеотидной последовательности стали разрабатываться компьютерные методы исследования генетических текстов. Само понятие генетического текста было введено для обозначения структурно-функционального компонента в теории молекулярно-генетических систем управления (МГСУ) [ Ратнер В.А., 1993; Ратнер В.А., 1993а; Ratner, 1998 ]. ДНК как генетическая макромолекула образована мономерами 4-х типов - нуклеотидами. Если сопоставить набору мономеров алфавит эквивалентной мощности - А, Т, С, G, то любую реальную нуклеотидную последовательность можно представить в виде последовательности конечной длины из элементов этого алфавита, которую принято называть генетическим текстом. Хотя рассмотрение молекулы ДНК как генетического текста является упрощенным представлением, но такая модель отражает наиболее существенные особенности ДНК: во-первых, наличие в ней генетической информации; во-вторых, линейного способа записи и хранения этой генетической информации.

Разработка методов анализа генетического текста тесно связана с проблемой выяснения структуры функционального сайта и проблемой его распознавания в геноме. Несмотря на то, что эти работы были начаты практически одновременно с появлением первых генетических текстов, но им еще далеко до завершения. До сих пор нет строгого общепринятого определения термина «функциональный сайт». Примерно функциональный сайт определяют как конкретный участок последовательности генома минимальной длины, достаточный для выполнения определенной функции [ Александров H.H., Каламбет Ю.А., 1990 ].

Для анализа нуклеотидных последовательностей разработано большое количествоьметодов, каждый из которых основан на выявлении определенных, обычно статистических, закономерностей генетического

2g

текста в функциональном сайте. Так Маллиган первым предложил для предсказания активности функционального сайта использовать гомологический индекс [Mulligan М.Е., 1984]. В этой работе показана корреляция между гомологическим индексом и функциональной активностью промоторов in vitro. Вклад каждой позиции в гомологический индекс считался пропорциональным разнице между частотой встречаемости данного и наиболее часто встречаемого нуклеотида и нормировался на ожидаемое по статистике среднеквадратичное отклонение. Стормо использовал матрицы весов, построенные при помощи метода множественной регрессии [Stormo G.D. et al, 1986], основанного на предположении, что измеренная величина эффективности функционального сигнала является арифметической суммой эффектов, связанных с отдельными признаками.

Позиционно-весовые матрицы традиционно применяются для множественного выравнивания сходных по функции последовательностей и построения консесусов [Hertz GZ et al, 1990; Cardon LR, Stormo GD, 1992; Karlin S, Brendel V., 1992; Staden R, 1994; Fields DS, Stormo GD, 1994; Ulyanov AV, Stormo GD, 1995; Quandt K. et al., 1995; Uberbacher E.C. et al, 1996;]. В качестве примеров функциональных сайтов обычно изучаются промоторы и сайты связывания с различными регуляторами транскрипции [Bûcher Р., 1990; Hertz GZ, Stormo GD, 1996; Chen QK et al, 1995; Chen Q.K. et al, 1997].

Для выявления значимых позиций функционального сайта Шнейдером с соавторами была предложена количественная мера информации ( information content ), основанная на статистическом рассмотрении сигналов [Schneider T. D. et al, 1986]. Если принять, что позиция сайта, в которой всегда обнаруживается один и тот же нуклеотид, содержит 2 бита информации, а позиция с равной встречаемостью четырех нуклеотидов - 0 бит, то, просуммировав информацию по всем позициям сайга, можно оценить общее количество информации, которое содержит

функциональный сигнал, и ожидаемую частоту встречаемости сигнала в случайной последовательности. Такой подход был положен в основу создания некоторых методов описания консенсусных последовательностей сайтов связывания различных белков [Schneider T. D., Stephens R. M., 1990; Arvidson D. N. et al, 1991; Papp P.P. et al, 1993; Barrick D. et al, 1994; Stormo GD, 1998 ; Smith D.K., Hong Xue, 1998 ].

Берг и Фон Хиппель применили правила статистической механики при рассмотрении ДНК- белкового взаимодействия [Berg O.G. , von Hippel Р.Н., 1988], Йонссон применил нейронные сети для анализа последовательностей, обладающих сходными функциями [Jonsson J. et al, 1993]. Описанные выше подходы с различными вариациями до сих пор являются преобладающими [Kraus R.J., 1996; Fields D.S. et al, 1997]. Для выравнивания нуклеотидных последовательностей, обладающих сходными функциями, используют вариации методов, предложенных для решения этой задачи нахождения сходных участков в исследуемых последовательностях Ватерманом [Waterman M.S., 1986] и Липманом с коллегами [Lipman et al, 1989]. Активная разработка методов множественного выравнивания связана с необходимостью корректной аннотации последовательностей в постоянно растущих банках последовательностей [ Neuwald A.F. et al, 1993; Hirosawa M et al, 1995; Tonges U et al, 1996; Spang R., Vingron M., 1998; Yuan Y.P. et al, 1998]. Множественное выравнивание является элементом большинства программных пакетов поиска и анализа последовательностей, таких как FASTA [Pearson, Lipman, 1988; Pearson, 1994], BLAST [ Altschul S.F., Gish W, 1996], GRAIL [ Uberbacher E.C. et al, 1996], SignalScan 3.0 [ Prestidge D.S., Stormo G., 1993], TRANSFAC, TRRD и COMPEL [Wingender E. et al, 1997], DIALIGN [Morgenstern В. et al, 1998].

Большое количество методов анализа первичной структуры ДНК основано на использовании Марковских моделей [Almagor H.A., 1983; Baldi Р et al, 1994], так скрытые Марковские модели использовали для

исследования прокариотических и эукариотических промоторов [Pedersen AG et al, 1996] и молекулярной эволюции ДНК [ Kelly С., Rice J., 1996]. Марковские транзиционные матрицы - для обнаружения промоторов эукариот [Audic S., Claverie J-M., 1997] и для распознавания кодирующих белок участков в геномах микроорганизмов [Audic S., Claverie J-M., 1998]. На Марковских моделях основан известный программный пакет GENEMARK, используемый для выявления локализации кодирующих районов в бактериях [ Borodovsky M, Mcffinch J., 1993], и новая программа YEBIS, предназначенная для выявления различных мотивов в функционально сходных последовательностях ДНК [Yada Т et al, 1998].

Кроме описанных контекстно-зависимых методов анализа генетического текста, разработаны более абстрактные контекстно-независимые в широком смысле, основанные на методологии статистики, в которых предлагаются различные способы определения встречаемости слов в генетических текстах [Pevzner P.A. et al, 1989; Горбань и др., 1993; Martingale С., Konopka, A.K, 1996]. Концепция «словаря» генетического текста была введена в работе Бренделя и др. [Brendel V. et al, 1986], при этом под словами понимались короткие последовательности (1-граммы) с неожиданно высокой (или низкой) частотой встречаемости в тексте. Изучение словарей позволяет найти потенциальные регуляторные сайты и эволюционное сходство последовательностей. Выявлению значимых слов в генетических текстах посвящена книга Трифонова и Бренделя [Trifonov E.N, Brendel V., 1986]. В работах Сирлса и других исследователей предлагается использовать методы компьютерной лингвистики для изучения биологических последовательностей [Pesóle G et al, 1994; Popov О et al, 1996; SearlsDB, 1997]

Все описанные методы являются статистическими, и применение таких методов встречает ряд принципиальных трудностей, связанных с самой природой статистики. В первую очередь это касается вида распределения вероятностей, на основании которого рассчитываются

ожидаемые встречаемости тех или иных фрагментов генетического текста. Хотя были предложены различные варианты моделей случайности, полученные на основе анализа большого количества текстов [Бородовский М.Ю., Певзнер П.А. , 1990; Сприжицкий Ю.А и др., 1988 ], однако корректность применения этих моделей при анализе трудно обосновать, тем более для малых выборок последовательностей. Совокупность геномов существующих и существовавших когда-либо видов представляет собой неэргодичную систему с точки зрения их нуклеотидного состава. Следствием этого является хорошо известный факт недостатачности реального времени эволюции для получения современных геномов методом перебора. Поэтому для задачи распознавания функциональных сайтов необходимо выбрать нестатистические характеристики генетических текстов. Такими характеристиками могут служить симметричные структуры в нуклеотидных последовательностях.

Наличие большого числа повторов в нуклеотидных последовательностях является одним из интереснейших свойств генетического текста. Известно, что повторы являются характерной чертой регуляторных районов генома как прокариот, так и эукариот [Day GR, Blake RD, 1982; Boulikas T, 1996 ], что предполагает их важность для функции этих регуляторных областей [Pearson et al, 1996; Boulikas T, Kong CF, 1993; Samadashwily GM et al , 1997]. Анализ повторов широко применяется для исследования нуклеотидных и белковых последовательностей [Гусев В.Д. и др, 1989; Kolchanov NA et al, 1989; Jurka J et al, 1996; Frith M et al, 1997; Coward E., Drablos F., 1998]. Однако во всех этих работах не анализируются все возможные типы повторов и для поиска применяются алгоритмы, основанные на статистических характеристиках, что сталкивается со всеми трудностями статистических методов.

Леонтьевым А.Ю. был предложен нестатистический, контекстно-независимый подход для исследования генетических текстов,

основывающийся на их обобщенной внутренней симметрии [ Леонтьев А.Ю , 1992]. В этой работе приводится классификация всех возможных групп симметрии одноцепочечной молекулы ДНК, представленной в виде генетического текста. Достоинством такого подхода для анализа генетического текста является то, что он не требует учета статистических характеристик текста, интерпретация которых представляет собой сложную задачу вследствие неэргодичности генетических текстов и отсутствии априорных сведений о теоретических распределениях различных статистик.

В основном методы распознавания функциональных сайтов разрабатывались на примере сайтов инициации транскрипции. Нам известны лишь две работы, предлагающие методы распознавания orí в геноме. Оба эти подхода осуществлялись при анализе нуклеотидных последовательностей полных геномов и основываются не на свойствах самого orí как функционального сайта, а на характеристиках прилегающих к нему районов хромосомы и различии свойств ведущей и отстающей цепи ДНК. Так в работе Лобри был применен метод графического векторного представления ДНК геномов 4-х бактерий Escherichia coli, Bacillus subtilis, Haemophilus influenzae и Mycoplasma genitalium, при этом выделялся район orí на графическом отображении кольцевой хромосомы [Lobry Ж, 1996]. Во второй работе Зальцберг с коллегами предлагает распознавать orí в нуклеотидной последовательности генома по окружающим его октамерам, которые обладают «скошенной» ориентацией ( skewed), т.е. такой октамер встречается намного чаще на ведущей цепи ДНК (leading chain), чем на запаздывающей (lagging chain) [Salzberg SL et al, 1998 ].

Таким образом, анализ литературы показывает, что накоплен большой экспериментальный материал, проясняющий некоторые детали структуры orí. Эти данные требуют обобщения, поэтому компьютерное исследование нуклеотидных последовательностей orí становится особенно

актуальным. Методы анализа нуклеотидных последовательностей функциональных сайтов разрабатывались для сайтов инициации транскрипции, два известных нам метода распознавания orí основываются на свойствах прилегающих к orí олигонуклеотидов и применимы для анализа полных геномов прокариот. Все описанные в обзоре литературы методы анализа нуклеотидных последовательностей являются статистическими и сталкиваются с принципиальными трудностями, связанными с самой природой статистики., что делает актуальным разработку контекстно-независимого нестатистического метода анализа нуклеотидных последовательностей областей прокариотических orí. В качестве такой нестатистической характеристики предлагается использовать свойственные последовательностям orí симметричные структуры всех возможных в генетическом тексте типов и применить их для построения образа orí, пригодного для задачи распознавания этого функционального сайта в геноме.

ГЛАВА 2 ОБЪЕКТЫ И МЕТОДЫ

2.1 ОБЪЕКТЫ

В работе были исследованы генетические тексты инициации репликации ДНК прокариот. Прокариотические orí выбраны, потому что. их существование не вызывает никаких сомнений, в отличиие от orí репликации эукариот, относительно которых не существует общего мнения. Были получены экспериментальные данные свидетельствующие в пользу того, что и у эукариот хромосомная репликация инициируется в специфических участках ДНК [Kitsberg D, 1993;Tasheva ES, Roufa DJ, 1994; Gilbert DM et al, 1995 ; Rein T et al, 1997]. Другие исследователи в своих экспериментах показывают, что репликация у эукариот инициируется с большого количества сайтов, рассыпанных на очень протяженном участке хромосомы (55 kb) [Dijkwel P. A., Hamlin J. L., 1995]. Такая ситуация связана не только со сложностью самих экспериментов и интерпретацией результатов, но в какой-то мере усложняется тем, что термин «origin» применяется для обозначения как точек старта дочерних цепочек ДНК, так и для обозначения цис-действующего генетического элемента, контролирующего инициацию репликации. У прокариот эти два понятия практически совпадают, репликаторы прокариот содержат точки старта синтеза дочерних цепей. Мы не взяли для изучения дрожжевые ARSbi, потому что, несмотря на их способность поддерживать автономную репликацию плазмид, их не всегда можно ассоциировать с хромосомными репликаторами. Так было показано, что из двух ARSob, идентичных по последовательности и расположенных рядом на хромосоме, функционально активным является один [Brewer В. J., Fangman W. L., 1993; Marahrens Y, Stillman В., 1994].

В банке нуклеотидных последовательностей Genbank Национального центра биотехнологической информации ( NCBI ) мы обнаружили 182 последовательностей, связанных с инициацией репликации ДНК прокариот. Из них для анализа отобраны только хромосомные orí, последовательности которых содержат информацию, достаточно полную для инициации репликации, исключены из них идентичные (как в роде Shigella). Не включены в этот список также последовательности с нечеткой аннотацией, в частности такие, в которых origin локализован в позиции одного нуклеотида, являясь по сути сайтом, в котором происходит старт синтеза дочерней цепи ДНК.

Таблица 1. Список изученных последовательностей orí.

No Организм Индекс по Gen Bank Длина (в парах оснований) Условное обозначение

1 Bacillus subtilis V01490 486 bs

2 Escherichia coli V00308 555 ее

3 Enterobacter aerogenes j01576 556 еа

4 Klebsiella pneumoniae j01744 554 кр

5 Erwinia carotovora V00255 696 er

6 Pseudomonas aeruginosa m30125 651 pa

7 Pseudomonas putida m30126 651 PP

8 Shigella dysenteriae X67657 450 sd

9 Salmonella typhimurium j01808 552 st

10 Streptomyces coelicolor m82836 921 sc

11 Vibrio harveyi k00829 277 vh

12 Caulobacter crescentus S43898 998 cc

13 Plasmid R751 pAR757 870 pl

Поэтому мы ограничились приведенными в Табл.1 тринадцатью примерами областей инициации репликации ДНК, куда включили наряду с хромосомными один плазмидный репликатор. Далее в работе для обозначения исследуемых последовательностей будем пользоваться условными обозначениями этой таблицы.

2.2 МЕТОДЫ

При решении задачи распознавания функциональных областей в геноме часто пользуются статистическими подходами, однако, применение такого подхода встречает ряд принципиальных трудностей связанных с самой природой статистики. В первую очередь это касается вида распределения вероятностей, на основании которого рассчитываются ожидаемые встречаемости тех или иных фрагментов генетического текста.

В настоящей работе для анализа нуклеотидных последовательностей сайтов инициации репликации прокариот был применен предложенный Леонтьевым А.Ю. [Леонтьев А.Ю , 1992] симметрийный подход и на его основе разработан контекстно-независимый, нестатистический метод построения образа orí прокариот, базирующийся на симметричныех структурах, обнаруживаемых в нуклеотидных последовательностях. Достоинством этого метода является использование нестатистической характеристики нуклеотидных последовательностей ori прокариот -симметрии их генетических текстов. Другим достоинством предлагаемого метода анализа нуклеотидных последовательностей является то, что в его основу положено свойство генетического текста, являющееся контекстно-независимым, т.е. не зависит от окружающих данный фрагмент последовательностей.

Ниже описаны, во-первых, метод анализа симметрии генетического текста; во-вторых, метод оценки значимости выявленных элементов симметрии для функции orí.

2.2.1. Метод анализа симметрии генетического текста.

Генетический текст ДНК рассматривается как одномерная дискретная структура из точек, окрашенных в четыре цвета, соответствующих четырем типам нуклеотидов. Всего с учетом цветных и пространственных преобразований в генетическом тексте возможны 8

видов симметрии, базирующиеся на биохимически осмысленных гомоморфных преобразованиях алфавита ДНК - с<->§), с<-»1),

{а<-»с, g<-*t} и повторениях или инверсиях отдельных фрагментов [Леонтьев А.Ю , 1992]. Преобразование с<-»§} соответствует

комплементарным взаимодействиям; преобразование с<-М;}

преобразует пурин в пурин, а пиримидин - в пиримидин; третье преобразование {а<-»с, связывает основания с амино- и кето-

группами. Вместе с инверсией текста эти преобразования определяют повторы 8-ми видов симметричных структур. Все эти структуры могут быть как разнесенными, так и тандемными.

Используемая в данной работе номенклатура симметричных структур, представлена в Таблице 2.

Таблица 2. Номенклатура симметричных структур в генетическом тексте, принятая в данной работе.

Типы симметрий Обозначение симметрий Ориентация повторов

Прямые (ВД Инвертированные (1ПУ)

Обычные Сшп aagct...aagct аа§с1..Лс§аа

Комплементарные Стр1

Пурин или пиримидин ЫУ аа§с1...§§а1с aagct...ctagg

Амино- или кето- КМ aagct...gatcc

ПРИМЕЧАНИЕ: Пентануклеотид выбран в качестве примера сайта, не имеющего внутренней симметрии Этим 8-ми типам симметрии соответствуют строгие с математической точки зрения группы [Вайнштейн Б.К., 1978], что позволяет строить эффективные алгоритмы их распознавания в геноме.

Алгоритм поиска симметрий реализован на ШМ РС, основан на ^ полном переборе вариантов, время поиска повторов всех возможных типов

симметричных структур в нуклеотидной последовательности, длиной 500 нуклеотидов составляет 3 минуты .

Наша задача заключалась в том, чтобы выяснить, могут ли симметричные структуры быть использованы для полного и корректного решения задачи распознавания orí прокариот. С этой целью были изучены симметрийные паттерны известных прокариотических orí и построены образы этих функциональных сайтов для таксономических групп разных уровней.

Методика построения симметрийного образа состоит из следующих этапов:

1) для каждой исследуемой последовательности определялись все входящие в нее повторы всех типов симметричных структур, описанных в Таблице 2;

2) для того, чтобы выявить общие для исследуемых нуклеотидных последовательностей повторы, из всех найденных повторов всех типов симметрии для дальнейшего анализа отбираются только те, которые встречаются не менее, чем в двух последовательностях;

3) для построения "симметрийного консенсуса" (СК) выбирались лишь те симметричные структуры, которые расположены во всей рассматриваемой группе на фиксированных расстояниях; таким образом под СК мы подразумеваем общий для группы последовательностей набор симметричных структур, находящихся во всех последовательностях данной группы на фиксированных расстояниях;

4) множество изучаемых последовательностей разбивается на подгруппы по признаку вхождения тех или иных симметричных структур; собственно процедура классификации заключается в построении графа, в вершинах которого располагаются найденные группы последовательностей, а ребра образуют иерархию родства по рассматриваемым формальным признакам.

Для адаптации построенных в работе симметрийных консенсусов задачам компьютерного распознавания orí в геноме прокариот предлагается их описание на формальном языке, в котором в качестве элементов словаря использованы симметричные структуры, обнаруженные в исследуемых последовательностях, слова связаны между собой отношениями «содержит», «слева» и «расстояние».

2.2.2. Метод оценки значимости выявленных элементов симметрии для функции orí.

Значимость выявленных в работе симметричных структур для функции инициации репликации ДНК прокариот определялась:

1). при сравнении проведенной в работе, основанной на симметриях формальной классификации исследуемых последовательностей с содержательными классификациями. В качестве содержательных классификаций использовали таксономическую классификацию организмов, которым принадлежат эти последовательности, и классификацию прокариотических orí, основанную на экспериментальных данных об их функциональной взаимозаменяемости;

2). при сравнении элементов построенных в работе симметрийных консенсусов с описанными в литературе структурными элементами orí прокариот, важными для функции.

Использованное в работе программное обеспечение разработано Леонтьевым А.Ю. в лаборатории биохимии нуклеиновых кислот КГУ, алгоритмы реализованы на ЮМ РС.

Похожие диссертационные работы по специальности «Биохимия», 03.00.04 шифр ВАК

Заключение диссертации по теме «Биохимия», Акберова, Наталья Ивановна

ВЫВОДЫ:

1. Осуществлен поиск симметричных структур и выявлены повторы всех возможных 8-ми типов симметрии в нуклеотидных последовательностях 13-ти исследованных сайтов инициации репликации прокариот.

2. Были выявлены симметричные структуры в генетических текстах исследованных прокариотических orí, значимые для функции инициации репликации. Было показано, что важными для функции инициации репликации наряду с традиционно рассматриваемыми обычными и комплементарными повторами оказались не рассматривавшиеся ранее симметричные структуры RY и КМ типов.

3. Проведена классификация исследуемых последовательностей по признаку вхождения определенных симметричных структур, которая хорошо согласуется с таксономией организмов, которым принадлежат изученные последовательности. Обнаружено также точное соответствие формальной классификации исследованных последовательностей и классификации прокариотических orí, основанной на экспериментальных данных, что является подтверждением функциональной значимости выявленных симметричных структур для инициации репликации.

4. Построены симметрийные консенсусы (СК), основанные на наличии в последовательностях симметричных структур, элементы которых расположены на одинаковых расстояниях. Показано, что построение симметрийных консенсусов для генетических текстов сайтов инициации репликации прокариот является эффективным инструментом для изучения внутренней структуры этих сайтов.

5. В работе показано, что симметрийный консенсус, построенный для группы последовательностей E.coli, обнаруживается в единственном месте хромосомы - в сайте инициации репликации oriC. Это означает пригодность предложенных в работе моделей сайта инициации репликации ДНК для распознавания orí в геноме прокариот.

ЗАКЛЮЧЕНИЕ

В нуклеотидных последовательностях изученных сайтов инициации репликации ДНК прокариот обнаружены повторы всех возможных в генетическом тексте 8-ми типов симметрии . Во всех 13-ти исследуемых последовательностях сайтов инициации репликации прокариот выявлены повторы как традиционно исследуемых типов симметрии ( обычные и комплементарные повторы), так и обычно не рассматриваемые «цветные» ИТ ( пурин - пиримидин ) и КМ (амида- кето) симметричные структуры. «Цветные» ЯУ и КМ симметричные структуры встречаются в исследованных последовательностях примерно в два раза реже, чем традиционно рассматриваемые повторы. Максимальные длины элементов повторов всех исследованных типов симметрии лежат в диапазоне 8-12 нуклеотидов.

Проведенный симметрийный анализ позволил выявить общие структуры в текстах изученных сайтов инициации репликации ДНК прокариот, провести классификацию исследуемых последовательностей, основанную на таких формальных признаках как наличие определенных симметричных структур в последовательностях и расстоянии между элементами общих повторов.

Для формальной классификации наиболее значимыми оказались повторы следующих типов симметрии: прямые простые и прямые комплементарные, прямые ЛУ повторы, инвертированные комплементарные, инвертированные КУ и инвертированные КМ повторы. Это является свидетельством того, что «цветные» симметрии, наряду с традиционно рассматриваемыми, представляют важные свойства исследуемых последовательностей.

Классификация последовательностей по признаку вхождения симметричных структур позволяет разбить множество исследованных последовательностей на подгруппы, соответствующие принятой таксономии организмов, которым последовательности принадлежат. Это свидетельствует о том, что наличие симметричных структур в исследуемых генетических текстах является содержательным признаком последовательностей orí, значимым для таксономической классификации организмов. Проведенная классификация, основанная на формальных признаках, позволила разделить последовательности, содержащие orí, относящиеся к разным классам из-за неспособности к функциональной комплементации, и объединить последовательности, содержащие ori одного класса, способные функционально заменять друг друга. Такое точное соответствие формальной классификации исследованных последовательностей и классификации прокариотических ori, основанной на экспериментальных данных, является подтверждением функциональной значимости симметричных структур для инициации репликации.

На основании наличия в последовательностях симметричных структур, элементы которых расположены на одинаковых расстояниях, были построены симметричные консенсусы двух видов: для последовательностей группы E.coli и для последовательностей рода Pseudomonas . И в том, и в другом случае симетрийные консенсусы состоят го двух блоков: в правый входят сайты связывания с DnaA белком, слева расположен другой блок, образованный обычными и комплементарными повторами.

Расстояние между блоками строгое (40- 42 нуклеотида) для последовательностей группы E.coli. В последовательностях рода Pseudomonas блоки расположены на разных расстояниях (211 нуклеотидов в последовательности {ра} и 282 нуклеотида в {рр}), но одинаково ориентированы относительно друг друга и оси спирали ДНК В симметрийном консенсусе для последовательностей группы E.coli в правом блоке обнаружены симметричные структуры RY- и КМ-типов , которые выявляются во всех последовательностях этой группы, что указывает на их значимость для функции инициации репликации.

В симметрийном консенсусе группы последовательностей E.coli выявлены 4 сайта связывания с негативным регулятором инициации репликации SeqA белком. В симметрийном консенсусе, построенном для последовательностей рода Pseudomonas сайтов негативной регуляции не обнаружено.

Таким образом, симметрийный анализ генетических текстов областей инициации репликации ДНК прокариот может быть использован для исследования их структуры, что позволяет считать построение симметрийных консенсусов эффективным инструментом для анализа функции нуклеотидных последовательностей.

Применение формального языка для описания orí, в котором подстроками являются значимые для функции orí симметричные структуры, обнаруженные в генетических текстах сайтов инициации репликации, и которые связаны небольшим набором отношений, позволило построить «формальный» образ orí, отвечающий требованиям к образу для распознавания.

Список литературы диссертационного исследования кандидат биологических наук Акберова, Наталья Ивановна, 1999 год

СПИСОК ЛИТЕРАТУРЫ

1. Александров А А., Голованов Е.И., Сприжицкий Ю.А. Основные функции прикладных программ анализа нуклеотидных и аминокислотных последовательностей // Теоретические исследования и банки данных по молекулярной биологии и генетике. Новосибирск, 1986. С.61-64.

2. Александров H.H., Каламбет Ю.А. Распознавание функциональных сигналов. // В сборнике Компьютерный анализ генетических текстов. Москва, "Наука", 1990, с.113-154.

3. Бородовский М.Ю., Певзнер П.А. Статистические методы анализа генетических текстов. // В сборнике Компьютерный анализ генетических текстов. Москва, "Наука", 1990, с.36-80.

4. Вайнштейн Б.К. Симметрия кристаллов. Методы структурной кристаллографии. Современная кристаллография. Т.1. М:Наука, 1979. 383с.

5. Горбань А.Н., Миркес Е.М., Попова Т.Г., Садовски М.Г. Сравнительная избыточность генов различных организмов и вирусов // Генетика - 1993 -т. 29 - № 9 - с. 1413-1419

6. Горелик A.JL, Скрипкин В.А. Методы распознавания.// Москва, «Высшая школа», 1989, 232 с.

7. Гусев В.Д., Куличков В.А., Чупахина О.М. Сложностный анализ генетических текстов.// Препринт, Институт Математики СО АН СССР, Новосибирск, 1989, 49 с.

8. Итоги науки и техники. Молекулярная биология.// ВИНИТИ М:1985, т.21,279 с.

9. Леонтьев А.Ю. Симметрия одноцепочечных молекул ДНК. // Биофизика - 1992-r.37-B.5-c.874.

Ю.Ратнер В.А. Сравнительная иерархическая структура генетического языка // Генетика - 1993 - т.29 - №5 - с.720-739

П.Ратнер В.А. Генетический текст: грамматика, семантика, эволюция //Генетика -1993 - т.29 - №5 - с.709-718

12.Соловьев В.В., Кель А.Э., Рогозин И.Б., Колчанов Н.А. Использование ЭВМ в молекулярной биологии. Введение в теорию генетических текстов.// Изд. НГУ, Новосибирск: 1987, 82 с.

13.Сприжицкий Ю.А., Нечипуренко Ю.Д., Александров А.А., Волькенштейн М.В. Закономерности сблоченности нуклеотидов в кодирующих и некодирующих областях последовательностей ДНК из различных организмов // Молекуляр. Биология - 1988 - т.22 - в.2 - с.338-356.

14.Франк-Каменецкий (ред.) Компьютерный анализ генетических текстов. //Москва, "Наука", 1990,267 с.

15.Allen G.C.,Kornberg, A. Assembly of the primosome of DNA replication in Escherichia coli // J. Biol. Chem. - 1993 - v. 268 - N 26 - pp 19204-19209.

16.Almagor H A Markov analysis of DNA sequences.// J Theor Biol - 1983 - v. 104- N4-pp 633-45

17.Altschul S.F., Gish W Local alignment statistics // Methods Enzymol. - 1996 -v.266 - pp 460-480

18.Arai, K. & Kornberg, A Unique primed start of phage phiX174 DNA replication and mobility of the primosome in a direction opposite chain synthesis // Proc. Natl. Acad. Sci. USA - 1981 - v. 78 - N 1 - pp 69-73.

19.Arai, K., Low, R., Kobori, J., Shlomai, J. & Kornberg,A. Mechanism of dnaB protein action. V. Association of dnaB protein, protein n', and other prepriming proteins in the primosome of DNA replication.// J. Biol. Chem. - 1981a - v. 256-N 10-pp 5273-5280

20.Arvidson D. N., Youderian, Schneider T. D., Stormo G. D. Automated Kinetic Assay of beta-galactosidase activity// BioTechniques -1991- v. 11- pp. 733-737

21.Asai T, M. Imai &amp; T. Kogoma DNA damage-inducible replication of the Escherichia coli chromosome is initiated at separable sites within the minimal oriC.// J Mol Biol - 1994 - v. 235 - N 5 - pp 1459-69

22.Asai T., Kogoma T. D-loops and R-loops: alternative mechanisms for the initiation of chromosome replication in Escherichia coli.// J. Bacteriol. -1994 -v. 176 -N 7 - pp 1807-1812

23.Asai T., Kogoma T. Roles of ravA, ruvC and recG gene functions in normal and DNA damage-inducible replication of the Escherichia coli chromosome // Genetics - 1994a - v. 137 - N 4 - pp 895-902

24.Atlung T, Lobner-Olesen A, Hansen FG. Overproduction of DnaA protein stimulates initiation of chromosome and minichromosome replication in Escherichia coli.// Mol Gen Genet -1987 - v. 206 - N 1 - pp 51-59

25.Audic S., Claverie J-M. Detection of eukaryotic promoters using Markov transition matrices// Computers Chem. - 1997 - v.21 - N 4 - pp 223-227

26.Audic S., Claverie J-M. Self-identification of protein-coding regions in microbial genomes // Proc Natl Acad Sci U S A - 1998 -v. 95 - N 3 - pp 10026-10031

27.Bahloul A, Meury J, Kern R, Garwood J, Guha S, Kohiyama M Co-ordination between membrane oriC sequestration factors and a chromosome partitioning protein, TolC [MukA] // Mol Microbiol - 1996 - v. 22 -N 2 - pp 275-282

28.Baker TA Replication initiation. A new controller in Escherichia coli.// Curr Biol - 1994 - v. 4 - N 10 - pp 945-946

29.Baker TA, Kornberg A Transcriptional activation of initiation of replication from the E. coli chromosomal origin: an RNA-DNA hybrid near oriC //Cell -1988-v. 55-N1 - pp 113-123

30.Baldi P, Chauvin Y, Hunkapiller T, McClure MA Hidden Markov models of biological primary sequence information. // Proc Natl Acad Sci U S A - 1994 -v. 91-N3-pp 1059-1063

31.Barrick D. , Villanueba K. , Childs J. , Kalil R. , Schneider T. D., Lawrence C. E., Gold L. , Stormo G. D Quantitative Analysis of Ribosome Binding Sites in E. coli.// Nucl. Acids Res - 1994 - v. 22 - N 7 - pp. 1287-1295

32.Bates D. B, T. Asai, Y. Cao, M. W. Chambers, G. W. Cadwell, E.Boye &amp; T. Kogoma. The DnaA box R4 in the minimal oriC is dispensable for initiation of Escherichia coli chromosome replication. // Nucleic Acids Res -1995 - v. 23 - N 16 - pp 3119-3125

33.Benbow RM, Zhao J, Larson DD On the nature of origins of DNA replication in eukaryotes. // Bioessays - 1992 - v. 14 - N 10 - pp 661-670

34.Berg O.G., von Hippel P.H. Selection of DNA binding sites by regulatory proteins.//Trends Biochem Sei. - 1988 - v. 13 - N 6 - pp 207-211.

35.Bogan JA, Helmstetter CE DNA sequestration and transcription in the oriC region of Escherichia coli.// Mol Microbiol - 1997 - v. 26 - N 5 - pp 889-896

36.Bogan JA, Helmstetter CE mioC transcription, initiation of replication, and the eclipse in Escherichia coli. // J Bacteriol - 1996 - v. 178 - N 11 - pp 3201-3206

37.Borodovsky , Mclninch J GENEMARK - Parallel gene recognition for both DNA strands. // Comp. Chem. - 1993 - v.17 - pp 123-133.

38.Boulikas T Common structural features of replication origins in all life forms. // J Cell Biochem - 1996 - v. 60 - N 3 - pp 297-316

39.Boulikas T Homeodomain protein binding sites, inverted repeats, and nuclear matrix attachment regions along the human beta-globin gene complex.// J Cell Biochem - 1993 - v. 52 - N 1 - pp 23-36

40.Boulikas T, Kong CF Multitude of inverted repeats characterizes a class of anchorage sites of chromatin loops to the nuclear matrix // J Cell Biochem -1993 -v. 53 - N 1 - pp 1-12

41.Boye E, Stokke T, Kleckner N, Skarstad K Coordinating DNA replication initiation with cell growth: differential roles for DnaA and SeqA proteins.// Proc Natl Acad Sei U S A - 1996 - v. 93 - N 22 - pp 12206-12211

42.Bramhill D.,Kornberg, A. Duplex opening by dnaA protein at novel sequences in initiation of replication at the origin of E. coli.// Cell - 1988 - v. 52 - N 5 - pp 743-755

43.Brendel V., BeckmannJ.S. , Trifonov E.N. Linguistics of nucleotide sequences: morphology and comparison of vocabularies // J.Biomol. Struct. Dyn. - 1986 - v.4 - pp. 11-22.

44.Brendler T, Abeles A, Austin S A protein that binds to the PI origin core and the oriC 13mer region in a methylation-specific fashion is the product of the host seqA gene. // EMBO J - 1995 - v. 14 - N 16 - pp 4083-4089

45.Brewer B. J., Fangman W. L.Initiation at closely spaced replication origins in a yeast chromosome. // Science - 1993 - v. 262 - pp 1728-1731

46.Brewer B.J., Fangman W.L. Mapping replication origins in yeast chromosomes.// Bioessays -1991- v. 13-N7-pp 317-322

47.Bucher P. Weight matrix description of four eukaryotic RNA polymerasell promoter elements derived from 502 unrelated promoter sequences.// J. Mol.Biol. - 1990 - v. 212 - pp 563-578

48.Calcutt MJ, Schmidt FJ Conserved gene arrangement in the origin region of the Streptomyces coelicolor chromosome.// J Bacterid - 1992 - v. 174 - N 10, pp. 3220-3226

49.Cardon LR, Stormo GD Expectation maximization algorithm for identifying protein-binding sites with variable lengths from unaligned DNA fragments.//J Mol Biol - 1992 - v.223 - N 1 - pp 159-170

50.Cassler MR, Grimwade JE, Leonard AC Cell cycle-specific changes in nucleoprotein complexes at a chromosomal replication origin. // EMBO J -1995 - v. 14 - N 23 - pp 5833-5841

51.Chen Q.K., Hertz G.Z., Stormo G.D PromFD 1.0: a computer program that predicts eukaryotic pol II promoters using strings and IMD matrices 7/ Comput Appl Biosci - 1997 - v. 13 - N 1 - pp 29-35

52.Chen QK, Hertz GZ, Stormo GD MATRIX SEARCH 1.0: a computer program that scans DNA sequences for transcriptional elements using a

database of weight matrices. // Comput Appl Biosci - 1995 - v. 11 - N5-pp 563-566

53.Cleary JM, Smith DW, Harding NE, Zyskind JW Primary structure of the chromosomal origins (oriC) of Enterobacter aerogenes and Klebsiella pneumoniae: comparisons and evolutionary relationships.// J Bacteriol - 1982 -v.150 - N 3 - pp 1467-1471

54.Cornish-Bowden A. // Nucl. Acids Res. - 1984 - v. 13 - pp 3021-3030

55.Coward E., Drablos F. Detecting periodic patterns in biological sequences //Biomformatics - 1998 - v. 14 - N 6 - pp 498-507

56.Crooke E, Castuma CE, Kornberg A The chromosome origin of Escherichia coli stabilizes DnaA protein during rejuvenation by phospholipids. // J Biol Chem - 1992 - v. 267 - N 24 - pp 16779-16782

57.Crooke E, Thresher R, Hwang DS, Griffith J, Kornberg A Replicatively active complexes of DnaA protein and the Escherichia coli chromosomal origin observed in the electron microscope. // J Mol Biol - 1993 - v. 233 - N 1 - pp 16-24

58.David K. Smith and Hong Xue A major component approach to presenting consensus sequences // Bioinformatics - 1998- V.14 - N 2 -.151-156

59.Day GR, Blake RD Statistical significance of symmetrical and repetitive segments in DNA // Nucleic Acids Res - 1982 - v. 10 - N 24 - pp 8323-8339

60.Dean FB, ODonnell M Two steps to binding replication origins? DNA-protein interactions.// Curr Biol - 1996 - v. 6 - N 8 - pp 931-934

61.Dijkwel P. A. , Hamlin J. L. The Chinese hamster dihydrofolate reductase origin consists of multiple potential nascent-strand start sites.// Mol. Cell. Biol. - 1995 - v. 15-pp 3023-3031

62.Eckdahl TT, Anderson JN Conserved DNA structures in origins of replication. // Nucleic Acids Res - 1990 - v. 18 - N 6 - ppl609-1612

63.Fantes PA, Grant WD, Pritchard RH, Sudbery PE, Wheals AE The regulation of cell size and the control of mitosis. // J Theor Biol - 1975 - v. 50 - N 1 - pp 213-244

64.Fickett JW Finding genes by computer: the state of the art. // Trends Genet -1996-v. 12-pp 316-320

65.Fields D.S., He Y., Al-Uzri A.Y., Stormo G.D Quantitative specificity of the Mnt repressor.// J Mol Biol - 1997 - v.271 - N 2 - pp 178-194

66.Fields DS, Stormo GD Quantitative DNA sequencing to determine the relative protein-DNA binding constants to multiple DNA sequences. // Anal Biochem -1994-v.219-N2-pp 230-239

67.Frith M., Edwards Y. J. K., Bishop M. J. Raising the curtain on Theatre: a new tool for the comparative investigation of functional features in DNA sequences.// UK HGMP Resource Centre Genome News Winter - 1997- pp. 15-17.

68.Froelich JM, Phuong TK, Zyskind JW Fis binding in the dnaA operon promoter region // J Bacterid - 1996 - v. 178 - N20 - pp. 6006-6012

69.Fsihi H, De Rossi E, Salazar L, Cantoni R, Labo M, Riccardi G, Takiff HE Eiglmeier K, Bergh S, Cole ST Gene arrangement and organization in a approximately 76 kb fragment encompassing the oriC region of the chromosome of Mycobacterium leprae // Microbiology - 1996 - v. 142 - Pt 11 -pp 3147-3161

70.Fujita MQ, Yoshikawa H, Ogasawara N Structure of the dnaA and DnaA-box region in the Mycoplasma capricolum chromosome: conservation and variations in the course of evolution.// Gene - 1992 -v.llO-Nl - pp 17-23

71.Fujita MQ, Yoshikawa H, Ogasawara N Structure of the dnaA region of Micrococcus luteus: conservation and variations among eubacteria.// Gene -1990-v. 93-N 1 - pp 73-78

72.Fujita MQ, Yoshikawa H, Ogasawara N Structure of the dnaA region of Pseudomonas putida: conservation amongthree bacteria, Bacillus subtilis, Escherichia coli and P. putida. // Mol Gen Genet - 1989 - v. 215-N3-pp 381-387

73.Fukuoka T., S. Moriya, H. Yoshikawa N. Ogasawara Purification and characterization of an initiation protein for chromosomal replication, DnaA, in Bacillus subtilis.//J Biochem - 1990 - v. 107 - pp 732-739

74.Fuller, R.S., Funnell B.E. & Kornberg, A. The dnaA protein complex with E. coli chromosomalorigin [oriC] and other sites.// Cell - 1984 - v. 38 - N 3 - pp 889-900

75.Fuller, R.S., Kaguni, J.M. & Kornberg, A. Enzymatic replication of the origin of the Escherichia coli chromosome.// Proc. Natl. Acad. Sei. USA - 1981 - v. 78 - N 12 - pp 7370-7374

76.Gasser SM Replication origins, factors and attachment sites. // Curr Opin Cell Biol. - 1991 - v 3 - N 3 - pp 407-413.

77.Gencheva M, Anachkova B Clusters of modular regulatory elements at DNA replication origins.// Gene - 1995 - v. 164 - N 2 - pp 283-287

78.Gilbert DM, Miyazawa H, DePamphilis ML Site-specific initiation of DNA replication in Xenopus egg extract requiresnuclear structure. // Mol Cell Biol -1995 - v. 15 - pp 2942-2954

79.Gille H, Egan JB, Roth A, Messer W The FIS protein binds and bends the origin of chromosomal DNA replication, oriC, of Escherichia coli.// Nucleic Acids Res -1991 - v. 19 - N 15 - pp 4167-4172

80.Gille H, Messer W Localized DNA melting and structural pertubations in the origin of replication, oriC, of Escherichia coli in vitro and in vivo. // EMBO J -1991 - v. 10 - N 6 - pp 1579-1584

81.Gordenin DA, Lobachev KS, Degtyareva NP, Malkova AL, Perkins E, Resnick MA Inverted DNA repeats: a source of eukaryotic genomic instability.// Mol Cell Biol - 1993 - v. 13 - N 9 - pp 5315-22

82.Hamlin J. L.,. Dijkwel On the nature of replication origins in higher eukaryotes. // Curr Opin Genet Dev - 1995 - v. 5 - N 2 - pp 153-161

83.Hansen FG, Christensen BB, Atlung T The initiator titration model: computer simulation of chromosome and minichromosome control.// Res Microbiol -1991 - v. 142 - N 2-3 - pp 161-167

84.Herrick J, Kern R, Guha S, Landoulsi A, Fayet O, Malki A, Kohiyama M Parental strand recognition of the DNA replication origin by the outer membrane in Escherichia coli. // EMBO J. - 1994 - v. 13-N19-pp 46954703

85.Herrick J, Kohiyama M, Atlung T, Hansen FG The initiation mess? // Mol Microbiol - 1996 - v. 19 - N 4 - pp 659-666

86.Hertz GZ, Hartzell GW 3d, Stormo GD Identification of consensus patterns in unaligned DNA sequences known to be functionally related.//Comput Appl Biosci -1990 - v. 6 - N 2 - pp 81-92

87.Hertz GZ, Stormo GD Escherichia coli promoter sequences: analysis and prediction.// Methods Enzymol. - 1996 - v.273 - pp 30-42

88.Hiasa H, Marians KJ Fis cannot support oriC DNA replication in vitro.// J Biol Chem - 1994 - v. 269 - N 40 - pp 24999-5003

89.Hiasa H, Marians KJ Primase couples leading- and lagging-strand DNA synthesis from oriC.// Biol Chem - 1994 - v.269 - N 8 - pp 6058-6063

90.Hiraga S, Ichinose C, Niki H, Yamazoe M Cell cycle-dependent duplication and bidirectional migration of SeqA-associated DNA-protein complexes in E. coli. //Mol Cell 1998 - v.l - N 3 - pp 381-387

91.Hirosawa M, Totoki Y, Hoshida M, Ishikawa M. Comprehensive study on iterative algorithms of multiple sequence alignment. // Comput Appl Biosci -1995 -v. 11-Nl-pp 13-18

92 .Holz A, Schaefer C, Gille H, Jueterbock WR, Messer W Mutations in the DnaA binding sites of the replication origin of Escherichia coli.// Mol Gen Genet - 1992 - v. 233 - N 1-2 - pp 81-88

93 .Hong X Activation of stable DNA replication in rapidly growing Escherichia coli at the time of entry to stationary phase.// Mol Microbiol - 1996 - v. 21 - N 5-pp953-961

94.Hong X. Absence of a direct role for RNase HI in initiation of DNA replication at the oriC site on the Escherichia coli chromosome. // J Bacteriol -1993 - v. 175 - N 20 - pp.6731-6734

95.Hong X. Escherichia coli RecG and RecA proteins in R-loop formation I I EMBO J. - 1995 - v. 14 - N 10 - pp 2385-2392

96.Hong X., G. W. Cadwell &amp; T. Kogoma Escherichia coli RecG and RecA proteins in R-loop formation. // EMBO J. - 1995 - v. 14 - pp 2385-2392

97 .Hsu J, Bramhill D, Thompson CM Open complex formation by DnaA initiation protein at the Escherichia coli chromosomal origin requires the 13-mers precisely spaced relative to the 9-mers.// Mol Microbiol - 1994 - v.l 1 - N 5 - pp 903-911

98.Huberman J.A. Prokaryotic and Eukaryotic Replicons // Cell - 1995 - v. 82 -pp. 535-542

99.Hwang DS, Kornberg A 1992a Opposed actions of regulatory proteins, DnaA and IciA, in opening the replication origin of Escherichia coli.// J.Biol.Chem. -1991a - v.267 - N 32 - pp. 23087-23091

100.Hwang DS, Kornberg A Opening of the replication origin of Escherichia coli by DnaA protein with protein HU or IHF. // J.Biol.Chem. - 1991 - v.267 - N 32 - pp. 23083-23086

101.Jacob F., Brenner S., Cuzin F. On the regulation of DNA replication in bacteria.//Cold Spring Harbor Symp. Quant.Biol. - 1963 - v.28 - pp 329-331

102.Jakimowicz D, Majka J, Messer W, Speck C, Fernandez M, Martin MC, Sanchez J, Schauwecker F, Keller U, Schrempf H, Zakrzewska-Czerwinska. Structural elements of the Streptomyces oriC region and their interactions with the DnaA protein.// J.Microbiology - 1998 - v. 144 - Pt 5 - pp 1281-1290

103.Jonsson J, Norberg T, Carlsson L, Gustafsson C, Wold S Quantitative sequence-activity models (QSAM)~tools for sequence design. // Nucleic Acids Res. - 1993 - v.21 - N 3 - pp 733-739

104.Jurka J., Klonowski P., Dagman V., Pelton P. Censor - a program for identification and elimination of repetitive elements from DNA sequences. // Comp. Chem. - 1996 - v. 20 - pp 119-121.

105.Kaguni JM, Fuller RS, Kornberg A Enzymatic replication of E. coli chromosomal origin is bidirectional.// Nature - 1982 - v. 296 - N 5858 - pp 623-627

106.Kaguni JM, Kornberg A Replication initiated at the origin (oriC) of the E. coli chromosome reconstituted with purified enzymes.// Cell - 1984 - v.38 - N 1 - pp 183-190

107.Kaguni JM, Kornberg A Topoisomerase I confers specificity in enzymatic replication of the Escherichia coli chromosomal origin. //J Biol Chem. - 1984a - V.259 -N 13-pp 8578-8583

108.Kano Y., Ogawa T., Ogura T., Hiraga S., Okazaki T., Imamoto F. Participation of the histone-like protein HU and of IHF in minichromosomal maintenance in Escherichia coli. // Gene -1991 - v. 103 - N 1 - pp 25-30

109.Karlin S., Brendel V. Chance and statistical significance in protein and DNA sequence analysis.// Science - 1992 - v.257 - N 5066 - pp.39-49.

110.Kel OV, Romaschenko AG, Kel AE, Wingender E, Kolchanov NA A compilation of composite regulatory elements affecting gene transcription in vertebrates.// Nucleic Acids Res - 1995 - v.23 - N 20 - pp 4097-4103

111 .Kelly C, Rice J Modeling nucleotide evolution: a heterogeneous rate analysis. // Math Biosci - 1996 - v. 133 - N 1 - pp 85-109

112.Kelman Z. & M. O'Donnell DNA replication: enzymology and mechanisms.// Curr Opin Genet Dev - 1994 - v.4 - N 2 - pp 185-195

113.Kitagawa R, Mitsuki H, Okazaki T, Ogawa T. A novel DnaA protein-binding site at 94.7 min on the Escherichia coli chromosome.// Mol Microbiol - 1996 -V.19-N 5-pp 1137-1147

114.Kitsberg D, Selig S, Keshet I, Cedar H Replication structure of the human beta-globin gene domain. //Nature - 1993 - v.366 - pp 588-590

115.Kogoma T, 1993 Requirement of homologous recombination functions for viability of the Escherichia coli cell that lacks RNase HI and exonuclease V activities.// Biochimie - 1993 - v. 75 - N 1-2 - pp 89-99

1 lö.Kogoma T, Barnard K. G.; Hong X. RecA, Tus protein and constitutive stable DNA replication in Escherichia coli rnhA mutants. // Mol Gen Genet -1994 - v.244 - pp 557-562

117.Kogoma T. RNaseH-defective mutants of Escherichia coli. // J. Bacteriol. -1986 - v. 166 - N 2 - pp 361-363.

118.Kogoma T. RecA, Tus protein and constitutive stable DNA replication in Escherichia coli rnhA mutants. // Mol Gen Genet - 1994 - v. 244 - N 5 - pp 557-562

119.Kogoma, T., Lark, K.G. Characterization of the replication of Escherichia coli DNA in the absence of protein synthesis: stable DNA replication. // J. Mol.Biol. - 1975 - v.94 - N 2 - pp 243-256

120.Kolchanov NA, Rogozin IB, Solov'ev VV Theoretical analysis of mechanisms of spontaneous and induced mutations in DNA based on repeated sequences. //Genetika - 1989 - v. 25 - N 9 - pp 1690-1698

121.Kowalski D., Eddy M.J. The DNA unwinding element: a novel, cis-acting component that facilitates opening of the E.coli replication origin //EMBO J. -1989 - v.8 - N 13 - pp.4335-4344

122.Kowalski D., Natale D.A., Eddy M.J Stable DNA unwinding, not "breathing," accounts for single-strand-specific nuclease hypersensitivity of specific A+T-rich sequences. IIProc Natl Acad Sei U S A - 1988 - v.85 - N 24 - pp 9464-9468

123.Krajewski WA, Razin SV Organization of specific DNA sequence elements in the region of the replication origin and matrix attachment site in the chicken alpha-globin gene domain.// Mol Gen Genet - 1992 - v.235 - N 2-3 - pp 381388

124.Kraus R.J. et al. Experimentally determined weight matrix definitions of the initiator and TBP binding site elements of promoters. //Nucleic Acids Res. -1996-V.24-N 8-pp 1531-1539.

125.Kubota T, Katayama T, Ito Y, Mizushima T, Sekimizu K Conformational transition of DnaA protein by ATP: structural analysis of DnaA protein, the

initiator of Escherichia coli chromosome replication.// Biochem Biophys Res Commun - 1997 - v.232 - N 1 - pp 130-135

126.Kurokawa K, Mizushima T, Kubota T, Tsuchiya T, Katayama T, Sekimizu K A stimulation factor for hydrolysis of ATP bound to DnaA protein, the initiator of chromosomal DNA replication in Escherichia coli.//Biochem Biophys Res Commun - 1998 - v. 243 - N 1 - pp 90-95

127.Landoulsi A, Hughes P, Kern R, Kohiyama M dam methylation and the initiation of DNA replication on oriC plasmids.// Mol Gen Genet - 1989 -V.216-N 2-3-pp 217-223

128.Langer U, Richter S, Roth A, Weigel C, Messer W A comprehensive set of DnaA-box mutations in the replication origin, oriC, of Escherichia coli // Mol Microbiol. - 1996 - v. 21 - N 2 - pp 301-311

129.Lawrence, C.E., Altschul, S.F., Boguski, M.S., Liu, J.S.,Neuwald, A.F., Wootton, J.C. Detecting Subtle Sequence signals: A Gibbs Sampling Strategy for Multiple Alignment. //Science -1993 - v.262 - pp 208-214.

130.Leach DR Long DNA palindromes, cruciform structures, genetic instability and secondary structure repair. //Bioessays - 1994 -v.l6-N12-pp 893-900

131.Lee YS, Kim H, Hwang DS Transcriptional activation of the dnaA gene encoding the initiator for oriC replication by IciA protein, an inhibitor of in vitro oriC replication in Escherichia coli. //Mol Microbiol - 1996 -V.19-N2 -pp 389-396

132.Lee, E.H., Masai, H., Allen, J.G.C., Kornberg, A. The priA gene encoding the primosomal replicative n' protein of Escherichia coli. // Proc. Natl. Acad. Sei. USA - 1990 - v. 87 - N 12 - pp 4620-4624

133.Lipman, D.J., Altschul, S.F.,Kececioglu, J.D. A tool for multiple sequence alignment.// Proceedings of the National Academy of Sciences USA - 1989-v.86-pp 4412-4415.

134.Lobry JR A simple vectorial representation of DNA sequences for the detection ofreplication origins in bacteria. // Biochimie - 1996 - v.78 - N 5 - pp 323-326

135.Lu M., Campbell J.L., Boye E., Kleekner N. SeqA: a negative modulator of replication initiation in E. coli.// Cell - 1994 - v. 77 - N 3 - pp 413-426

136.Maaloe, Kjeldgaard, 1966 uht. Samitt et al. 1989

137.Magee T.R., Asai T., Malka D., Kogoma T. DNA damage-inducible origins of DNA replication in Escherichia coli // EMBO J. - 1992 - v. 11 - Nil - pp 4219-4225

138.Mahafly JM, Zyskind JW A model for the initiation of replication in Escherichia coli. //J Theor Biol - 1989 - v. 140 - N 4 - pp 453-477

139.Marahrens Y. , Stillman B. Replicator dominance in a eukaryotic chromosome. // EMBO J. - 1994 - v. 13 - pp 3395-3400

140.Marczynski GT, Shapiro L Bacterial chromosome origins of replication.// Curr Opin Genet Dev - 1993 - v.3 - N 5 - pp 775-782

141.Marczynski GT, Shapiro L The control of asymmetric gene expression during Caulobacter cell differentiation.// Arch Microbiol - 1995 - v. 163 - N 5 -pp 313-321

142.Margulies C, Kaguni JM Ordered and sequential binding of DnaA protein to oriC, the chromosomal origin of Escherichia coli. // J Biol Chem - 1996 -v.271-N29-pp 17035-17040

143 .Marians KJ Prokaryotic DNA replication.// Annu Rev Biochem - 1992 - v. 61 - pp 673-719

144.Marszalek J, Kaguni JM DnaA protein directs the binding of DnaB protein in initiation of DNA replication in Escherichia coli. // J Biol Chem - 1994 - v. 269 - N 7 - pp 4883-4890

145.Marszalek J, Zhang W, Hupp TR, Margulies C, Carr KM, Cherry S, Kaguni JM Domains of DnaA protein involved in interaction with DnaB protein, and in unwinding the Escherichia coli chromosomal origin. // J Biol Chem - 1996 -v.271 -N31 - pp 18535-18542

146.Martingale C., Konopka A.K. Oligonucleotide frequencies in DNA follow a Yule distribution//Computers and Chemistry - 1996 - v.20 - N 1 - pp. 45 - 38.

147.Masai H., Arai K. DnaA- and PriA-dependent primosomes: two distinct replication complexes for replication of Escherichia coli chromosome // Frontiers in Bioscience - 1996 - v.l, d48-58, March 1, 1996 on-line http://genome.eene.iT/bioscience/1996/vl/d/masai/htmls

148.Masai H.,Arai K. DnaA-dependent assembly of the ABC primosome at the A site, a single-stranded DNA hairpin containing a dnaA box. // Eur. J. Biochem. - 1995 - v. 230 - N 2 - pp. 384-395

149.Matsui M., Oka A., Takanami M., Yasuda S., Hirota Y. Sites of dnaAprotein-binding in the replication origin of the E. coli K-12 chromosome. // J.Mol.Biol - 1985 - v.l84 - N 3 - pp 529-533

150.Meijer M, Beck E, Hansen FG, Bergmans HE, Messer W, von Meyenburg K, Schaller H Nucleotide sequence of the origin of replication of the Escherichia coli K-12 chromosome.// Proc Natl Acad Sei U S A - 1979 - v.76 -N 2 - pp 580-584

151.Messer W, Egan B, Gille H, Holz A, Schaefer C, Woelker B The complex of oriC DNA with the DnaA initiator protein. // Res Microbiol - 1991 - v. 142 - N 2-3-pp 119-125

152.Messer W, Hartmann-Kuhlein H, Langer U, Mahlow E, Roth A, Schaper S, Urmoneit B, Woelker B The complex for replication initiation of Escherichia coli. //Chromosoma - 1992 - v. 102 - N 1 - S1-S6

153.Messer W, Seufert W, Schaefer C, Gielow A, Hartmann H, Wende M Function of the DnaA protein of Escherichia coli in replication and transcription // Biochim Biophys Acta - 1988 - v.951 - N 2-3 - pp.351-358

154.Mirkes E.M., PopovaT.G., Sadovsky M.G. Investigating statistical properties of genetic texts: a new approach //Adv. in Modelling and Analysis -1993 - ser. B. 27 - 1L(13.

155.Mizushima T, Katayama T, Sekimizu K Effect on DNA topology by DnaA protein, the initiation factor of chromosomal DNA replication in Escherichia coli. // Biochemistry - 1996 - v.35 - N 35 - pp 11512-11516

156.Mizushima T, Nishida S, Kurokawa K, Katayama T, Miki T, Sekimizu K Negative control of DNA replication by hydrolysis of ATP bound to DnaA protein, the initiator of chromosomal DNA replication in Escherichia coli // EMBO J - 1997 - v.16 - N 12 - pp 3724-3730

157.Morgenstern B, Frech K, Dress A, Werner T DIALIGN: Finding local similarities by multiple sequence alignment. // Bioinformatics -1998-V.14-N 3 - pp 290-294

158.Moriya S, Atlung T, Hansen FG, Yoshikawa H, Ogasawara N Cloning of an autonomously replicating sequence (ars) from the Bacillus subtilis chromosome. //Mol Microbiol - 1992 - v.6 - N 3 - pp 309-315

159.Moriya S, Ogasawara N Mapping of the replication origin of the Bacillus subtilis chromosome by the two-dimensional gel method. // Gene - 1996 - v. 176-N 1-2-pp 81-84

160 .Morris DW, Kjeldgaard NO Evidence for the non-co-ordinate regulation of ribonucleic acid synthesis in stringent strains of Escherichia coli. //J Mol Biol -1968 -v. 31 - N1 - pp 145-148

161.Mulligan M.E., Hawley D.K., McClure W.R. Escherichia coli promoter sequences predict in vitro RNA polymerase selectivity // Nucleic Acids Res. -1984-v. 12-Nl-pp 789-800.

162.Muzi-Falconi M., Brown G.W., Kelly T.J DNA replication: Controlling initiation during the cell cycle.//Current Biology - 1996 - v.6 - N 3 - pp 229233.

163.Nobrega FG, Tzagoloff A Assembly of the mitochondrial membrane system. DNA sequence and organization of the cytochrome b gene in Saccharomyces cerevisiae D273-10B. //J Biol Chem. - 1980 - v.255 - N 20 - pp 9828-9837.

164.Ogasawara N, Moriya S, Yoshikawa H Initiation of chromosome replication: structure and function of oriC and DnaA protein in eubacteria. // Res Microbiol - 1991 -V.142-N 7-8- pp 851-859

165.0gasawara N, Yoshikawa H Genes and their organization in the replication origin region of the bacterial chromosome.// Mol Microbiol - 1992 - v.6 - N 5 -pp 629-634

166.0hno S Grammatical analysis of DNA sequences provides a rationale for the regulatory control of an entire chromosome.// Genet Res - 1990 - v.56 - pp 115-120

167.Oka A, Sugimoto K, Takanami M, Hirota Y Replication origin of the Escherichia coli K-12 chromosome: the size and structure of the minimum DNA segment carrying the information for autonomous replication.// Mol Gen Genet -1980 - v. 178 - N 1 - pp 9-20

168.0ka A., Sasaki H., Sugimoto K., Takanami M. Sequence organization of replication origin of the E.coli K-12 chromosome // J.Mol.Biol. - 1984 - v.176 - N 4 - pp 443-458

169.Papp P. P. , Chattoraj D. K. , Schneider T. D. Information Analysis of Sequences that Bind the Replication Initiator RepA// J. Mol. Biol. - 1993 - v. 233 - N2-pp. 219-230

170.Parekh BS, Hatfield GW Transcriptional activation by protein-induced DNA bending: evidence for a DNA structural transmission model.// Proc Natl Acad SciUSA - 1996-v.93-N3-pp 1173-1177

171.Pearson CE, Sinden RR Trinucleotide repeat DNA structures: dynamic mutations from dynamic DNA.// Curr Opin Struct Biol - 1998 - v.8 - N 3 - pp 321-330

172.Pearson CE, Zorbas H, Price GB, Zannis-Hadjopoulos M Inverted repeats, stem-loops, and cruciforms: significance for initiation of DNA replication.// J Cell Biochem - 1996 - v.63 - N 1 - pp 1-22

7 73.Pearson W.R., Lipman J.D. Improved tools for biological sequence comparison // Proc.Natl.Acad.Sci.USA - 1988 - v. 85 - pp 2444-2448

/74. Pearson WR Using the FASTA program to search protein and DNA sequence databases.// Methods Mol Biol - 1994 - v. 25- pp 365-89

175. Pedersen AG, Baldi P, Bnmak S, Chauvin Y Characterization of prokaryotic and eukaryotic promoters using hidden Markov models.// Ismb 1996;4:182-191

776.Pesole G, Attimonelli M, Saccone C Linguistic approaches to the analysis of sequence information.// Trends Biotechnol - 1994 -v,12-N10-pp 401-408

177.Pevzner P.A., Borodovski M.Yu., Mironov A.A. 1. The significance of deviation from mean statistical characteristics and prediction of the frequency of occurences of words // J. Biomol. Struct. Dyn. - 1989 - v. 6 - pp. 10131026.

178.Pinder DJ, Blake CE, Leach DRF DIR: a novel DNA rearrangement associated with inverted repeats.// Nucleic Acids Res - 1997 - v.25 - N 3 - pp 523-529

179.Pinder DJ, Blake CE, Lindsey JC, Leach DR Replication strand preference for deletions associated with DNA palindromes. // Mol Microbiol - 1998 - v. 28-N4-pp 719-727

180.Polaczek P, Kwan K, Campbell JL Unwinding of the Escherichia coli origin of replication (oriC) can occur in the absence of initiation proteins but is stabilized by DnaA and histone-like proteins IHF or HU. // Plasmid - 1998 -V.39-N1 - pp 77-83

181.Polaczek P, Kwan K, Liberies DA, Campbell JL Role of architectural elements in combinatorial regulation of initiation of DNA replication in Escherichia coli. //Mol Microbiol - 1997 - v.26 - N 2 - pp 261-275

182.Ponomarenko MP, Kolchanova AN, KolchanovNA Generating programs for predicting the activity of functional sites.//J Comput Biol - 1997 - v.4 - N 1 -pp 83-90

183.Popov O., Segal D.M., Trifonov E.N. Linguistic complexity of protein sequences as compared to texts of human languages //Biosystems - 1996 - v.38 -N1 - pp 65-74

184.Prestridge D. S., Stormo'GSignal Scan 3.0 - New database and program features.// Comp. Appl. Biosciences -1993 - v. 9 - pp 113-115.

185.Pritchard et al, 1969 mrr. no Samitt et al. 1989

186.Qin MH, Madiraju MV, Zachariah S, Rajagopalan M Characterization of the oriC region of Mycobacterium smegmatis.// Bacteriol - 1997 - v. 179 - N 20 -pp 6311-6317

187.Quandt K, Frech K, Karas H, Wingender E, Werner T Matlnd and Matlnspector: new fast and versatile tools for detection of consensus matches in nucleotide sequence data. // Nucleic Acids Res - 1995 - v.23 - N 23 - pp 4878-4884

188.Ratner V.A. Theory of molecular genetic regulatory systems(MGRS): key ideas and results // Proceedings of the First International Conference of Bioinformatics of Genome Regulation and Structure (BGRS'98)(Novosibirsk-Altai Mountains, Russia, August 24-31, 1998) published by ICG,Novosibirsk, 1998, two volumes, 455 pp

189.Rein T, Zorbas H, DePamphilis ML Active mammalian replication origins are associated with a high-density cluster of mCpG dinucleotides.// Mol Cell Biol -1997 - v.17 - N 1 - pp 416-426

190.Roth A, Urmoneit B, Messer W Functions of histone-like proteins in the initiation of DNA replication at oriC of Escherichia coli. // Biochimie - 1994 -v.76-N 10-11 - pp 917-923

191.Roth A., Messer W. The DNA binding domain of the initiator protein DnaA. // EMBO J. - 1995 - v.14 - N 9 - pp 2106-2111

192.Salzberg SL, Salzberg AJ, Kerlavage AR, Tomb JF Skewed oligomers and origins of replication // Gene -1998 - v. 217 - pp 57-67

193.Samadashwily GM, Raca G, Mirkin SM Trinucleotide repeats affect DNA replication in vivo // Nat Genet - 1997 - v. 17 - N3 - pp 298-304

194.Samitt C.E.; Hansen F.G.; Miller J.; Schaecher M. In vivo studies of DnaA bending to the origin of replication of Escherichia coli // EMBO J - 1989 - v.8, N 3 - pp.989-993

195.Schaefer C, Messer W Directionality of DnaA protein/DNA interaction. Active orientation of the DnaA protein/dnaA box complex in transcription termination.// EMBO J. - 1989 - v. 8 - N 5 - pp 1609-1613 196.Schaefer C, Messer W DnaA protein/DNA interaction. Modulation of the

recognition sequence.// Mol Gen Genet. -1991 - v. 226 - N 1-2 - pp 34-40 197.Schaper S, Messer W Interaction of the initiator protein DnaA of Escherichia coli with its DNA target. //J Biol Chem - 1995 - v.270 - N 29 - pp 1762217626

198.Schneider T. D. , Stormo G. D. , Gold L. , Ehrenfeucht A. Information content of binding sites on nucleotide sequences..//J. Mol. Biol.- 1986 - v. 188- pp 415-431

199.Schneider T. D., Stephens R. M.Sequence Logos: A New Way to Display

Consensus Sequences //Nucl. Acids Res - 1990 - vl8 - pp 6097-6100 200.Searls DB Linguistic approaches to biological sequences.//Comput Appl

Biosci - 1997 - v. 13 - N 4 - pp 333-44 201. Sekimizu K., Bramhill D., Kornberg A. ATP activates dnaA protein in initiating replication of plasmids bearing the origin of the E. coli chromosome.// Cell - 1987 - v. 50 - N 2 - pp 259-265 202.Seufert W, Messer W Initiation of Escherichia coli minichromosome replication at oriC and at protein n' recognition sites. Two modes for initiating DNA synthesis in vitro.//EMBO J. - 1986 - v. 5 - N 12 - pp3401-3406 203.Seufert W, Messer W Start sites for bidirectional in vitro DNA replication inside the replication origin, oriC, of Escherichia coli. //EMBO J. - 1987 - v.6 -N8-pp2469-2472

204.Shafer DA, Seiles WD, Brenner JF Computer image analysis of variance between human chromosome replication sequences and G-bands.// Am J Hum Genet - 1982 - v.34 - N 2 - pp 307-321 205.Shlomai, J. & Kornberg, A. An Escherichia coli replication protein that recognizes a unique sequence within a hairpin region in phiX174 DNA.// Proc. Natl. Acad. Sei. USA - 1980 - v. 77 - N 2 - pp 799-803

206.Skarstad K, Thony B, Hwang DS, Kornberg A A novel binding protein of the origin of the Escherichia coli chromosome.// J Biol Chem. - 1993 - v. 68 - N 8 - pp 5365-5370

207.Skarstad K., Baker T.A., Kornberg A Strand separation required for initiation of replication at thechromosomal origin of E.coli is facilitated by a distant RNA-DNA hybrid.// EMBO J. -1990 - v. 9 - N 7 - pp 2341-2348 208.Skarstad K., Boye E. The initiator protein DnaA: evolution, properties and

function //BBA - 1994 - v. 1217 - N 2 - pp 111-130 209.Slater S., Wold S., Lu M., Boye E., Skarstad K., Kleckner N. E. coli SeqA protein binds oriC in two different methyl-modulated reactions appropriate to its roles in DNA replication initiation and origin sequestration. // Cell - 1995 -v. 82-N 6-pp 927-936 210.Smith DW, Yee TW, Baird C, Krishnapillai V Pseudomonad replication origins: a paradigm for bacterial origins? // Mol Microbiol. - 1991 - v.5 - N 11 -pp 2581-2587.

211. Smith RW, McAteer S, Masters M The coupling between ftsZ transcription and initiation of DNA replication is not mediated by the DnaA-boxes upstream of ftsZ or by DnaA //Mol Microbiol. - 1996 - v. 21 - N 2 - pp 361-372 212.Sompayrac L, Maaloe O Autorepressor model for control of DNA

replication.// Nat New Biol. - 1973 - v.241 - N 109 - pp 133-135 213.Sompayrac, Maaloe, 1973 uht. no Samitt et al. 1989 214.Spang R., Vingron M. Statistics of large-scale sequence searching //

Bioinformatics - 1998 - V 14 - N 3 - pp 279-284 215.Staden R Staden: analyzing sequences to find genes //Methods Mol Biol -

1994 -v.25- pp 113-24 216.Stillman B., S. P. Bell, A. Dutta & Y. Marahrens DNA replication and the cell cycle.//Ciba Found Symp - 1992 - v. 170 - pp 147-56 - discussion 156-160 217.Stormo GD Information Content and Free Energy in DNA-Protein Interactions.//! Theor Biol -1998 -v.195 - N1 - pp 135-137

Ill

218.Stormo GD Probing information content of DNA-binding sites. //Methods Enzymol. -1991 - v. 208 - pp 458-68

219.Stormo GD, Schneider TD, Gold L Quantitative analysis of the relationship between nucleotide sequence and functional activity. //Nucleic Acids Res. -1986-v. 14-N 16-pp 6661-6679

220.Suck D DNA recognition by DNase I //J Mol Recognit. - 1994 - v.7 - N 2-pp 65-70

221.Tabata S, Oka A, Sugimoto K, Takanami M, Yasuda S, Hirota Y The 245 base-pair oriC sequence of the E. coli chromosome directs bidirectional replication at an adjacent region. // Nucleic Acids Res - 1983 - v. 11 - N9-pp 2617-2626

222.Takeda Y, Harding NE, Smith DW, Zyskind JW The chromosomal origin of replication (oriC) of Erwinia carotovora. //Nucleic Acids Res. - 1982 - v.10 - N 8 - pp 2639-2650

223.Tasheva ES, Roufa DJ A mammalian origin of bidirectional DNA replication within the Chinese hamster RPS14 locus // Mol Cell Biol. - 1994 - v. 14 - pp 5628-5635

224.Tesfa-Selase F, Drabble WT Specific binding of DnaA protein to a DnaA box in the guaB gene of Escherichia coli K12. // Eur J Biochem - 1996 - v. 241 - N 2 - pp 411-416

225.The Abstracts of the Cold Spring Harbor Laboratory Meeting on Eukaryotic DNA Replication, September 3-7,1997, New York, 299 pp.

226.Tonges U, Perrey SW, Stoye J, Dress AW A general method for fast multiple sequence alignment. //Gene - 1996 - v. 172 - N 1 - pp 33-41

227.Trifmov E.N., Brendel V. Gnomic, a dictionary of genetic codes, Balaban publishers, 1986. 272p.

228.Uberbacher E.C., Xu Y., Mural R.J. Discovering and understanding genes in human DNA sequence using GRAIL // Methods Enzymol. - 1996 - v. 266 - pp 259-281

229.Ulyanov AV, Stormo GD Multi-alphabet consensus algorithm for identification of low specificity protein-DNA interactions //Nucleic Acids Res -1995 - v.23 - N B - pp 1434-1440

230.Vilu R Calculation of probabilities of random occurrence of different types of palindromes // J Theor Biol, 1983 - v. 102 - N 2 - pp 261-268

2 31.von Freiesleben U, Rasmussen KV, Schaechter M SeqA limits DnaA activity in replication from oriC in Escherichia coli. // Mol Microbiol. - 1994 - v. 14 - N 4 - pp 763-772

232.Waterman MS Multiple sequence alignment by consensus //Nucleic Acids Res- 1986- v.14 -N 22 - pp 9095-102

233.Wei T, et al. Interaction of the IciA protein with AT-rich regions in plasmid replication origins. //Nucleic Acids Res. - 1996 - v. 24 -N 10 - pp 1865-1872.

234.Wingender E., Kel A E., Kel O. V., Karas H., Heinemeyer T., Dietze P., Knul R.,. Romaschenko A G., Kolchanov N. ATRANSFAC, TRRD and COMPEL: Towards a federated database system on transcriptional regulation. //Nucl. Acids Res.- 1997 - v. 25 - pp 265-268.

235.Woelker B., Messer W, The structure of the initiation complex at the replication origin,oriC of Escherichia coli. // Nucleic Acids Res. - 1993 - v. 21 - N 22 - pp 5025-5033

236. Wold S, Boye E, Slater S, Kleckner N, Skarstad K Effects of purified SeqA protein on oriC-dependent DNA replication in vitro // EMBO J. - 1998 - v. 17 -N 14- pp 4158-4165

237.Wold S, Crooke E, Skarstad K The Escherichia coli Fis protein prevents initiation of DNA replication from oriC in vitro.// Nucleic Acids Res. - 1996 -v. 24-N 18-pp 3527-3532

238.YadaT, TotokiY, Masato W, Asai K, Nakai K Automatic extraction of motifs represented in the hidden Markov model from a number of DNA sequences //Bioinformatics - 1998 - V. 14 - N 4 - pp 317-325

239.Yee TW, Smith DW Pseudomonas chromosomal replication origins: a bacterial class distinct from Escherichia coli-type origins. // Proc Natl Acad Sei U S A - 1990 - v. 87 - N 4 - pp 1278-1282

240.Yoo SJ, Seol JH, Woo SK, Suh SW, Hwang DS, Ha DB, Chung CH Hydrolysis of the IciA protein, an inhibitor of DNA replication initiation, by protease Do in Escherichia coli. // FEBS Lett - 1993 - v. 327 - N 1 - pp 17-20

241.Yoshikawa H, Ogasawara N Structure and function of DnaA and the DnaA-box in eubacteria: evolutionary relationships of bacterial replication origins.// Mol Microbiol, 1991 - v.5 - N 11 - pp 2589-2597

242. Yuan Yan P., Eulensteini O, Vingron M., Bork P. Towards detection of orthologues in sequence databases // Bioinformatics - 1998 - v 14 - N 3 - pp 285-289

243.Yung BY, Crooke E, Kornberg A Fate of the DnaA initiator protein in replication at the origin of the Escherichia coli chromosome in vitro.// Biol Chem - 1990 - v. 265 - N 3 - pp 1282-1285

244.Zakrzewska-Czerwinska J Initiation of DNA replication in Streptomyces; organizational comparison of the oriC region in prokaryotic organisms // Postepy Hig Med Dosw. - 1995 - v. 49 - N 1 - pp 149-160

245.Zavitz, K.H. & Marians, K.J. Dissecting the functional role of PriA protein-catalyzed primosome assembly in Escherichia coli DNA replication.// Mol.Microbiol. -1991 - v. 5 - N 12 - pp 2869-2873

246.Zweiger G., Marczynski G.T., Shapiro L.A. Caulobacter DNA methyltransferase that functions only in the predivisional cell. // J. Mol.Biol -1994 - v. 235 - pp. 472-485

247.Zyskind JW, Cleary JM, Brusilow WS, Harding NE, Smith DW Chromosomal replication origin from the marine bacterium Vibrio harveyi functions in Escherichia coli: oriC consensus sequence. // Proc Natl Acad Sei U S A- 1983 - v. 80 -N 5 -pp 1164-1168

248.Zyskind JW, Smith DW DNA replication, the bacterial cell cycle, and cell growth.// Cell - 1992 - v. 69 - N 1 - pp 5-8

249.Zyskind JW, Smith DW Nucleotide sequence of the Salmonella typhimurium origin of DNA replication. // Proc Natl Acad Sci U S A - 1980 - v. 77 - N 5 -pp 2460-2464

250.Zyskind JW, Smith DW The bacterial origin of replication, oriC. // Cell -1986-v. 46 - N 4 - pp 489-490

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.