Теоретическое исследование сворачивания белков и пептидов тема диссертации и автореферата по ВАК РФ 03.00.02, доктор физико-математических наук Галзитская, Оксана Валериановна

  • Галзитская, Оксана Валериановна
  • доктор физико-математических наукдоктор физико-математических наук
  • 2006, Пущино
  • Специальность ВАК РФ03.00.02
  • Количество страниц 259
Галзитская, Оксана Валериановна. Теоретическое исследование сворачивания белков и пептидов: дис. доктор физико-математических наук: 03.00.02 - Биофизика. Пущино. 2006. 259 с.

Оглавление диссертации доктор физико-математических наук Галзитская, Оксана Валериановна



1.1. Проблема сворачивания белка

1.2. Открытие одностадийного перехода («все-или-ничего») в кинетике

1.3. Ядра сворачивания и скорости сворачивания: экспериментальные работы

1.4. Ядра сворачивания и скорости сворачивания: теоретические работы

1.5. Сворачивание Р-шпилек

1.6. Экспериментальные работы по сворачиванию Р-шпилек

1.7. Скорость сворачивания (3-структуры

1.8. Теоретические работы по сворачиванию Р-шпилек

1.9. Предсказание границ доменов

1.10. Предсказание нативно-развернутых участков белковой цепи

1.11. Предсказание амилоидогенных участков белковой цепи


2.1. Условия моделирования: точка термодинамического равновесия

2.2. Сеть путей разворачивания белка

2.3. Оценка свободной энергии

2.4. Переходные состояния на путях разворачивания белка

2.5. Анализ сети путей разворачивания белка при помощи метода динамического программирования: поиск оптимального переходного состояния.

2.6. Полный набор возможных переходных состояний, найденных методом динамического программирования

2.7. Ограничения, присущие поиску переходных состояний методом динамического программирования

2.8. Поиск переходных состояний методом Монте-Карло

2.9. Вычисление величин Ф для аминокислотных остатков

2.10. Исследованные белки

2.11. Сравнение экспериментально полученных величин Ф с вычисленными при помощи метода динамического программирования

2.12. Предсказание ядер сворачивания для белков, величины Ф для которых еще не исследованы экспериментально

2.13. Сравнение качества предсказаний ядер сворачивания при использовании метода динамического программирования и метода Монте-Карло


3.1. Введение

3.2. Создание базы белков, структура которых разрешена с помощью методов рентгеноструктурного анализа и ядерного магнитного резонанса

3.3. Контакты аминокислотных остатков в структурах белков, расшифрованных методами рентгеноструктурного анализа и ядерного магнитного резонанса

3.4. Анализ водородных связей в главной цепи для PC А- и ЯМР-структур

3.5. Сравнение ЯМР-структур до и после их уточнения


4.1. Оценка скорости сворачивания белка по вычисленной свободной энергии переходного состояния

4.2. Вычисление скоростей сворачивания методом Монте-Карло

4.3. Длина цепи - один из определяющих факторов для сворачивания белков, имеющих интермедиаты сворачивания




5.2. Энтропийная емкость для белков с заданной топологией.

5.3. Измеение величины барьера свободной энергии от изменения величины энтропийной емкости

5.4. Статистический анализ средней конформационной энтропии и среднего числа контактов на остаток для различных классов белков

5.5. Корреляция между скоростью сворачивания и энтропийной емкостью для различных структурных классов

5.6. Обсуждение



6.1 Введение

6.2 Моделирование сворачивания дистальной Р-шпильки из src SH домена методом молекулярной динамики

6.3 Моделирование сворачивания дистальной Р-шпильки из src SH домена методом мульти-канонического моделирования

7.2. Создание базы двухдоменных белков 168

7.3. Статистика аминокислотных остатков на границе доменов 169

7.4. Построение вероятностного профиля 170

7.5. Определение качества предсказания границ доменов нашим методом 171

7.6. Результаты и обсуждения 172



8.1. Создание баз данных белков 185

8.2. Наблюдаемое среднее число сближенных остатков в глобулярном состоянии на заданном расстоянии: средняя плотность окружения 187

8.3. Предсказания формы (свернутой или развернутой) нативного состояния белка 189

8.4. Предсказание разупорядоченных участков белковой цепи 190

8.5. Сравнение различных методов для предсказания разупорядоченных участков белковой цепи 193


9.1. Поиск амилоидогенных участков в белках и пептидах, связанных с амилоидными болезнями 196

9.2. Изменения скорости агрегации при мутациях в белках и пептидах 205 ЗАКЛЮЧЕНИЕ 207 РЕЗУЛЬТАТЫ И ВЫВОДЫ 212 ЦИТИРУЕМАЯ ЛИТЕРАТУРА 215


Проблема сворачивания белка была и остается центральным вопросом современной биофизики. Цель заключается в том, чтобы объяснить, каким образом белок из развернутой полипептидной цепи очень быстро и точно приобретает уникальную пространственную структуру, обеспечивающую выполнение им специфической функции.

Данная работа посвящена поиску и изучению основных принципов, которые лежат в основе кинетики и термодинамики сворачивания белков, котороые в свою очередь генерируют новый взгляд на факторы, контролирующие этот процесс. Понимание механизмов сворачивания белка имеет большое значение для фундаментальной науки, являясь ключом к пониманию принципов фунционирования живой материи.

Сворачивание белка - сложный процесс, в результате которого такая сложная система, как белковая молекула, состоящая из многих сотен или тысяч атомов, приобретает свою уникальную пространственную структуру. Помимо своей фундаментальной значимости, понимание механизма сворачивания белка имеет огромное значение для решения многих прикладных направлений, таких, как разработка лекарств и создание искусственных белков с заданными свойствами, предсказание пространственной структуры белка по его аминокислотной последовательности. Нарушение правильного сворачивания белков in vivo, а также часто сопутствующий этому процесс агрегации во многих случаях приводят к заболеваниям. Несмотря на многолетние усилия, решить этот вопрос полностью пока не удалось.

Белковая цепь в ходе самоорганизации проходит через множество промежуточных состояний. Ключевую роль в сворачивании белков играет «зародыш» его нативной структуры. Этот зародыш соответствует переходному, т.е. самому нестабильному состоянию на пути сворачивания. После образования структур, соответствующих переходным состояниям ("ядер сворачивания"), белковая цепь быстро приходит к своей нативной структуре. Знание структуры ядер сворачивания позволяет выяснить, образование каких структурных элементов лимитирует скорость сворачивания белковой молекулы.

В настоящее время существует единственный экспериментальный подход к поиску ядер сворачивания - Ф-анализ предложенный Фёрштом (Matouschek et al., 1990) и производные от него методы, суть которых сводится к введению в изучаемый белок множества точечных мутаций и выявлению тех аминокислотных остатков, замена которых меняет стабильность переходного состояния белка столь же сильно, как и стабильность нативного состояния. Экспериментально это проявляется в сильном изменении скорости сворачивания мутантного белка по сравнению с белком дикого типа, при малом изменении скорости разворачивания. Необходимо сделать очень большое количество одинарных и двойных мутаций в белке, чтобы получить достаточный набор данных для выделения входящих в «зародыш» остатков белковой цепи. Поэтому так важно изучение структуры зародыша сворачивания белка теоретическими методами.

Умение теоретически определять остатки белковой цепи, важные для формирования ядра сворачивания, позволило бы предварительно определять наиболее вероятный кинетический путь сворачивания, и, главное, выявить, образование каких структурных элементов является лимитирующей стадией в процессе сворачивания данной молекулы. Это, в свою очередь, позволит рационально планировать белково-инженерные работы по экспериментальному определению зародыша сворачивания белковой структуры. Поэтому главное направление диссертации состояло в развитие теории и методов для расчета ядер сворачивания и оценки времени сворачивания глобулярного белка по его пространственной структуре. При этом сравнительный анализ теоретических и экспериментальных данных позволяет судить о потенциальных возможностях развитых в данной работе подходов.

Изучение кинетических аспектов самоорганизации белков, поиск факторов, определяющих скорость сворачивания белковых молекул, как с простой, так и сложной кинетикой, остается актуальной проблемой физики белка. Скорость сворачивания белковой молекулы определяется барьером свободной энергии между нативным и развернутым состояниями. Величина этого барьера определяется сложной картиной различных взаимодействий в белке, величина которых напрямую связана со структурой белка. Поэтому другое направление диссертации было посвящено поиску факторов важных для сворачивания белков с простой и сложной кинетикой.

Предсказание структуры и функции белков является одним из главных направлений в структурной геномике. Особую роль в этом направлении играют развернутые участки белковой цепи, предсказание которых представляет особый интерес. На сегодняшний день известно более 100 белков с неупорядоченной структурой (Тотра, 2002; Uversky, 2002). Эти белки и домены развернуты в нативном состоянии (так называемые нативно-развернутые белки) или содержат большие неструктурированные участки белковой цепи. При этом оказывается, что функционально важные белковые участки часто находятся вне глобулярных доменов (Wright & Dyson, 1999; Dunker et al., 2002). Это противоречит классическому понятию, что белок обязательно должен быть глобулярным, чтобы быть функциональным.

Умение предсказывать неупорядоченные участки белковой структуры важно как для понимания функции белка, так и путей его сворачивания (Bracken et al., 2004; Fink, 2005; Dyson & Wright, 2005). Эти же данные необходимы и для дизайна белков de novo, где необходимо знать, какие особенности первичной структуры определяют, будет ли белок свернут или нативно-развернут. Поэтому одна из глав посвящена этому вопросу: предсказанию неструктурированных участкой белковой цепи.

В настоящее время структуры белков, определяемые с помощью рентгеноструктурного анализа (РСА), чаще используются как для теоретических расчетов так и для моделирования взаимодействий белковых структур, чем структуры, определяемые с помощью ядерного магнитного резонанса (ЯМР). Это связано с тем, что пока нет критерия оценки качества ЯМР структур, а «РСА-структура» считается более надежной и качественной для теоретических расчетов (Doreleijers et al., 1999a,b; Bastolla et al, 2001; Spronk et al., 2002), Кроме того, необходимо понимать, чем отличаются белковые структуры в кристалле от тех, что расшифрованы методом ЯМР, поскольку, как выяснилось, все вычислительные методы оценки стабильности белковых структур чувствительны к методу определения структуры белка. Одна из глав посвящена структурному сравнительному анализу белков, структура которых расшифрована методом рентгеноструктурного анализа и методом ядерного магнитного резонанса.

Одним из наиболее многообещающих теоретических подходов к исследованию самоорганизации белков является метод молекулярной динамики, который, в принципе, может позволить проследить динамику конформационных изменений пептида в водном окружении на атомном уровне. Однако на это требуется очень много компьютерного времени; к тому же любое явление, найденное при молекулярно-динамическом моделировании, требует проверки статистической достоверности, - а это, в свою очередь, требует гигантского компьютерного времени. Одна из глав диссертации (глава 6) посвящена моделированию сворачивания пептидов с помощью метода молекулярной динамики и мульти-канонического моделирования, который хорошо дополняет метод молекулярной динамики: не воспроизводя кинетику процесса, он позволяет исследовать большую выборку точек конформационного пространства без затрат времени на преодоление энергетических ловушек.

Наряду с проблемой предсказания пространственной структуры белка, остро стоит проблема предсказания границ доменов по аминокислотной последовательности, в связи с тем, что число аннотированных последовательностей белков растет значительно быстрее, чем число расшифрованных пространственных структур. В главе 7 рассматривается эта проблема.

Процесс образования амилоидных фибрилл тесно связан с механизмом сворачивания белковой цепи в нативную структуру. Так как нативная структура есть результат баланса между конформационной энтропией и энергией взаимодействий аминокислотных остатков, то сбой в одной из этих составляющих будет приводить к неправильному сворачиванию белков, а в худшем варианте, к образованию амилоидных фибрилл. Выявление факторов, которые влияли бы на конформационные изменения белка и приводящих к неправильному сворачиванию белковых структур, является одной из важных фундаментальных задач в настоящее время. Заключительная часть диссертации посвящена развитию теории и метода для предсказания и поиска участков белковой цепи, способных к образованию амилоидных фибрилл. Предсказание таких участков является одной из важных задач для понимания основных физических принципов агрегации. Поиск таких участков особенно важен в связи с тем, что многие глобулярные белки могут образовывать амилоидные фибриллы, которые в свою очередь могут вызывать ряд сложных болезней в организме человека.

Диссертация написана на основе статей и обзоров, публиковавшихся в течении десяти лет.


Заключение диссертации по теме «Биофизика», Галзитская, Оксана Валериановна


1. Развито новое научное направление - теория локализации ядер сворачивания в пространственной структуре белков. Разработаны два метода поиска ядер сворачивания в пространственных структурах белков: первый основан на методе динамического программирования (именно им были сделаны первые в мире успешные предсказания ядер сворачивания), второй - на методе Монте-Карло. Оба метода дают возможность предсказывать как ядра, так и скорости сворачивания глобулярных белков, причем показано, что предсказания более успешны для белков, структура которых установлена методом рентгеноструктурного анализа, чем для тех, структуры которых установлены методом ЯМР.

2. Впервые выявлены систематические различия во внутреннем строении белковых глобул, расшифрованных методами рентгеноструктурного анализа, с одной стороны, и ядерного магнитного резонанса, с другой. Они проявляются в разной зависимости от расстояния как числа Ван-дер-Ваальсовых контактов, так и числа водородных связей.

3. Впервые доказано, что наблюдаемые скорости самоорганизации белков, имеющих интермедиаты сворачивания, определяются в основном длинами их цепей, в отличие от скоростей самоорганизации тех небольших белков, которые таковых интермедиатов не имеют. Впервые показано, что отношение средней конформационной энтропии к среднему числу контактов на остаток коррелирует со скоростью сворачивания белков: для а-белков это соотношение самое высокое, и это самые быстро сворачивающиеся белки, для а/р-белков это соотношение самое низкое, и это самые медленно сворачивающиеся белки.

4. Разработан новый и самый успешный в настоящее время метод предсказания нативно-развернутых участков белковой цепи. Показано, что участки белковой цепи, обогащенные аминокислотными остатками, имеющими низкую «ожидаемую», (согласно статистике), плотность окружения, обычно являются нативно-развернутыми. Этим методом проведена оценка доли нативно-развернутых участков в различных протеомах: у эукариот эта доля оказалась в два раза больше, чем у бактерий и архей.

5. Предложены новые методы для предсказания границ доменов по аминокислотной последовательности белков, основанные на конформационной энтропии цепи и на статистике встречаемости аминокислотных остатков на границах доменов.

6. Предложен новый метод для предсказания амилоидогенных I участков белковых цепей. Показано, что участки цепи, обогащенные аминокислотными остатками, имеющими высокую «ожидаемую» плотность окружения, имеют тенденцию к образованию амилоидных фибрилл.

В заключении я хочу выразить глубокую благодарность моему учителю А.В. Финкельштейну. Я также благодарю моих коллег и соавторов. Я благодарю всех сотрудников лаборатории физики белка за доброе отношение и помощь.

Выражаю свою признательность моему мужу, А.К. Сурину, и отделу информации Института белка, Т.Б. Кувшинкиной и М.С.Шелестовой, за критические замечания и помощь в оформлении статей и иллюстративного материала, М.И. Ивановой и А.Б. Овчинниковой за обеспечение литературой, а также всем сотрудникам Института белка, способствовавшим выполнению данной работы. Я благодарна моим родителям за неоценимую помощь во всей моей работе.


Развито новое научное направление - теоретический поиск ядер сворачивания глобулярных белков с известной пространственной структурой. Данный подход расчета ядер сворачивания белков базируется на поиске самых низких «перевалов», отделяющих развернутое состояние цепи от нативной структуры на свободно-энергетическом ландшафте белковой цепи. Этот поиск ведется методом динамического программирования. Модель удовлетворительно предсказывает ядра сворачивания белков, структура которых решена методом рентгеноструктурного анализа (средний коэффициент корреляции теоретически рассчитанных Ф-значений с экспериментальными составляет 0.57), и хуже - при использовании в наших расчётах структур, решённых методом ЯМР (средний коэффициент корреляции 0.20). Вычисленная из нашей модели свободная энергия переходного состояния также хорошо согласуется с логарифмом скорости сворачивания, измеренной в точке равновесия: коэффициент корреляции составляет 73%.

Полученные результаты показывают, что наш подход удовлетворительно учитывает основные характеристики белкового сворачивания, несмотря на то, что пренебрегает многими деталями взаимодействий и движений в белковой цепи.

Разработанный метод выделения ядра сворачивания белка может найти применение в белковой и генной инженерии.

Впервые был проведен систематический сравнительный анализ 60 белковых структур, расшифрованных методом рентгеноструктурного анализа (РСА) и структур, расшифрованных методом ядерного магнитного резонанса (ЯМР), при условии, что эти структуры не имеют больших отличий при пространственном наложении друг на друга. Анализ остаток-остаточных контактов (при контактных расстояниях от 2 до 8 А) показал, что на расстояниях менее 3 А и 4.5 — 6.5 А ЯМР-структуры имеют больше контактов, чем РСА-структуры, а на остальных расстояниях больше контактов имеют РСА-структуры. При этом разница в числе остаток-остаточных контактов более выражена для внутренних спрятанных от воды остатков. Другое, не менее важное, отличие касается числа водородных связей в главной цепи: это число больше у РСА структур. При этом коэффициент корреляции между водородными связями в ЯМР- и РСА-структурах составляет только 69%. Анализ ЯМР структур до и после их уточнения путем конформационных расчетов дает основание предположить, что найденные нами различия связаны не столько с реальным различием конформаций белка в кристалле и растворе, сколько с математической обработкой экспериментальных ЯМР-данных.

Получена оценка времени сворачивания глобулярных белков с известной пространственной структурой (методом динамического программирования и методом Монте-Карло), которая хорошо согласуется с экспериментальными данными (коэффициент корреляции составляет 70%). Впервые было показано, что скорости самоорганизации белков, имеющих интермедиаты сворачивания при физиологических условиях, определяются в основном длинами их цепей, — в то время как скорости сворачивания небольших белков, сворачивающихся в одну стадию при всех внешних условиях, мало зависят от длин их цепей, и определяются в основном «относительным порядком контактов» их нативной структуры.

Используя теоретическую модель белкового сворачивания, мы продемонстрировали, что существует корреляция между энтропийной емкостью (отношение между средней конформационной энтропией и средней энергией остатка в белке) и скоростью сворачивания белков. Впервые было показано, используя статистические и экспериментальные данные по белковому сворачиванию, что каждый класс белков имеет свои, присущие данному классу, характеристики: среднее число контактов и среднюю конформационную энтропию на остаток, и эти класс-специфические характеристики коррелируют со скоростью сворачивания белков: а-белки - самые быстро сворачивающиеся, затем следуют Р-, ос+Р-белки и, наконец, самые медленно сворачивающиеся - а/р-белки, причем а/р-белки - самые плотно упакованные белки.

Одним из наиболее многообещающих теоретических подходов к исследованию самоорганизации белков является метод молекулярной динамики, который, в принципе, может позволить проследить динамику конформационных изменений пептида в водном окружении на атомном уровне. Однако на это требуется очень много компьютерного времени; к тому же любое явление, найденное при молекулярно-динамическом моделировании, требует проверки статистической достоверности, - а это, в свою очередь, требует гигантского компьютерного времени.

Метод мульти-канонического моделирования хорошо дополняет метод молекулярной динамики: не воспроизводя кинетику процесса, он позволяет исследовать большую выборку точек конформационного пространства без затрат времени на преодоление энергетических ловушек. Таким образом можно сравнительно быстро получить энергетический ландшафт для полипептида в воде и оценить его структурные и термодинамические свойства.

Исследование, с помощью мульти-канонического моделирования, энергетического ландшафта полипептида, охватывающего дистальную Р-шпильку из SH3 домена, показало, что данный пептид при 27°С в воде должен флуктуировать. При этом он принимает нерегулярную («клубковую»), спиральную и Р-шпилечную конформацию с вероятностью 75.6%, 18.0% и 6.4%, соответственно. Последнее хорошо совпадает с результатом, полученным с помощью метода молекулярной динамики, где, в ходе длительного моделирования, полипептид сворачивается в Р-шпильку один раз из 10. При этом показано, что остатки, входящие в Р-поворот важны для сворачивания данной Р-шпильки. Это подтверждает экспериментальный результат, что этот Р-поворот образуется в переходном состоянии при сворачивании целого белка. Возможный механизм сворачивания всего SH3 домена предложен, основываясь на энергетическом ландшафте изученного пептида.

Предложен простой метод определения границы доменов в белках с неизвестной пространственной структурой. Метод основывается на гипотезе, что высокая энтропия гибких боковых групп, расположенных в какой-то области белковой цепи, должна компенсироваться сильными взаимодействиями аминокислотных остатков в той же области цепи, так что эта область должна соответствовать наиболее структурированной компактной части белка, т.е. глобулярному домену.

Это означает, что междоменная граница обусловлена сгущением аминокислотных остатков с малой энтропией боковых групп, которая, в свою очередь, коррелирует с малым числом степеней свободы у аминокислотных остатков (таких, как аланин, глицин, пролин). Относительно высокое содержание аланинов, глицинов и пролинов на границе доменов приводит к низкой конформационной энтропии перемычки между доменами. Более того, наличие жестких пролиновых остатков на границе доменов приводит к образованию жестких перемычек, пригодных для более четкой относительной ориентации доменов.

Отталкиваясь от гипотезы, был предложен новый метод для предсказания границы доменов на основе статистики встречаемости аминокислотных остатков. Согласно этому методу, граница домена для двухдоменного белка совпадает с глобальным минимумом на вероятностном профиле, построенном по статистике встречаемости аминокислотных остатков на границе доменов. Были построены статистические шкалы встречаемости аминокислотных остатков на границе доменов. Была показана применимость разработанного метода для предсказаний границы доменов в многодоменных белках (международное соревнование CASP6). Предложенный метод может быть применен в генной инженерии - для выделения доменов в первичной структуре белков, пространственная структура которых еще не установлена.

Введен новый параметр - ожидаемая, согласно статистики, плотность окружения аминокислотных остатков. Показано, что способность белка при нативных условиях находиться в глобулярном или в нативно-развернутом состоянии может определяться (помимо пониженной гидрофобности и повышенного заряда) этим параметром. Данный параметр можно использовать как для предсказания формы (свернутой или развернутой) нативного состояния белка, так и для предсказания нативно-развернутых участков в белковой цепи. Результаты сравнения нашего метода предсказания нативно-развернутых участков с другими известными методами (такими как PONDR VL3H, GlobPlot, DISOPRED, IUPred) показывают, что процент правильно предсказанных нативно-развернутых участков у нашего метода самый высокий (87% и 77%, если усреднение проводить по остаткам и по белкам, соответственно). Разработанный метод может найти применение в белковой инженерии.

Предложен новый метод для поиска амилоидогенных участков белковой цепи. Показано, что участки белковой цепи, обогащенные аминокислотными остатками, имеющими высокую ожидаемую плотность окружения, часто ответственны за образование амилоидных фибрилл. Из 11 рассмотренных нами амилоидогенных белков и пептидов, для 8 предсказания находятся в согласие с экспериментальными данными. Разработанный метод поиска амилоидогенных участков белковой цепи может найти применение в белковой и генной инженерии.

