Исследование локальных сходств геномов эукариот тема диссертации и автореферата по ВАК РФ 03.00.02, кандидат физико-математических наук Огурцов, Алексей Юрьевич

  • Огурцов, Алексей Юрьевич
  • кандидат физико-математических науккандидат физико-математических наук
  • 2003, Пущино
  • Специальность ВАК РФ03.00.02
  • Количество страниц 91
Огурцов, Алексей Юрьевич. Исследование локальных сходств геномов эукариот: дис. кандидат физико-математических наук: 03.00.02 - Биофизика. Пущино. 2003. 91 с.

Оглавление диссертации кандидат физико-математических наук Огурцов, Алексей Юрьевич

ВВЕДЕНИЕ

ГЛАВА 1. ОБЗОР ЛИТЕРАТУРЫ

1.1. Сравнительный анализ геномов (сравнительная геномика)

1.2. Информационные ресурсы геномных баз данных

1.3. Функциональные элементы генома

1.4. Основные вопросы, решаемые сравнительной геномикой

1.5. Задача поиска гомологий

1.6. Простейшие алгоритмы поиска гомологий

1.6.1. Точечные матрицы гомологии

1.6.2. Поиск общего слова

1.6.3. Метод /-граммного разложения

1.6.4. Позиционные деревья

1.7. Задача выравнивания

1.7.1. Метод динамического программирования

1.7.2. Локальное выравнивание

1.8. Методы построения выравниваний, используемые в современном программном обеспечении

1.9. Оценка статистической значимости локальных сходств

ГЛАВА 2. Иерархический подход к построению цепочек локальных сходств

2.1. Неформальный обзор подхода к разрешению конфликтов

2.2. Обозначения

2.2.1. Локальные сходства

2.2.2. Цепочка локальных сходств

2.2.3. Качество локального сходства

2.2.4. Достоверность индивидуального сходства и цепочки сходств

2.2.5. Сравнение множеств сходств

2.2.6. Основная цепочка

2.3. Алгоритмы

2.3.1. Алгоритм Fractal

2.3.2. Краткий обзор алгоритмов Chain и ChainBasic

2.4. Примеры

Рекомендованный список диссертаций по специальности «Биофизика», 03.00.02 шифр ВАК

Введение диссертации (часть автореферата) на тему «Исследование локальных сходств геномов эукариот»

После того, как в 1978г. появились методы быстрого определения последовательностей ДНК, объем известных последовательностей растет экспоненциально. В 1982г. была создана единая база данных, куда поступают все опубликованные последовательности. В 1994г., когда общая длина известных последовательностей составляла уже десятки миллионов нуклеотидов, впервые были расшифрованы два полных генома клеточных организмов - бактерий Haemophilus influenzae и Mycoplasma genitalium. На сегодняшний день, наряду с геномами десятков бактерий, расшифрованы геномы нескольких многоклеточных эукариот, например, нематоды Caenorhabditis elegans, цветковых растений резуховидки (Arabidopsis thaliana) и риса (Oryza sativa L.), дрозофилы (Drosophila melanogaster), комара (Anopheles gampiat), рыбы фугу (Takifugu rubripes), человека (Homo sapiens) и мыши (Mus musculus). Общая длина хранящихся в базе данных "GenBank" последовательностей превышает 100 миллиардов нуклеотидов.

Аннотация большей части геномных последовательностей, публикуемых в базе данных GenBank, содержит информацию о генах (их экзон - интронной структуре и нетранслируемых участках), функциональных областях и повторах. Аннотация последовательностей проводится в основном с использованием компьютерных методов сравнения последовательностей и предсказания кодирующих областей. Экспрессия генов обеспечивается многочисленными регуляторными элементами, плотность нуклеотидных последовательностей которых в геномах эукариот превышает плотность кодирующих участков. Описание и разграничение функциональных элементов требует как проведения большого количества трудоемких экспериментов, так и разработки алгоритмов предсказания, создания специализированного программного обеспечения, помогающего направить поиск на наиболее вероятные участки генома.

Таким образом, компьютерный анализ геномной информации является одним из перспективных направлений, хотя и сопряжен со многими трудностями. Хотя символьная последовательность в четырехбуквенном алфавите является относительно простым объектом (по сравнению, например, с пространственной структурой белка), изучение даже небольшого числа не очень длинных последовательностей далеко не тривиально. Например, одновременное выравнивание 100 последовательностей длиной 1000 каждая требует заполнения 100-мерного куба со стороной 1000, содержащего Ю300 ячеек, что, естественно невозможно вычислительно. Несмотря на очень большое количество работ, отсчет которым можно вести с выхода в 1970г. пионерской работы С.Б. Нидлемана и С.Д. Вунша (Needleman S.B. and Wunsch C.D., 1970), нерешенных проблем в анализе последовательностей все еще больше, чем решенных.

Анализ эукариотических геномов сопряжен с дополнительными проблемами. У прокариот около 90% ДНК кодирует белки. Соответственно, в значительной степени изучение прокариотических геномов сводится к изучению наборов относительно коротких белковых последовательностей. Напротив, большая часть геномов многоклеточных эукариот (от 70% у растений до 98% у млекопитающих) белки не кодируют. Большая часть некодирующих последовательностей, видимо, не несет никакой функции. Однако, значительная ее доля (по оценкам, полученным в этой диссертационной работе - более 10%) функционально значима, и видимо, играет не меньшую роль в жизни организмов, чем белки. При этом изучение важных некодирующих последовательностей затруднено тем, что их функция не описывается простыми правилами, а межвидовое сходство ограничивается коротким консенсусом. Даже просто разграничить важные некодирующие последовательности от неважных - трудная задача.

Таким образом, на сегодня мы не можем предсказать a priori, как должны выглядеть функционально значимые участки некодирующей ДНК. В такой ситуации может помочь сравнительный метод: не зная, какие последовательности важны в отдельно взятом геноме, мы все же можем предположить, что важные гомологичные последовательности в геномах близких видов будут похожи друг на друга. По крайней мере, это относится к последовательностям, ответственным за межвидовое сходство.

Напротив, те, по-видимому относительно немногочисленные, участки некодирующей ДНК, которые отвечают за межвидовые различия, могут у близких видов различаться даже больше, чем бессмысленные (случайные) последовательности. С этой точки зрения представляется чрезвычайно интересным сравнение геномов человека и шимпанзе, так как средний уровень сходства между этими видами составляет 98%. В самое близкое время, после публикации генома шимпанзе, удастся выяснить, не существуют ли короткие участки ДНК, которые разошлись гораздо больше, чем на 2%, и, тем самым, ответственны за различия между человеком и шимпанзе.

Диссертация посвящена двум аспектам сравнения геномов. В главе 1 предложен новый подход к выравниванию длинных гомологичных последовательностей, в которых уровень сходства резко неравномерен - короткие консервативные участки чередуются с последовательностями, всякое сходство между которыми утрачено. В этой диссертации предлагается простой, эффективный, иерархический алгоритм для построения цепочек гомологичных консервативных последовательностей. Алгоритм реализован в виде интерактивной программы "Оуэн" (названной в честь английского зоолога, предложившего в 1848 году понятие гомология (Owen R., 1848)).

Главы 2 и 3 посвящены применению этого алгоритма и программы "Оуэн" к сравнительному анализу геномов. В главе 3 проведен анализ пары человек-мышь, а в главе 2 рассмотрены две относительно близкие нематоды - Caenorhabditis elegans и C.briggsae. В обоих случаях главный вывод состоит в том, что доля функционально важной некодирующей ДНК составляет, по меньшей мере, 10%, то есть значительно больше, чем считалось раньше. Для сравнения, белок-кодирующие последовательности ДНК составляют до 5% генома человека, интроны - 15%, межгенные интервалы - 80%.

Похожие диссертационные работы по специальности «Биофизика», 03.00.02 шифр ВАК

Список литературы диссертационного исследования кандидат физико-математических наук Огурцов, Алексей Юрьевич, 2003 год

1. Албертс Б., Брей Д., Льюис Дж., Рэфф М., Роберте К., Уотсон Дж. Молекулярная биология клетки. 2-е изд. М:Мир. 1994. Т. 1.

2. Александров А.А., Александров Н.Н., Бородовский М.Ю., Каламбет Ю.А., Кистер А.З., Миронов А.А., Певзнер П.А. и Шепелев В.А. Компьютерный анализ генетических текстов. М. .Наука. 1990.

3. Ахо А., Хопкрофт Дж., Ульман Дж. Построение и анализ вычислительных алгоритмов. М.: Мир. 1979.

4. Волькенпггейн М.В. Вероятности трансверсий транзиции. Мол.биол. 1976. №4. С. 737-741.

5. Воронина А.С. Трансляционная регуляция в раннем развитии. Успехи биологической химии. 2002. Т. 42. М. 139-160.

6. Груздева Н.М., Куллыев А.П. Инсуляторы Drosophila melanogaster: структура, функции. Успехи биологической химии. 2002. Т. 42. С. 161-176.

7. Гусев М.В. и Минеева Л.А. Микробиология. М.:Изд-во Моск. ун-та. 1992.

8. Кимура М. Молекулярная эволюция: теория нейтральности. М., 1985.

9. Кнут Д.Э. Искусство программирования. Сортировка и поиск. 2-е изд. С,-П.:Издательский дом "Вильяме". 2000. Т. 3.

10. Миронов А.А. и Александров Н.Н. Быстрый метод поиска гомологии нуклеотидных последовательностей. Биофизика. 1988. Т. 2. С. 229-232.

11. Огурцов А.Ю. Протокол автоматического выравнивания геномных последовательностей при помощи программы OWEN. Биофизика, (принято в печать).

12. Орлов С.В., Диже Э.Б., Кутейкин К.В., Курышев В.Ю., Перевозчиков А.П. Функциональная активность GCC-элемента, входящего в состав регуляторных районов ряда генов млекопитающих. Доклады Академии Наук. 1999. № 2. С. 262-265.

13. Ратнер В.А., Жарких А.А., Колчанов Н.А., Родин С.Н., Соловьев В., Шамин В. Проблемы теории молекулярной эволюции. Новосибирск:Наука. 1985.

14. Родионов А.В. Эволюция блочной организации хромосом животных и растений. Цитология. 1999. Т. 41. С. 1079.

15. Ahlquist P., Strauss E.G., Rice С.М., Strauss J.H., Haseloff J. and Zimmern D. Sindbis virus proteins nsPl and nsP2 contain homology to nonstructural proteins from several RNA plant viruses. J. Virol. 1985. V. 53. P. 536-542.

16. Aho A.V., Hopcroft J.E. and Ulman J.D. (1974). The Design and Analysis of Computer Algorithms, Addison-Wesley, Reading, Massachusetts.

17. Altschul S.F. and Gish W. Local alignment statistics. Methods Enzymol. 1996. V. 266. P. 460-480.

18. Altschul S.F., Madden T.L., Schaffer A.A., Zhang J.H., Zhang Z., Miller W. and Lipman D.J. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucl. Acids Res. 1997. V. 25. P. 3389-3402.

19. Argos P., Kamer G., Nicklin MJ. and Wimmer E. Similarity in gene organization and homology between proteins of animal picornaviruses and a plant comovirus suggest common ancestry of these virus families. Nucleic Acids Res. 1984. V 12. P. 7251-7267.

20. Arslan A.N., Egecioglu O. and Pevzner P.A. A new approach to sequence comparison: normalized sequence alignment. Bioinformatics. 2001. V. 17. P. 327-337.

21. Baer R., Bankier A.T., Biggin M.D., Deininger P.L., Farrell P.J., Gibson T.J., Hatfull G., Hudson G.S., Satchwell S.C., Seguin C. et al. DNA sequence and expression of the B95-8 Epstein-Barr virus genome. Nature. 1984. V. 310. P. 207-211.

22. Bagheri-Fam S., Ferraz C., Demaille J., Scherer G. and Pfeifer D. Comparative genomics of the SOX9 region in human and Fugu rubripes: Conservation of short regulatory sequence elements within large intergenic regions. Genomics. 2001. V. 78. P. 73-82.

23. Batzoglou S., Pachter L., Mesirov J.P., Berger B. and Lander E.S. Human and mouse gene structure: comparative analysis and application to exon prediction. Genome Res. 2000. V. 10. P. 950-958.

24. Bergman C.M. and Kreitman M. Analysis of conserved noncoding DNA in Drosophila reveals similar structural and evolutionary properties of intergenic and intronic sequences. Genome Res. 2001. V. 11. P. 1335-1345.

25. Blumenthal T. Trans-splicing and polycistronic transcription in Caenorhabditis elegans. Trends Genet. 1995. V. 11. P. 132-136.

26. Britten R.J. Rates of DNA sequence evolution differ between taxonomic groups. Science. 1986. V. 231. P. 1393-1398.

27. Brosius J. Genomes were forged by massive bombardments with retroelements and retrosequences. Genetica. 1999. V. 107. P. 209-238.

28. Brown A.M. and Lemke G. Multiple regulatory elements control transcription of the peripheral myelin protein zero gene. J. Biol Chem. 1997. V. 272. P. 2893928947.

29. Burge C. and Karlin S. Prediction of complete gene structures in human genomic DNA. J. Mol. Biol 1997. V. 268. P. 78-94.

30. Chao K.M., Zhang J.H., Ostell J. and Miller W. A local alignment tool for very long DNA sequences. Comput. Applic. Biosci. 1995. V. 11. P. 147-153.

31. Clark A.G. The search for meaning in noncoding DNA. Genome Res. 2001. V. 11. P. 1319-1320.

32. Delcher A.L., Phillippy A., Carlton J., Salzberg S.L. Fast algorithms for large-scale genome alignment and comparison. Nucleic Acids Res. 2002. V. 30. P. 2478-2483.

33. Deutsch M. and Long M. Intron-exon structures of eukaryotic model organisms. Nucleic Acids Res. 1999. V. 27. P. 3219-3228.

34. Dickinson W.J. The evolution of regulatory genes and patterns in Drosophila. Evol. Biol. 1991. V. 25. P. 127-173.

35. Durbin R., Eddy D., Krogh A. and Mitchison G. Pairwise alignment. Biological sequence analyses. Probabilistic models of proteins and nucleic acids. Cambridge, UK:Cambridge University Press. 1998. P. 12-45.

36. Eckardt N.A. Everything in its place: Conservation of gene order among distantly related plant species. Plant Cell 2001. V. 13. P. 723-725.

37. Eppstein D., Galil Z., Giancarlo R. and Italiano G.F. Sparse dynamic programming I: linear cost functions. Journal of the ACM. 1992. V. 39. P. 519-545.

38. Erdmann V.A., Barciszewska M.Z., Szymanski M., Hochberg A., de Groot N. and Barciszewski J. The non-coding RNAs as riboregulators. Nucleic Acids Res. 2001. V. 29. P. 189-193.

39. Erdmann V.A., Szymanski M., Hochberg A., Groot N. and Barciszewski J. Non-coding, mRNA-like RNAs database Y2K. Nucleic Acids Res. 2000 V. 28. P. 197200.

40. Ewing B. and Green P. Analysis of expressed sequence tags indicates 35000 human genes. Nat. Genet. 2000. V. 25. P. 232-234.

41. Fleischmann R.D., Adams M.D., White O., Clayton R.A., Kirkness E.F., Kerlavage A.R., Bull C.J., Tomb J-F., Dougherty B.A., Merrick J.M. et al Wholegenome random sequencing and assembly of Haemophilus influenzae Rd. Science. 1995. V. 269. P. 496-512.

42. Gibbs A.J. and Mclntyre G.A. A method for assessing the size of a protein from its composition: its use in evaluating data on the size of the protein subunits of plant virus particles. J. Gen. Virol. 1970. V. 9. P. 51-67.

43. Goad W.B. and Kanehisa M.I. Pattern recognition in nucleic acid sequences. I. A general method for finding local homologies and symmetries. Nucleic Acids Res. 1982. V. 10. P. 247-263.

44. Gu X. and Li W.H. A model for the correlation of mutation rate with GC content and the origin of GC-rich isochores. J. Mol. Evol. 1994. V. 38. P. 468-475.

45. Hannenhalli S. and Pevzner P.A. Transforming cabbage into turnip: Polynomial algorithm for sorting signed permutations by reversals. Journal of the ACM. 1999. V. 46. P. 1-27.

46. Hardison R.C. Conserved noncoding sequences are reliable guides to regulatory elements. Trends Genet. 2000. V. 16. P. 369-372.

47. Hardison R.C., Oeltjen J. and Miller W. Long human-mouse sequence alignments reveal novel regulatory elements: a reason to sequence the mouse genome. Genome Res. 1997. V. 7. P. 959-966.

48. Huang Т., Kuersten S., Deshpande A.M., Spieth J., MacMorris M. and Blumenthal T. Intercistronic region required for polycistronic Pre-mRNA processing in Caenorhabditis elegans. Mol. Cell. Biol. 2001. V. 21. P. 1111-1120.

49. International Human Genome Sequencing Consortium Initial sequencing and analysis of the human genome. Nature. 2001. V. 409. P. 860-921.

50. Jareborg N., Birney E. and Durbin R. Comparative analysis of noncoding regions of 77 orthologous mouse and human gene pairs. Genome Res. 1999. V. 9. P. 815-824.

51. Karlin S. and Altschul S.F. Methods for assessing the statistical significance of molecular sequence features by using general scoring schemes. Proc. Natl. Acad. Sci. USA. 1990. V. 87. P. 2264-2268.

52. Karlin S. and Altschul S.F. Applications and statistics for multiple high-scoring segments in molecular sequences. Proc. Natl Acad. Sci. USA. 1993. V. 90. P. 5873-5877.

53. Karlin S., Ghandour G., Ost F., Tavare S., Korn L.J. New approaches for computer analysis of nucleic acid sequences. Proc. Natl. Acad. Sci. USA. 1983. V. 18. P. 5660-5664.

54. Kent W.J. and Zahler A.M. Conservation, regulation, synteny, and introns in large-scale C.briggsae C.elegans genomic alignment. Genome Res. 2000. V. 10. P. 1115-1125.

55. Kidwell M.G. and Lisch D.R. Perspective: transposable elements, parasitic DNA, and genome evolution. Evolution. 2001. V. 55. P. 1-24.

56. Kimura M. Preponderance of synonymous changes as evidence for the neutral theory of molecular evolution. Nature. 1977. V. 267. P. 275-276.

57. Kondrashov A.S. and Crow J.F. A molecular approach to estimating the human deleterious mutation rate. Hum. Mutat. 1993. V. 2. P. 229-234.

58. Kondrashov A.S. and Shabalina S.A. Classification of common conserved sequences in mammalian intergenic regions. Hum. Mol. Genet. 2002. V. 11. P. 669-674.

59. Koop B.F. Human and rodent DNA sequence comparisons: a mosaic model of genomic evolution. Trends Genet. 1995. V. 11. P. 367-371.

60. Korn L.J., Queen C.L. and Wegman M.N. Computer analysis of nucleic acid regulatory sequences. Proc. Natl. Acad. Sci. USA. 1977. V. 74. P. 4401-4405.

61. Kozak M. An analysis of vertebrate messenger RNA sequences: intimations of translational control./. Cell Biol. 1991. V. 115. P. 887-903.

62. Kumar S., Gadagkar S.R., Filipski A. and Gu X. Determination of the number of conserved chromosomal segments between species. Genetics. 2001 V. 157. P. 13871395.

63. Le S.Y. and Maizel J.V. A common RNA structural motif involved in the internal initiation of translation of cellular mRNAs. Nucleic Acids Res. 1997. V. 25. P. 362-369.

64. Levy S., Hannenhalli S. and Workman C. Enrichment of regulatory signals in conserved non-coding genomic sequence. Bioinformatics. 2001. V. 17. P. 871-877.

65. Lipman DJ. and Pearson W.R. Rapid and sensitive protein similarity searches. Science. 1985. V. 227. P. 1435-1441.

66. Mallon A.M., Platzer M., Bate R., Gloeckner G., Botcherby M.R., Nordsiek G., Strivens M.A., Kioschis P., Dangel A., Cunningham D. et al. Comparative genome sequence analysis of the Bpa/Str region in mouse and man. Genome Res. 2000. V. 10. P. 758-775.

67. Makalowski W. Genomic scrap yard: how genomes utilize all that junk. Gene. 2000. V. 259. P. 61-67.

68. Makalowski W. and Boguski M.S. Evolutionary parameters of the transcribed mammalian genome: an analysis of 2,820 orthologous rodent and human sequences. Proc. Natl. Acad. Set USA. 1998. V. 95. P. 9407-9412.

69. Martinez H.M. An efficient method for finding repeats in molecular sequences. Nucleic Acids Res. 1983. V. 11. P. 4629-4634.

70. Maxam A.M. and Gilbert W. A new method for sequencing DNA. Proc. Natl. Acad. Sci. USA. 1977. V. 74. P. 560-564.

71. McGeoch DJ. and Davison A.J. DNA sequence of the herpes simplex virus type 1 gene encoding glycoprotein gH, and identification of homologues in the genomesof varicella-zoster virus and Epstein-Barr virus. Nucleic Acids Res. 1986. V. 14. P. 4281-4292.

72. Melhorn K. and Nahler S. Bounded ordered dictionaries in 0(loglog N). time and 0(n). space. Inf. Proc. Lett. 1990. V. 35. P. 183-189.

73. Miller W. Comparison of genomic DNA sequences: solved and unsolved problems. Bioinformatics. 2001. V. 17. P. 391-397.

74. Mironov A.A., Alexandrov N.N., Bogodarova N.Yu., Grigoijev A., Lebedev V.F., Lunovskaya L.V., Truchan M.E. and Pevzner P.A. DNASUN: a package of computer programs for the biotechnology laboratory. Comput. Appl. Biosci. 1995. V. 11. P. 331-335.

75. Morgenstern В., Freeh K., Dress A. and Werner T. DIALIGN: finding local similarities by multiple sequence alignment. Bioinformatics. 1998. V. 14. P. 290-294.

76. Mott R. and Tribe R. Approximate statistics of gapped alignments. J. Comput. Biol. 1999. V. 6 P. 91-112.

77. Mott R. Accurate formula for p-values of gapped local sequence and profile alignments. J. Mol. Biol 2000. V. 300. P. 649-659.

78. Mullikin J.C., Hunt S.E., Cole C.G., Mortimore B.J., Rice C.M., Burton J., Matthews L.H., Pavitt R., Plumb R.W., Sims S.K. et al An SNP map of human chromosome 22. Nature. 2000. V. 407. P. 516-520.

79. Nazipova N.N., Shabalina S.A., Ogurtsov A.Yu., Kondrashov A.S., Roytberg M.A., Buryakov G.V. and Vernoslov S.E. SAMSON: a software package for the biopolymer primary structure analysis. Comput. Appl. Biosci. 1995. V. 11. P. 423-426.

80. Needleman S.B. and Wunsch C.D. A general method applicable to the search for similarities in the amino acid sequence of two proteins. J. Mol Biol 1970. V. 48. P. 443-453.

81. Ogurtsov A.Y., Roytberg M.A., Shabalina S.A. and Kondrashov A.S. OWEN: aligning long collinear regions of genomes. Bioinformatics. 2002. V. 18. P. 1703-1704.

82. Owen R. On the Archetype and Homologies of the Vertebrate Skeleton. London:Van Voorst 1848.

83. RajBhandary U.L. More surprises in translation: initiation without the initiator tRNA. Proc. Natl Acad. Sci. USA. 2000. V. 97. P. 1325-1327.

84. Sanger F., Coulson A.R., Hong G.F., Hill D.F. and Petersen G.B. Nucleotide sequence of bacteriophage lambda DNA. J. Mol Biol. 1982. V. 162. P. 729-773.

85. Sanger F., Nicklen S. and Coulson A.R. DNA sequencing with chain-terminating inhibitors. Proc. Natl. Acad. Sci. USA. 1977. V. 74. P. 5463-5467.

86. Shabalina S.A. and Kondrashov A.S. Pattern of selective constraint in C.elegans and C.briggsae genomes. Genet. Res. 1999. V. 74. P. 23-30.

87. Shabalina S.A., Ogurtsov A.Y., Kondrashov V.A. and Kondrashov A.S. Selective constraint in intergenic regions of human and mouse genomes. Trends in Genet. 2001. V. 17. P. 373-376.

88. Shabalina S.A., Yurieva O.V. and Kondrashov A.S. On the frequencies of nucleotides and nucleotide substitutions in conservative regulatory DNA sequences. J. Theor. Biol 1991. V. 149. P. 43-54.

89. Schwartz S., Zhang Z., Frazer K.A., Smit A., Riemer C., Bouck J., Gibbs R., Hardison R. and Miller W. PipMaker A Web server for aligning two genomic DNA sequences. Genome Res. 2000. V. 10. P. 577-586.

90. Smith T.F. and Waterman M.S. Identification of common molecular subsequences. J. Mol Biol 1981. V. 147. P. 195-197.

91. Tatusov R.L., Mushegian A.R., Bork P., Brown N.P., Hayes W.S., Borodovsky M., Rudd K.E. and Koonin E.V. Metabolism and evolution of Haemophilia influenzae deduced from a whole-genome comparison with Escherichia coli. Curr. Biol 1996. V. 6. P. 279-291.

92. Tautz D. Evolution of transcriptional regulation. Curr. Opin. Genet. Dev. 2000. V. 10. P. 575-579.

93. The C. elegans Sequencing Consortium. Genome sequence of the nematode C. elegans: a platform for investigating biology. Science. 1998. V. 282. P. 2012-2018.

94. Venter J.C., Smith H.O. and Hood L. A new strategy for genome sequencing. Nature. 1996. V. 381. P. 364-366.

95. Venkatesh В., Gilligan P. and Brenner S. Fugu: a compact vertebrate reference genome. FEBS Lett. 2000. V. 476. P. 3-7.

96. Wasserman W.W., Palumbo M., Thompson W., Fickett J.W. and Lawrence C.E. Human-mouse genome comparisons to locate regulatory sites. Nature Genet. 2000. V. 26. P. 225-228.

97. Waterman M.S. Sequence alignment in the neighborhood of optimum with general application to dynamic programming. Proc. Nat. Acad. Sci. USA. 1983. V. 80. P. 3123-3124.

98. Waterman M.S., Smith T.F. and Beyer W.A. Some biological sequence metrics. Adv. Math. 1976. V. 20. P. 367-387.

99. Wolf Y.I., Rogozin I.B., Kondrashov A.S. and Koonin E.V. Genome alignment, evolution of prokaryotic genome organization, and prediction of gene function using genomic context. Genome Research. 2001. V. 11. P. 356-372.

100. Wong G.K.S., Passey D.A., Huang Y.Z., Yang Z.Y. and Yu J. Is "junk" DNA mostly intron DNA? Genome Res. 2000. V. 10. P. 1672-1678.

101. Zafar N., Mazumder R. and Seto D. Comparisons of gene colinearity in genomes using Gene0rder2.0. Trends. Biochem. Sci. 2001. V. 26. P. 514-516.

102. Zharkikh A.A., Rzhetsky A.Yu., Morosov P.S., Sitnikova T.L. and Krushkal J.S. VOSTORG: a package of microcomputer programs for sequence analysis and construction of phylogenetic trees. Gene. 1991. V. 101. P. 251-254.

103. Zhang Z., Berman P and Miller W. Alignments without low-scoring regions. J. Comput. Biol. 1998. V. 5. P. 197-210.

104. Zhang Z., Raghavachari В., Hardison R.C. and Miller W. Chaining multiple-alignment blocks. J. Comput. Biol. 1994. V. 1. P. 217-226.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.