Анализ первичных последовательностей и самоорганизация сополимеров
Последние десять лет в научном мире можно без сомнения назвать временем нанотехнологий и наноматериалов. Для создания материалов, содержащих наноразмерные домены, используются блоксополимеры, где отталкивание различных блоков приводит к самоорганизации макромолекул в микроструктуры с различной морфологией (сферы, цилиндры, ламели) размерами от 10 до 1000 А. Микрофазным расслоением в таких… Читать ещё >
Содержание
- 1. Обзор литературы
- 1. 1. Микрофазное расслоение
- 1. 1. 1. Микрофазное расслоение в расплаве блоксополимеров
- 1. 1. 2. Микрофазное расслоение в расплаве гребнеобразных блоксополимеров
- 1. 2. Конформационно-зависимый синтез полимеров
- 1. 3. Анализ биологических последовательностей
- 1. 4. Постановка основных задач работы
- 1. 1. Микрофазное расслоение
- 2. Распознавание и сегментация двухбуквенных модельных и биологических гетеропоследовательностей
- 2. 1. Постановка задачи
- 2. 2. Сегментация гетеропоследовательности, составленной из подпоследовательностей различного состава
- 2. 3. Сегментация гетеропоследовательности, составленной из подпоследовательностей с различными средними длинами блоков
- 2. 4. Сегментация гетеропоследовательности, составленной из подпоследовательностей с одинаковыми составами и одинаковыми средними длинами блоков
- 2. 5. Сегментация белковых последовательностей
- 3. Белковые последовательности как литературный текст
- 3. 1. Введение
- 3. 2. Метод исследования
- 3. 3. Результаты
- 4. Микрофазное расслоение в гребнеобразных диблоксополимерах
- 4. 1. Сферические мицеллы
- 4. 2. Ламеллярная структура
- 5. Дизайн полимерных материалов с заданным масштабом микронеоднородностей
- 5. 1. Постановка задачи
- 5. 2. Результаты
Анализ первичных последовательностей и самоорганизация сополимеров (реферат, курсовая, диплом, контрольная)
Актуальность работы.
Последние десять лет в научном мире можно без сомнения назвать временем нанотехнологий и наноматериалов. Для создания материалов, содержащих наноразмерные домены, используются блоксополимеры, где отталкивание различных блоков приводит к самоорганизации макромолекул в микроструктуры с различной морфологией (сферы, цилиндры, ламели) размерами от 10 до 1000 А. Микрофазным расслоением в таких системах можно эффективно управлять, варьируя длины соответствующих блоков в последовательности. В последнее время для создания функциональных полимерных материалов используют вместо обычных блоксополимеров полимеры более сложной архитектуры, такие как гребнеобразные полимеры или сополимеры, состоящие из гребнеобразного и линейного блоков. Другим эффективным способом ^ управления микрофазным расслоением в расплавах сополимеров может являться использование сополимеров со специфическими последовательностями мономерных звеньев, при которых обеспечивается стабильность микрофазного расслоения в заданном интервале физических параметров системы.
Свойства гетерополимерных молекул — как синтетических, так и биологических — во многом определяются распределением мономерных звеньев вдоль по последовательности, их первичной структурой. На данный момент самыми сложными по своим функциональным свойствам являются биологические полимеры (ДНК, РНК, белки). При анализе первичной структуры таких макромолекул они часто представляются в виде двухбуквенных последовательностей путем соответствующей перекодировки. В случае белков все аминокислотные остатки разбиваются ¦к на две группы — гидрофобные и гидрофильные, и белковая макромолекула представляется как сополимер из двух сортов мономерных звеньев. Такое представление позволяет выявить основные закономерности в чередовании групп данного сорта и сделать выводы о возможной пространственной структуре биополимера и функциях закодированных в его последовательности, что, несомненно, важно как для понимания процессов жизнедеятельности клетки, так и для возможного воспроизведения этих механизмов в искусственных полимерных системах.
Целью данной диссертационной работы был поиск оптимальных процедур, позволяющих эффективно анализировать сложные последовательности и путем варьирования архитектуры и последовательности конструировать полимерные материалы с заданным масштабом микронеоднородностей, стабильных в широком интервале физических параметров системы.
На защиту выносятся следующие основные положения диссертационной работы:
1. Предложена эффективная методика сегментации и идентификации двухбуквенных ЛВ последовательностей с различной статистикой распределения звеньев, А и В. Показано, что сегментационная функция случайной последовательности является константой, зависящей от составасегментационная функция блочного сополимера является осциллирующей функцией, а период осцилляций определяется средней длиной блокасегментационная функция белковоподобного сополимера при малых к растет, а затем выходит на плато максимальные значения которой ложатся на прямую, зависящую от состава сополимера.
2. Белковые последовательности могут быть представлены как тексты, написанные на «белковом» языке. В них можно выделять повторяющиеся мотивы («слова») различных длин. Максимальные длины слов" различны для белков различных классов (глобулярные, мембранные и фибриллярные белки).
3. Характерный период структуры, возникающей при микрофазном расслоении в расплаве диблоксополимеров, состоящих из гребнеобразного и линейного блоков, сильно несовместимых между собой, в широкой области изменения параметров системы определяется параметрами гребнеобразного блока и практически не зависит от геометрических параметров линейного блока. При этом гребнеобразный блок достаточно сильно вытянут (степень его растяжения тем больше, чем выше плотность пришивки и длина боковых цепей), что приводит к возникновению режима сверхсильной сегрегации, когда период структуры линейно зависит от длины остова гребнеобразного блока.
4. Предложен дизайн полимерных материалов, с заданным масштабом микронеоднородностей, стабильных в заданном интервале температур. В ходе эволюционной процедуры, обнаружена полимерная система, масштаб микронеоднородностей которой превышает масштаб микронеоднородностей расплава диблоксополимеров.
Научная новизна работы определяется прежде всего тем, что большинство рассмотренных задач исследовались впервые. В результате изучения этих задач было предсказано существование ряда новых эффектов, некоторые из которых уже обнаружены экспериментально. Методы анализа первичной структуры биологических и модельных последовательностей, предложенные в данной диссертационной работе, нигде ранее не использовались и поэтому позволяют взглянуть на свойства биологических последовательностей с принципиально новой точки зрения.
Практическая ценность работы обусловлена тем, что полученные результаты найдут применение в самых различных областях науки. В нанотехнологии для создания материалов с заданной микроструктурой. В биоинформатике — в качестве новых методов сегментации и идентификации биологических последовательностей.
Структура и объем работы. Диссертация состоит из введения, пяти глав, выводов и списка цитируемой литературы из 87 наименований. Диссертация содержит 108 страниц, включая рисунки, оглавление и список литературы.
ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ ДИССЕРТАЦИИ.
1. Предложен и апробирован метод сегментации и идентификации бинарных последовательностей АВ сополимеров с различной статистикой распределения звеньев, основанный на расчете введенной нами впервые сегментационной функции и функции дивергенции Йенсона-Шеннона, вычисленной для энтропии Шеннона по отношению к вероятности встречи блока, А или В длины п.
2. Разработана методика анализа белковых последовательностей как текста, написанного на «белковом» языке. Методика апробирована на англоязычных текстовых последовательностях. Показано, что в последовательностях белков действительно можно выделять повторяющиеся мотивы («слова») различных длин, и что максимальные длины «слов» различны для белковых последовательностей различных классов.
3. Построена теория микрофазного расслоения в расплаве диблоксополимера, состоящего из гребнеобразного и линейного блоков, сильно несовместимых между собой. Показано, что в широкой области изменения параметров макромолекулы характерный период структуры определяется параметрами гребнеобразного блока и практически не зависит от геометрических параметров линейного блока. При этом гребнеобразный блок достаточно сильно вытянут (степень его растяжения тем больше, чем выше плотность пришивки и длина боковых цепей). Показано, что в таких системах может возникнуть режим сверхсильной сегрегации вследствие предельной вытяжки гребнеобразного блока.
4. Предложена методика быстрого конструирования первичных последовательностей сополимеров, образующих в расплавах структуры с заданным масштабом микронеоднородностей и стабильных в заданном температурном интервале. Показано, что диблоксополимеры и слабо дефектные диблоксополимеры претерпевают переход в микрофазное состояние при более высоких температурах, чем сополимеры с другими распределениями звеньев. Показано, что при фиксированном составе сополимера максимальный масштаб микронеоднородностей наблюдается в системе, формируемой слабо дефектными диблоксополимерами, в которых блоки содержат небольшую фракцию звеньев другого сорта.
Пользуясь возможностью, хотелось бы выразить глубокую благодарность Василевской Валентине Владимировне и Хохлову Алексею Ремовичу за чуткое и доброжелательное руководство, за предложенную интересную тему исследований.
Автор признателен и благодарен Халатуру Павлу Геннадиевичу и Макееву Всеволоду Юльевичу за помощь и многочисленные консультации во время выполнения работы.
Особую благодарность хотелось бы выразить сотрудникам лаборатории физической химии полимеров Института элементоорганических соединений РАН и кафедры физики полимеров и кристаллов физического факультета МГУ им. М. В. Ломоносова за создание обстановки благоприятствующей выполнению данной диссертационной работы.
Список литературы
- Leibler, Theory of Microphase Separation in Block Copolymer, Macromolecules, 1980, 13, 1602
- I.Ya. Erukhimovich, Fluctuations and Formation of Domain Structure in Heteropolymers, Vysokomol Soyed., 1982, 9, 1942−1949
- P.-G de Gennes, Scaling Concepts in Polymer Physics, Cornell Univ. Press, 1979
- S. Kuchanov (ed.), Mathematical methods in contemporary chemistry, Gordon & Breach, 1996
- A.N. Semenov, Contribution to the theory of microphase layering in bockcopolymer melts, Sov. Phys. JETP, 1985, 61, 733
- L.A. Nyrkova, A.R. Khokhlov, M. Doi, Microdomains in Block-Copolymers and Multiplets in Ionomers: Parallels in Behavior, Macromolecules, 1993, 26, 3601
- F.S. Bates and G.H. Fredrickson, Block copolymer thermodynamics: Theory and experiment, Annu. Rev. Phys. Chem., 1990,41, 525−557
- G.H. Fredrickson and F.S. Bates, Dynamics of block copolymers: Theory and Experiment, Annu. Rev. Mater. Sci., 1996, 26, 501−550
- T.M. Birshtein, O.V. Borisov, E. B Zhulina, A.R. Khokhlov, T.A. Yurasova, Conformations of a Comb-like Macromolecule, Vysokomolekul. Soed., 1987, 29 A, 1169
- J. Ruokolainen, R. Makinen, M. Torkkeli, T. Makela, R. Serimaa, G. ten Brinke, O. Ikkala, Switching Supramolecular Polymeric Materials with Multible Length Scales, Science, 1998, 280, 557
- P.J. Flory, Principles of Polymer Chemistry, Cornell Univ. Press, Ithaca, NY, 1953
- A.V. Dobrynin, I.Ya. Erukhimovich, Computer-aided comparative investigation of architecture influence on block copolymer phase diagrams, Macromolecules, 1993, 26, 276
- I.W. Hamley, The Physics of Block Copolymers, Oxford University Press: Oxford, New York, Tokio, 1998
- T. Goldacker, V. Abetz, R. Stadler, I.Ya. Erukhimovich, L. Leibler, Non-centrosymmetric superlattices in block copolymer blends, Nature, 1999, 398, 137
- S.T. Milner, Chain Architecture and Asymmetry in Copolymer Microphases, Macromolecules, 1994, 27, 2333
- J. Ruokolainen, J. Tanner, O. Ikkala, G. ten Brinke, E.L. Thomas, Direct Imaging of Self-Organized Comb Copolymer-like Systems Obtained by Hydrogen Bonding: Poly (4-vinylpyridine)-4-Nonadecylphenol,
- Macromolecules, 1998, 31, 3532
- J.Ruokolainen, G. ten Brinke, O. Ikkala, Supramolecular Polymeric Materials with Hierarchical Structure-Within-Structure Morphologies, Adv. Mater., 1999, 11,777
- G. ten Brinke and O. Ikkala, Functional polymeric materials: complexing amphiphiles as structure-inducing elements, Macromol. Symp., 2003, 203, 103 109
- A.R. Khokhlov, P.G. Khalatur, Protein-like copolymers: computer simulation, Physica A, 1998,249, 253
- V.A. Ivanov, A.V. Chertovich, A.A. Lazutin, N.P. Shusharina, P.G. Khalatur, A.R. Khokhlov, Computer Simulation of Globules with Microstructure, Macromol. Symposia, 1999, 146, 259
- A.R. Khokhlov, P.G. Khalatur, Conformation-Dependent Sequence Design (Engineering) of A B Copolymers, Physical Review Letters, 1999, 82, 3456
- E.A. Zheligovskaya, P.G. Khalatur, A.R. Khokhlov, Properties of AB Copolymers with a Special Adsorption-Tuned Primary Structure, Physical Review E, 1999,59,3071
- J. Virtanen, H. Tenhu, Grafting of Poly (N-isopropylacrylamide) with Poly (ethylene oxide) under Various Reaction Conditions, Macromolecules, 2000,33,336
- V.I. Lozinsky, I.A. Simenel, E.A. Kurskaya, V.K. Kulakova, V.Ya. Grinberg, A.S. Dubovik, I.Yu. Galaev, B. Mattiasson, A.R. Khokhlov, Synthesis of N-vinylcaprolactam polymers in water-containing media, Rep. Russ. Acad. Sci., 2000, 375, 637
- P.-0. Wahlund, I.Yu. Galaev, S.A. Kazakov, V.I. Lozinsky, B. Mattiasson, Protein-Like Copolymers: Effect of Polymer Architecture on the Performance in Bioseparation Process, Macromol. Biosci., 2002, 2, 33
- C.-K. Peng, S.V. Buldyrev, A.L. Goldberger, S. Havlin, F. Sciortino, M. Simons, and H.E. Stanley, Long-range correlations in nucleotide sequences, Nature, 1992, 356, 168
- A.V. Chertovich, V.A. Ivanov, A.A. Lazutin, A.R. Khokhlov, Sequence design of biomimetic copolymers: modeling of membrane proteins and globular proteins with active enzymatic center, Macromol. Symp., 2000, 160, 41
- N.Yu. Starovoitova, A.V. Berezkin, Yu. A. Kriksin, O.V. Gallyamova, P.G. Khalatur, A.R. Khokhlov, Modeling of radical copolymerization near a selectively adsorbing surface: Design of gradient copolymers with long-range correlations, (in press)
- A.V. Berezkin, M.A. Solov’ev, P.G. Khalatur, A.R. Khokhlov, Template copolymerization near a patterned surface: Computer simulation, J. Chem. Phys., 2004, 121, 12, 6011−6020
- Н.Ю. Старовойтова, П. Г. Халатур, А. Р. Хохлов, Сополимеризация вблизи адсорбирующей поверхности: компьютерное моделирование, Доклады академии наук, 2003, 392, 5, 641−644
- Ю.А. Криксин, П. Г. Халатур, А. Р. Хохлов, Модель адсорбции сополимера на поверхности с активными центрами, (в печати)
- A. Naidenov, S. Nechaev, Adsorption of a random heteropolymer at a potential well revisited: location of transition point and design of sequences, J. of Physics A: Mathematical and General, 2001, 34, 5625−5634
- M. Muthukumar, Pattern recognition by polyelectrolytes, J. of Chemical Physics, 1995, 103, 11,4723−4731
- A.K. Chakraborty, A simple theory and Monte Carlo simulations for recognition between random heteropolymers and disordered surfaces, J. of Chemical Physics, 1998, 108, 4,1676−1682
- J. Genzer, Copolymer adsorption on planar substrates with a random distribution of chemical heterogeneities, J. of Chemical Physics, 2001, 115, 10, 4873−4882
- J. Genzer, Copolymer-assisted generation of three-dimensional patterns by replicating two-dimensional substrate motifs, Physical Review E, 2001, 63, 22 601, 1−4
- A.J. Golumbfskie, S.P. Vijay, A.K. Chakraborty, Simulation of biomimetic recognition between polymers and surfaces, PNAS, 1999, 96, 21, 11 707−11 712
- E.N. Govorun, V.A. Ivanov, A.R. Khokhlov, P.G. Khalatur, A.L. Borovinsky, A.Yu. Grosberg, Primary Sequences of Proteinlike Copolymers: Levy-Flight-Type Long-Range Correlations, Physical Review E, 2001, 64, 40 903
- S. I. Kuchanov and A. R. Khokhlov, Copolymers with Designed Protein-Like Sequence Obtained by Polymer analogous Transformations of Homopolymer Globule, J. Chem. Phys., 2003, 118, 10, 4684−4691
- И.М. Лифшиц, Некоторые вопросы статистической теории биополимеров, ЖЭТФ, 1968, 55, 2408
- N. Sueoka, On the Genetic Basis of Variation and Heterogeneity of DNA Base Composition, Proc. Nat. Ac. Sc., 1962, 48, 582−592
- R.A Elton, Theoretical models for heterogeneity of base composition in DNA, J. Theor. Biol., 1974, 45, 533−553
- O.W.J. Ewens, G.R. Grant, Statistical Methods in Bioinformatics, Springier — Verlag, New York, 2002
- P.A. Pevzner, Computational Molecular Biology: An Algorithmic approach, MIT Press, Cambridge, 2000
- SV Buldyrev, AL Goldberger, S Havlin, CK Peng, M Simon, F Sciortino, HE Stanley, Long-range fractal correlations in DNA (comments), Physical Review Letters, 1993,71, 11, 1776
- W. Li, K. Kaneko, Long-range correlation and partial 1/fa spectrum in a noncodingDNA sequence, Europhysics Letters, 1992, 17, 7, 655−660
- S.M. Ossadnik, S.V. Buldyrev, A.L. Goldberger, S. Havlin, R.N. Mantegna, C.K. Peng, M. Simons and H.E. Stanley, Correlation approach to identify coding regions in DNA sequences, Biophys. J., 1994, 67, 64
- C.-K. Peng, S.V. Buldyrev, A.L. Goldberger, S. Havlin, F. Sciortino, M. Simons, H.E. Stanley, Long-range correlation properties of coding and noncoding DNA sequences: GenBank analysis, Physical Review E, 1995, 51, 5, 5084
- R. N. Mantegna, S. V. Buldyrev, A. L. Goldberger, S. Havlin, C.-K. Peng, M. Simons, and H. E. Stanley, Systematic Analysis of Coding and Noncoding DNA Sequences Using Methods of Statistical Linguistics, Physical Review E, 1995, 52, 3 2939
- G.M. Viswanathan, S. V. Buldyrev, S. Havlin, and H.E. Stanley, Quantification of DNA patchiness using long-range correlation measures, Biophys J., 1997, 72, 866
- R.F. Voss, Evolution of long-range fractal correlations and 1/f noise in DNA base sequences, Physical Review Letters, 1992, 68, 3805
- R.F. Voss, Long-range fractal correlations in DNA introns and exons, Fractals, 1994,2,1,1−6
- H. Herzel, I. Gro? e, Correlations in DNA sequences the role of protein coding segments, Physical Review E, 1997, 55, 1, 800−810
- C.-K. Peng, S.V. Buldyrev, A.L. Goldberger, S. Havlin, F. Sciortino, M. Simons, H.E. Stanley, Species independence of mutual information in coding and noncodingDNA, Physical Review E, 2000, 61, 5, 5624
- Z.G. Yu, V. Anh, K.S. Lau, Multifractal characterisation of length sequences of coding and noncoding segments in a complete genome, Physica A, 2001, 301,351−36 163 .A.A. Borovkov, Mathematical Statistics, Mir, Moscow, 1984
- M.L. Mene’ndez, J.A. Pardo, L. Pardo, and M.C. Pardo, The Jensen-Shannon Divergence, J. Franklin Inst., 1997, 334B, 307
- P. Bernaola-Galvan, R. Roman-Roldan, J.L. Oliver, Compositional segmentation and long-range fractal correlations in DNA sequences, Physical Review E, 1996, 53,5,5181−5189
- W. Li, The complexity of DNA: the measure of compositional heterogeneity in DNA sequences and measures of complexity, Complexity, 1997, 3, 2, 33−37
- R. Roman-Roldan, P. Bernaola-Galvan, J.L. Oliver, Sequence compositional complexity of DNA through an entropic segmentation method, Physical Review Letters, 1998, 80, 4, 1344−1347
- P. Bernaola-Galvan, J.L. Oliver, R. Roman-Roldan, Decomposition of DNA sequence complexity, Physical Review Letters, 1999, 83, 16, 3336−3339
- J.L. Oliver, R. Roman-Roldan, J. Perez, P. Bernaola-Galvan, SEGMENT: identifying compositional domains in DNA sequences, Bioinformatics, 1999, 15, 12, 974−979
- P. Bernaola-Galvan, I. Grosse, P. Carpena, J. L Oliver, R. Roman-Roldan, H.E. Stanley, Finding borders between coding and non-coding regions by an entropic segmentation method, Physical Review Letters, 2000, 85, 6, 13 421 345
- Gross, P. Bernaola-Galvan, P. Carpena, R. Roman-Roldan, J.L. Oliver, H.E. Stanley, Analysis of symbolic sequences using the Jense-Shannon divergence, Physical Review E, 2002, 65, 41 905
- P.G. Khalatur, V.V. Novikov, A.R. Khokhlov, Conformation-Dependent Evolution of Copolymer Sequences, Physical Review E, 2003, 67, 51 901
- W. Li, The complexity of DNA: the measure of compositional heterogeneity in DNA sequences and measures of complexity, Complexity, 1997, 3,2, 33−37
- R. Dubin, S. Eddy, A. Krogh, G. Mitchinson, Biological sequence analysis. Probabilistic models of proteins and nucleic acids, Cambridge, Cambridge University Press, 2001
- A.H. Горбань, Т. Г. Попова, М. Г. Садовский, Классификация нуклеотидных последовательностей по частотным словарямобнаруживает связь между их структурой и таксономическим положением организмов, Журн. общ. биологии, 2003, 64, 1, 51−63
- Н. Bussemaker, Н. Li, Е. Siggia, Building a dictionary for genomes: Identification of presumptive regulatory sites by statistical analysis, Proceedings of the National Academy of Sciences, 2000, 97, 10 096
- H.J. Bussemaker, H. Li, and E.D. Siggia, Building a dictionary for genomes: Identification of presumptive regulatory sites by statistical analysis, PNAS, 2000, 97, 18, 10 096−10 100
- N. Dokholyan, S.V. Buldyrev, S. Havlin, and H.E. Stanley, Model of unequal chromosomal crossing over in DNA sequences, Physica A, 1998, 249, 594−599
- S.V. Buldyrev, N.V. Dokholyan, S. Havlin, H.E. Stanley, and R.H.R. Stanley, Expansion of Tandem Repeats and Oligomer Clustering in Coding and NoncodingDNA Sequences, Physica A, 1999, 273, 19−32
- D.L. Nelson, M.M. Cox, Lehninger Principles of Biochemistry, Worth Publishers, NewYork, 2000
- Б. Вейр, Анализ генетических данных: Дискретные генетические признаки, (Пер. с англ.), Москва, Мир, 1995, 400- B.S. Weir, Genetic data analysis. Methods for discrete population genetic data, Massachusetts, Sinauer Associates, 1990
- A.B. Финкелынтейн, О. Б. Птицын, Физика белка. Курс лекций, Книжный Дом Университет, Москва, 2002
- Z.G. Yu, V. Anh, K.S. Lau, Multifractal and correlation analyses of protein sequences from complete genomes, Physical Review E, 2003, 68,2, 21 913
- L.V.Gusev, V.V. Vasilevskaya, V.Ju. Makeev, P.G. Khalatur and A. R. Khokhlov, Segmentation Of Heteropolymer Sequences Specifying Subsequences With Different Composition And Statistical Properties, Macromol. Theory Simul., 2003, 12,604−613