Диплом, курсовая, контрольная работа
Помощь в написании студенческих работ

Решение задач классификации и кластеризации данных по экспрессии генов на основе их функциональных взаимодействий

ДиссертацияПомощь в написанииУзнать стоимостьмоей работы

Задача классификации. Данная задача предполагает наличие выборки биологических объектов, например экспрессионных профилей, для которых известно, к каким классам, например подтипам болезней, они относятся. На базе этой выборки создается классификатор, способный классифицировать произвольный объект как представителя одного из классов. Классификатор представляет собой подмножество информативных… Читать ещё >

Содержание

  • СПИСОК СОКРАЩЕНИЙ
  • ОСНОВНЫЕ ПОНЯТИЯ
  • ГЛАВА 1. ОБЗОР ЛИТЕРАТУРЫ
    • 1. 1. «Описв» исследования
      • 1. 1. 1. Общее определение и типы «описз» исследований
      • 1. 1. 2. ДНК-микрочипы
      • 1. 1. 3. Обработка экспрессионных данных
      • 1. 1. 4. Дескрипторы, как результат «описз» исследований
      • 1. 1. 5. Общий принцип создания экспрессионных классификаторов
    • 1. 2. Функциональный анализ
      • 1. 2. 1. Биологическая сеть
      • 1. 2. 2. Методы анализа биологической сети
      • 1. 2. 3. Анализ обогащения
      • 1. 2. 4. Сравнение высокопроизводительных данных
      • 1. 2. 5. Функциональный анализ информативных генов классификаторов
      • 1. 2. 6. Функциональные дескрипторы
      • 1. 2. 7. Выделение подтипов раковых заболеваний на основании экспрессионных данных
  • ГЛАВА 2. МАТЕРИАЛЫ И МЕТОДЫ
    • 2. 1. Данные для анализа
    • 2. 2. Анализ топологии биологической сети
    • 2. 3. Функциональны анализ обогащения
    • 2. 4. Анализ предков и потомков вершин биологической сети
    • 2. 5. Связанность белков в пределах исследуемого множества (интра-связанность) и связанность белков между изучаемым множеством и остальным интерактомом (интер-связанность)
    • 2. 6. Непосредственно связанные сети и усредненный кратчайший путь
    • 2. 7. Расстояние в сети между двумя множествами
    • 2. 8. Подсчет значимости пересечений наборов информативных генов классификаторов и их объединенных множеств
    • 2. 9. Каппа статистика
    • 2. 10. Сравнение иерархических деревьев
    • 2. 11. Выделение бимодальных генов
    • 2. 12. Нормализация по бимодальности
    • 2. 13. Поиск групп коэкспрессирующихся бимодальных генов
  • ГЛАВА 3. РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ
    • 3. 1. Функциональный анализ информативных генов классификаторов
      • 3. 1. 1. Описание данных
      • 3. 1. 2. Наборы информативных генов для разных признаков отличаются по белковому функциональному профилю
      • 3. 1. 3. Топологические параметры наборов информативных генов классификаторов зависят от признака
      • 3. 1. 4. Транскрипционная регуляция информативных генов классификаторов и регуляция, осуществляемая самими информативными генами, отражают биологическую основу соответствующих признаков
      • 3. 1. 5. Способность наборов информативных генов и их объединенных множеств формировать непосредственно связанные сети
      • 3. 1. 6. Анализ обогащения по функциональным онтологиям наборов информативных генов и их объединенных множеств
      • 3. 1. 7. Анализ функциональных закономерностей для информативных генов признаков Н, I, Ь и М
      • 3. 1. 8. Сходство наборов информативных генов
      • 3. 1. 9. Корреляция между сходством наборов информативных генов и качеством предсказания классификаторов
      • 3. 1. 10. Обсуждение
    • 3. 2. Явление бимодальности экспрессионного профиля генов
      • 3. 2. 1. Феномен бимодальности экспрессионного профиля генов и идентификация бимодальных генов
      • 3. 2. 2. Бимодальность экспрессионного профиля гена функционально обусловлена
      • 3. 2. 3. Нормализация экспрессии для бимодальных генов
      • 3. 2. 4. Группы коэкспрессирующихся генов как функциональные модули
      • 3. 2. 5. Группы коэкспрессирующихся генов как потенциальные дескрипторы для кластеризации образцов рака молочной железы
      • 3. 2. 6. Обсуждение
  • ВЫВОДЫ

Решение задач классификации и кластеризации данных по экспрессии генов на основе их функциональных взаимодействий (реферат, курсовая, диплом, контрольная)

В" последние годы активно развивается направление «omics» исследований, в рамках которых при помощи высокопроизводительных молекулярно-биологических методов стало возможным одновременно получить информацию о практически всех компонентах биологической системы, как на генетическом, так и на постгенетическом уровнях.

Одной из главных целей «omics» исследований является определение дескрипторов биологических признаков, которые являются решением двух основных задач:

— Задача классификации. Данная задача предполагает наличие выборки биологических объектов, например экспрессионных профилей, для которых известно, к каким классам, например подтипам болезней, они относятся. На базе этой выборки создается классификатор, способный классифицировать произвольный объект как представителя одного из классов. Классификатор представляет собой подмножество информативных генов (или белков), экспериментальные характеристики которых, например уровень экспрессии, могут быть использованы для того, чтобы по некоторому правилу различать биологические состояния (классы). Так, за последнее десятилетие было создано большое число экспрессионных классификаторов для предсказания различных биологических признаков, например, формирования метастаз у больных раком молочной железы [Chang и др., 2005; van’t Veer и др., 2002].

— Задача кластеризации. Данная задача предполагает поиск классов биологических объектов на основании сходства их экспериментальных характеристик. Примером такой задачи может быть поиск подтипов рака молочной железы путем кластеризации экспрессионных профилей пациентов, то есть формирования кластеров таким образом, чтобы каждый кластер состоял из схожих экспрессионных профилей, а экспрессионные профили разных кластеров существенно отличались.

В настоящее время в большинстве случаев исследователи в рамках этих двух задач не учитывают функциональные связи генов или белков между собой или с изучаемым признаком. Так, чаще всего к основным характеристикам классификатора относят такие статистические характеристики как точность предсказания и воспроизводимость этой точности на независимых данных. Однако в последнее время ряд авторов указывают на важность третьей характеристики классификаторов — функциональной основы классификатора, биологически обоснованной связи его набора информативных генов с описываемым признаком. Изучение функциональной основы классификаторов ранее было ограничено отсутствием достаточно обширной выборки классификаторов.

Дизайн проекта MAQC II (MicroArray Quality Control phase II, контроль качества микрочипов, фаза II) [Shi L и др., 2010] предоставил уникальную возможность провести первый всесторонний функциональный анализ информативных генов экспрессионных классификаторов. В рамках проекта были проанализированы 6 экспрессионных экспериментов для 13 биологических признаков, среди которых три соответствовали патологиям, индуцированным, химическими соединениями, и десять — различным раковым состояниям. Организаторы проекта* создали уникальные условия, предполагающие, что для одного и того же набора экспрессионных данных, соответствующих некоторому признаку, 36 исследовательских групп независимым образом построят классификаторы 36 различными методами для каждого изучаемого признака. Всего в рамках проекта было создано 262 классификатора, для которых мы и произвели оценку качества на функциональном уровне.

Как и в случае задачи классификации, большинство современных методов кластеризации экспрессионных данных основывается на профилях экспрессии индивидуальных генов без учета функциональных связей между ними или с изучаемым признаком. Однако этот подход не справляется с такими сложными задачами как, например, выделение подтипов гетерогенных заболеваний. Так, самая лучшая к настоящему моменту кластеризация пациентов с раком молочной железы, основанная на профилях экспрессии индивидуальных генов, не относит ни к одному из результирующих кластеров около одной трети выборки пациентов [80гНе и др., 2003]. В нашей работе мы исследовали новый подход к кластеризации, базирующийся на использовании не только информации об экспрессии индивидуальных генов, но и информации о функционально обусловленном бимодальном характере экспрессионного профиля гена — явлении, наблюденном и изученном нами так же в рамках данной работы. Данный подход не только решает ряд проблем мета-анализа, которые не решает традиционный подход, но и создает основу для создания полной классификации подтипов рака молочной железы. Цели работы:

1. Исследовать функциональную основу экспрессионных классификаторов.

2. Изучить явление бимодальности экспрессионного профиля генов и исследовать его как возможную основу для метода кластеризации. Задачи:

1. Произвести функциональный анализ информативных генов 262 экспрессионных классификаторов проекта МАС) С II.

2. Оценить корреляцию между связью наборов информативных генов экспрессионных классификаторов с функциональной основой описываемого признака и параметрами качества предсказания классификаторов.

3. Создать метод определения степени бимодальности экспрессионного профиля гена.

4. Определить гены с бимодальным экспрессионным профилем для выборки экспрессионных данных по раку молочной железы и изучить их свойства.

5. Изучить возможность использования свойства бимодальности экспрессионного профиля гена для кластеризации экспрессионных профилей пациентов больных раком молочной железы, в результате которой все пациенты относились бы к одному из кластеров.

Научная новизна. 1) Впервые был проведен крупномасштабный функциональный анализ экспрессионных классификаторов, в результате которого, было показано наличие связи между функциональными характеристиками информативных генов классификаторов и соответствующим признаком. 2) Также в рамках данной работы впервые была показана положительная корреляция между согласованностью наборов информативных генов экспрессионных классификаторов на функциональном уровне и качеством предсказания, классификаторов. 3) Впервые было показано, что вырожденность экспрессионных классификаторов" - это явление функционально обусловленное. 4) Впервые было показано явление бимодальности экспрессионного профиля гена для рака молочной’железы, 5) Был предложенновый" подход к кластеризации, базирующийся на явлении бимодальности экспрессионного профиля-гена, который может стать основой для определения всех подтипов рака молочной железы.

Практическое значение. Экспрессионные классификаторы используются в различных практических областях. Диагностика заболеваний — является одним из самых важных приложений экспрессионных классификаторов. Несмотря на это в последние годы доверие к экспрессионным классификаторам, как потенциальным диагностикумам, заметно^ снизилось. Проект МАС>С II ставил перед собой цель оценить.

13 качество экспрессионных классификаторов. Результатом проекта является вывод о их высоком качестве, как с точки зрения статистических параметров, так и с точки зрений исследованных в представленной работе функциональных параметров экспрессионных классификаторов. Это дает основание для более широкого по сравнению с настоящим применения экспрессионных классификаторов в диагностике.

Экспрессионные классификаторы решают задачу дифференцировки известных подтипов болезней, тем не менее, для целей диагностики задача поиска подтипов заболевания является еще более актуальной. Так, актуальной проблемой является определение всех подтипов такого гетерогенного заболевания, как рак молочной железы. Предполагают, что термин «рак молочной железы» объединяет несколько различных болезней, с различными причинами возникновения, ходом заболеваний и прогнозами, и для каждой болезни необходима специфическая терапия. Чтобы более эффективно лечить пациентов с раком молочной железы необходимо иметь возможность диагностировать разные подтипы рака молочной железы. В настоящий момент не существует полной классификации рака молочной железы. В данной работе разработан подход к кластеризации, способный стать основой для создания такой классификации.

выводы.

1. Функциональный анализ 262 экспрессионных классификаторов проекта МАС^С 1 Г показал, что наборы информативных генов классификаторов, построенных различными методами, обладают функциональной основой, согласующейся с описываемым признаком. Этот факт представляется не случайным и указывает на то, что методы классификации обладают свойством направленно отбирать гены, характеризующие функциональную основу анализируемого признака.

2. Вырожденность экспрессионных классификаторов функционально обусловлена.

3. Существует положительная корреляция между качеством предсказания, экспрессионных классификаторов и связью информативных генов экспрессионных классификаторов с функциональной основой описываемого признака.

4. Для выборки экспрессионных данных по раку молочной железы мы описали свойство некоторых генов* формировать два различныхуровня" экспрессии, свойство бимодальности экспрессионного. профиля-гена.

5. Мы разработали метод определения степени бимодальности. экспрессионного профиля гена на основе расчета^ статистики т, сходной с 1:-статистикой, которая оценивает относительную разницу между средними значениями сигналов для двух пиков распределения.

6. Мыопределили 866 генов" с бимодальным экспрессионным профилем для выборки экспрессионных данных по раку молочной железы и. показали, что бимодальность — это свойство экспрессии гена специфичное по отношению к физиологическому состоянию, и не зависящее от типа платформы, экспериментальных условий и состава когорты пациентов.

7. Был разработан подход к кластеризации, основанный на функционально обусловленном бимодальном характере экспрессионного профиля генов, который может быть использован для полной кластеризации выборки пациентов с раком молочной железы.

Показать весь текст

Список литературы

  1. В. Н. Восстановление зависимостей по эмпирическим данным. М., Наука. 1979, 448.
  2. К.В. Машинное обучение, курс лекций, 2010. www.MachineLearning.ru.
  3. Albert R. Scale-free networks in cell biology. J Cell Sci. 2005- 118(21): 4947−4957.
  4. Altman D.G., Bland J.M. Diagnostic tests. 1: Sensitivity and specificity. BMJ. 1994- 308(6943): 1552.
  5. Ashburner M., Ball C.A., Blake J.A., et al. Gene ontology: tool for the unification of biology. The Gene Ontology Consortium. Nat Genet. 2000- 25(1): 25−29.
  6. Ball C.A., Sherlock G., Parkinson H., et al. Microarray Gene Expression Data (MGED) Society. Standards for microarray data. Science. 2002- 298(5593): 539.
  7. Barabasi A. L., Albert R. Emergence of scaling in random networks. Science. 1999- 286(5439): 509−512.
  8. Barabasi A.L., Oltvai Z.N. Network biology: understanding the cell’s functional organization. Nat. Rev. Genet. 2004- 5: 101−113.
  9. Barbacioru C., Wang Y., Canales R., et al. Effect of various normalization methods on Applied Biosystems expression array system data. BMC Bioinformatics. 2006- 7: 533.
  10. Barthelmes J., Ebeling C., Chang A., et al. BRENDA, AMENDA and FRENDA: the enzyme information system in 2007. Nucleic Acids Res. 2007- 35: 511−514.
  11. Bayani J., Squire J. A. Comparative genomic hybridization. Curr Protoc Cell Biol. 2005- 22: 22−26.
  12. Bizzi, A., Ceriani, L., Gerundino, M., et al. Adriamycin causes hyperlipemia as a consequence of nephrotoxicity. Toxicol. Lett. 1983- 18(3): 291−300.
  13. Blaschke C., Andrade M. A., Ouzounis C., et al. Automatic extraction" of biological* information from scientific text: protein-protein interactions. Proc Int Conf Intell Syst Mol Biol. 1999- 60−67.
  14. Bonnefoi H., Potti A., Delorenzi M., et al. Validation of gene signatures that predict the response of breast cancer to neoadjuvant chemotherapy: a substudy of the EORTC 10 994/BIG 00−01 clinical trial. Lancet Oncol. 2007- 8(12): 1071−1078.
  15. Boutet E., Lieberherr D., Tognolli M., et al. UniProtKB/Swiss-Prot. Methods Mol Biol. 2007- 406: 89−112.
  16. Boutros P.C., Lau S.K., Pintilie M., et al. Prognostic gene signatures for non-small-cell lung cancer. Proc Natl Acad Sei USA. 2009- 106: 2824−2828.
  17. Cohen J. A coefficient of agreement for nominal scales. Educational and Psychological Measurement. 1960- 20(1): 37−46.
  18. Chuang H.Y., Lee E., Liu Y.T., et al. Network-based classification of breast cancer metastasis. Mol Syst Biol. 2007- 3: 140.
  19. Daraselia N., Yuryev A., Egorov S., et al. Extracting human protein interactions from MEDLINE using a full-sentence parser. Bioinformatics. 2004- 20(5): 604−611.
  20. Deane C.M., Salwinski t., Xenarios I., et al. Protein interactions: two methods for assessment of the reliability of high throughput observations. Mol Cell Proteomics. 2002- 1(5): 349−356.
  21. Dezso Z., Nikolsky Y., Miller J., et al. Identifying disease-specific genes based on their topological significance in protein networks. BMC Systems Biology. 2009- 3: 36 .
  22. Dadoun C., Raguenez-Viotte, G. Celiptium-induced nephrotoxicity and lipid peroxidation in rat renal cortex. Cancer Chemother.Pharmacol. 1990- 27(3): 178 186.
  23. Desmedt C., Piette F., Loi S., et al. Strong time dependence of the 76-gene prognostic signature for node-negative breast cancer patients in the TRANSBIG multicenter independent validation series. Clin Cancer Res. 2007- 13: 3207−3214.
  24. Dettmer K., Aronov P. A. Hammock B. D. Mass spectrometry-based metabolomics. Mass Spectrom Rev. 2007- 26(1): 51−78.
  25. Doniger S.W., Salomonis N., Dahlquist K.D., et al. MAPPFinder: using gene ontology and GenMAPP to create a global gene-expression profile from microarray data. Genome Biol. 2003- 4: 7.
  26. Dozmorov I., Knowlton N., Tang Y., et al. Hypervariable genes-experimental error or hidden dynamics. Nucleic Acids Res. 2004- 32(19): 147.
  27. Draghici S., Khatri P., Martins R.P., et al. Global functional profiling of gene expression. Genomics. 2003- 81: 98−104.
  28. Ein-Dor L., Kela I., Getz G., et al. Outcome signature genes in breast cancer: is there a unique set? Bioinformatics. 2005- 21: 171−178.
  29. Ein-Dor L., Zuk O., Domany E. Thousands of samples are needed to generate a robust gene list for predicting outcome in cancer. Proc Natl Acad Sci USA. 2006- 103: 5923−5928.
  30. Ekins S., Nikolsky Y., Bugrim A., et al. Pathway mapping tools for analysis of high content data: Methods Mol Biol- 2007- 356: 319−350.
  31. Eun J.W., Ryu S.Y., Noh J. Hi, et al. Discriminating the molecular basis of hepatotoxicity using the large-scale characteristic molecular signatures of toxicants by expression profiling analysis. Toxicology. 2008- 249(2−3): 176−183.
  32. Fan C., Oh D.S., Wessels L., et al. Concordance among gene-expression-based predictors for breast cancer. N Engl J Med. 2006- 355: 560−569.
  33. Fisher R.A. The correlation between relatives under the supposition of Mendelian inheritance. Trans R Soc Edinburgh. 1918- 52: 399−433.
  34. Gavin A.C., Bosche M., Krause R., et al. Functional organization of the yeast proteome by systematic analysis of protein complexes. Nature. 2002- 415(6868): 141−147.
  35. Ge H., Liu Z., Church G. M., et al. Correlation between transcriptome and interactome mapping data from Saccharomyces cerevisiae. Nat Genet. 2001- 29(4): 482−486.
  36. Gershon D: Microarray technology: an array of opportunities. Nature. 2002- 416: 885−891.
  37. Goh K.I., Cusick M.E., Valle D., et al. The human disease network. Proc Natl Acad Sci USA. 2007- 104: 8685−8690.
  38. Gomase V.S., Kale K.V., Tagore S., et al. Proteomics: technologies for protein analysis. Curr Drug Metab. 2008- 9(3): 213−220.
  39. Gonczi M., Papp H., Biro T., et al. Effect of protein kinase C on transmembrane calcium fluxes in HaCaT keratinocytes. Exp Dermatol. 2002- 11: 25−33.
  40. Hakes L., Pinney J., Robertson D., et al. Protein-protein interaction networks and biology—what's the connection? Nature Biotechnology. 2008- 26(1): 69−72.
  41. Han J.D., Bertin N., Hao T., Goldberg D.S., et al. Evidence for dynamically organized modularity in the yeast protein-protein interaction network. Nature. 2004- 430(6995): 88−93.
  42. Hanahan D., Weinberg R.A. The hallmarks of cancer. Cell. 2000- 100: 5770.
  43. Hartwell L.H., Hopfield J.J., Leibler S., et al. From molecular to modular cell biology. Nature. 1999- 402(676lSuppl): 47−52.
  44. Hess K.R., Anderson K., Symmans W.F., et al. Pharmacogenomic predictor of sensitivity to preoperative chemotherapy with paclitaxel and fluorouracil, doxorubicin, and cyclophosphamide in breast cancer. J Clin Oncol. 20 06- 24: 4236−4244.
  45. Hu Z., Fan C., Oh D.S., et al. The molecular portraits of breast tumors are conserved across microarray platforms. BMC Genomics. 2006- 7: 96.
  46. Huang da W., Sherman B.T., Tan Q., et al. The DAVID Gene Functional Classification Tool: a novel biological module-centric algorithm to functionally analyze large gene lists. Genome Biol. 2007- 8(9): 183.
  47. Huang Q., Jin X., Gaillard E.T., et al. Gene expression profiling reveals multiple toxicity endpoints induced by hepatotoxicants. Mutat. Res. 2004- 549: 147−168.
  48. Huang Y., Penchala S., Pham A.N., et al. Genetic variations and gene expression of transporters in drug disposition and response. Expert Opin Drug Metab Toxicol. 2008- 4(3): 237−254.
  49. Ideker T., Thorsson V., Ranish J. A., et al. Integrated genomic and proteomic analyses of a systematically perturbed metabolic network. Science. 2001- 292(5518): 929−934.
  50. Ideker T., Sharan R. Protein networks in disease. Genome Res. 2008- 18: 644−652t
  51. Irizarry R.A., Warren D., Spencer F., et al. Multiple-laboratory comparison of microarray platforms. Nat Methods. 2005- 2: 345−350.
  52. Ito T., Chiba T., Ozawa R., et al. A comprehensive two-hybrid analysis to explore the yeast protein interactome. Proc Natl Acad Sci USA. 2001- 98(8): 4569−4574.
  53. Ivshina A.V., George J., Senko O., et al. Genetic reclassification of histologic grade delineates new clinical subtypes of breast cancer. Cancer Res. 2006- 66: 10 292−10 301.
  54. Jensen L.J., Kuhn M., Stark M., et al. STRING 8—a global view on proteins and their functional interactions in 630 organisms. Nucleic Acids Res. 2009- 37: 412−416.
  55. Kanda N., Watanabe S. Prolactin Enhances Interferon-y-Induced Production of CXC Ligand 9 (CXCL9), CXCL10, and CXCL11 in Human Keratinocytes. Endocrinology. 2007- 148: 2317−2325.
  56. Kauraniemi P., Kuukasjarvi T., Sauter G., et al. Amplification of a 280-kilobase core region at the ERBB2 locus leads to activation of two hypothetical proteins in breast cancer. Am J Pathol. 2003- 163: 1979−1984.
  57. Kemmeren P., van Berkum N.L., Vilo J., et al. Protein interaction verification and functional annotation by integrated analysis of genome-scale data. Mol Cell. 2002- 9(5): 1133−1143.x142
  58. Kerrien S., Alam-Faruque Y., Aranda B., et al. IntAct—open source resource for molecular interaction data. Nucleic Acids Res. 2007- 35: 561−565.
  59. Khalil I.G., Hill C. Systems biology for cancer. Curr Opin Oncol. 2005- 17(1): 44−48.
  60. Kiechle F.L., Zhang X., Holland-Staley C.A. The -omics era and its impact. Arch Pathol Lab Med. 2004- 128(12): 1337−1345.
  61. Kitano H. Computational systems biology. Nature. 2002- 420(6912): 206 210.
  62. Kim S.Y., Kim Y.S. A gene sets approach for identifying prognostic gene signatures for outcome prediction. BMC Genomics. 2008- 9: 177.
  63. Lacroix M. Significance, detection and markers of disseminated breast cancer cells. Endocr Relat Cancer. 2006- 13: 1033−1067.
  64. Lamy P., Andersen C. L., Wikman F. P., et al. Genotyping and annotation of Affymetrix SNP arrays. Nucleic Acids Res. 2006- 34(14): 100.
  65. Levi M., Cronin R.E. Early selective effects of gentamicinon renal brush-border membrane Na-Pi cotransport and Na-Hexchange. Am. J. Physiol. 1990- 258(5 Pt 2): 1379−1387.
  66. Liu C.C., Hu J., Kalakrishnan M., et al. Integrative disease classification based on cross-platform microarray data. BMC Bioinformatics. 2009- 10(Suppl 1): 25.
  67. Mao S., Wang C., Dong G. Evaluation of inter-laboratory and cross-platform concordance of DNA microarrays through discriminating genes and classifier transferability. J Bioinform Comput Biol. 2009- 7(1): 157−173.
  68. MAQC Consortium, Shi E., Reid E. H, et alt The MicroArray Quality Control (MAQC) project shows inter- and intraplatform reproducibility of gene expression measurements. NatBiotechnol. 2006- 24: 1151−1161.
  69. McCall M: N., Irizarry R.A. Consolidated strategy for the analysis of microarray spike-in data. Nucleic Acids Res. 2008- 36(17): 108.
  70. Mrowka R., Patzak A., Herzel H. Is there a bias in proteome research?
  71. Genome research. 2001- 11(12): 1971−1973.
  72. Mullins M., Perreard L., Quackenbush J.F., et al. Agreement in breast cancer classification between microarray and quantitative reverse transcription PCR from fresh-frozen and formalin-fixed, paraffin-embedded tissues. Clin Chem. 2007- 53: 1273−1279.
  73. Murphy D. Gene expression studies using microarrays: principles, problems, and prospects. Adv Physiol Educ. 2002- 26(1−4): 256−270.
  74. Murtagh F. Multidimensional Clustering Algorithms. Physica-Verlag: WienWurzburg. 1985- V.4.
  75. Natsoulis G., El Ghaoui L., Lanckriet G.R., et al. Classification of a large microarray data set: algorithm comparison and analysis of drug signatures. Genome Res. 2005- 15(5): 724−736.
  76. Natsoulis G., Pearson C.I., Gollub J., et al. The liver pharmacological and xenobiotic gene response repertoire. Mol Syst Biol. 2008- 4: 175
  77. Nikolsky Y., Ekins S., Nikolskaya T., et al. A novel method for generation of signature networks as biomarkers from complex high throughput data. Toxicol Lett. V. 2005- 158: 20−29
  78. Nikolsky Y., Kirillov E., Serebryiskaya T., et al. Sequential clustering of breast cancers using bimodal gene expression. Proceed AACR Ann Meeting. 2007- 141.
  79. Nikolsky Y., Sviridov E., Yao J., et al. Genome-wide functional synergy between amplified and mutated genes in human breast cancer. Cancer Res. 2008- 68: 9532−9540
  80. Nikolsky Y., Kirillov E., Zuev R., et al. Functional analysis of OMICs data and small molecule compounds in an integrated «knowledge-based» platform. Methods Mol Biol. 2009- 563: 177−196.
  81. Oh D.S., Troester M.A., Usary J., et al. Estrogen-regulated genes predict survival in hormone receptor-positive breast cancers. J Clin Oncol. 2006- 24: 1656−1664.
  82. Pagel P., Kovac S., Oesterheld M., et al. The MIPS mammalian proteinprotein interaction database. Bioinformatics. 2005- 21(6): 832−834.
  83. Paik S., Shak S., Tang G., et al. A multigene assay to predict recurrence of tamoxifen-treated, node-negative breast cancer. N Engl J Med. 2004- 351: 28 172 826.
  84. Pavlidis P., Lewis D.P., Noble W.S. Exploring gene expression data with class scores. Pac Symp Biocomput. 2002- 474−485
  85. Pavlidis P., Qin J., Arango V., et al. Using the gene ontology for microarray data mining: a comparison of methods and, application to age effects in human prefrontal cortex. Neurochem Res 2004- 29: 1213−1222.
  86. Pawitan Y., Bjohle J., Amler L., et al. Gene expression profiling spares early breast cancer patients from" adjuvant therapy: derived and validated' in two population-based cohorts. Breast Cancer Res. 2005- 7: 953−964.
  87. Peluso I., Pallone F., Monteleone G. Interleukin-12 and Thl immune response in Crohn’s disease: pathogenetic relevance and therapeutic implication. World J Gastroenterol. 2006- 12(35): 5606−5610.
  88. Peri S., Navarro J.D., Amanchy R., et al. Development of human protein reference database as an initial platform for approaching systems biology in humans. Genome Res. 2003- 13: 2363−2371.
  89. Perou C.M., S0rlie T., Eisen M.B., et al. Molecular portraits of human breast tumours. Nature. 2000- 406: 747−752.
  90. Perren T.J. c-erbB-2 oncogene as a prognostic marker in breast cancer. Br J Cancer. 1991- 63:328−332.
  91. Popovici V., Chen W., Gallas B.G., et al. Effect of training-sample size and classification difficulty on the accuracy of genomic predictors. Breast Cancer Res. 2010- 12(1): 5.
  92. Querfeld U. Disturbances of lipid metabolism in children with chronic renal failure. Pediatr. Nephrol. 1993- 7(6): 749−757.
  93. Robertson G., Hirst M., Bainbridge M., et al. Genomewide profiles of STAT1 DNA association using chromatin immunoprecipitation and massively parallel sequencing. Nature methods. 2007- 4: 651−657.
  94. Rual J.F., Venkatesan K., Hao T., et al. Towards a proteome-scale map. of the human protein-protein interaction network. Nature. 2005- 437: 1173−1178.
  95. Sauro H.M., Bergmann F.T. Standards and ontologies in computational systems biology. Essays Biochem. 2008- 45: 211−222.
  96. Salwinski L., Miller C.S., Smith A.J., et al. The Database of Interacting Proteins: 2004 update. Nucleic Acids Res. 2004- 32: 449−451.
  97. Sanchez C., Lachaize C., Janody F., et al. Grasping at molecular interactions and genetic networks in Drosophila melanogaster using FlyNets, an Internet database. Nucleic Acids Res. 1999- 27(1): 89−94.
  98. Schena M., Shalon D., Davis R.W., et al. Quantitative monitoring of gene expression patterns with a complementary DNA microarray. Science. 1995- 270(5235): 467−470.
  99. Schweitzer B., Predki P., Snyder M. Microarrays to characterize protein interactions on a whole-proteome scale. Proteomics. 2003- 3(11): 2190−2199.
  100. Selkov E. Jr, Grechkin Y., Mikhailova N., et al. MPW: the Metabolic Pathways Database. Nucleic Acids Res. 1998- 26(1): 43−45.
  101. Seo J., Hoffman E. Probe set algorithms: Is there a rational best bet? BMC Bioinformatics. 2006- 7: 395.
  102. Serkova N., Klawitter J., Niemann C. U. Organ-specific response to inhibition of mitochondrial metabolism by cyclosporine in the rat. Transpl. Int. 2003- 16(10): 748−755.
  103. Shalon D., Smith S J., Brown P.O. A DNA microarray system for analyzing complex DNA samples using two-color fluorescent probe hybridization. Genome Res. 1996- 6(7): 639−645.
  104. Shen R., Chinnaiyan A.M., Ghosh D. Pathway analysis reveals functional convergence of gene expression profiles in breast cancer. BMC Med Genomics. 2008- 1:28.
  105. Shi L., Jones W.D., Jensen R.V., et al. The balance of reproducibility, sensitivity, and specificity of lists of differentially expressed genes in microarray studies. BMC Bioinformatics 2008- 9(Suppl 9): 10.
  106. Shi L., Campbell G., Jones W.D., W., et al. The Micro Array Quality Control (MAQC)-II study of common practices for the development and validation of microarray-based predictive models. Nat. Biotechnol. 2010- 28(8): 827−838.
  107. Shi W., Bessarabova M., Dosymbekov D-, et al. Functional analysis of multiple genomic signatures demonstrates that classification algorithms choose phenotype-related genes. The Pharmacogen. J. 2010- 10(4): 310−323.
  108. Siegel S., Castellan N.J. Nonparametric statistics for the behavioral sciences. McGraw-Hill Book Company, 1998.
  109. S0rlie T., Perou C.M., Tibshirani R., et al. Gene expression patterns of breast carcinomas distinguish tumor subclasses with clinical implications. Proc. Natl. Acad. Sci. USA. 2001'- 98: 10 869−10 874.
  110. Sorlie T., Tibshirani R., Parker J., et al. Repeated observation of breast tumor subtypes in independent gene expression data sets. Proc. Natl. Acad. Sci. USA. 2003- 100: 8418−8423.
  111. Stanton J.L., Green D.P. Meta-analysis of gene expression ins mouse preimplantation embryo development. Mol HumReprod 2001- 7: 545−552.
  112. Stelzl U., Worm U., Lalowski M., et al. A human protein-protein interaction network: a resource for annotating the proteome. Cell. 2005- 122: 957−968.
  113. Subramanian A., Tamayo P., Mootha V.K., et al. Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles. Proc. Natl. Acad. Sci. USA. 2005- 102: 15 545−15 550.
  114. Tang T., Francois N., Glatigny A., et al. Expression ratio evaluation in two-colour microarray experiments is significantly improved by correcting image misalignment. Bioinformatics. 2007- 23(20): 2686−2691.
  115. Teschendorff A.E., Naderi A., Barbosa-Morais N.L., et al. PACK: Profile Analysis using Clustering and Kurtosis to find molecular classifiers in cancer. Bioinformatics. 2006- 22(18): 2269^-2275
  116. Tian L., Greenberg S.A., Kong S.W., et al. Discovering statistically significant pathways in expression profiling studies. Proc. Natl. Acad. Sci. USA. 2005- 102: 13 544−13 549
  117. Tilford C.A., Siemers N.O. Gene Set Enrichment Analysis. Methods. Mol*. Biol. 2009- 563: 99−121.
  118. Troester M.A., Hoadley K.A., Parker J.S., et al. Prediction of toxicant-specific gene expression signatures after chemotherapeutic treatment of breast cell lines. Environ. Health. Perspect. 2004- 112(16): 1607−1613.
  119. Wang Y.N., Chang W.C. Induction of disease-associated keratin 16 gene expression by epidermal growth factor is regulated through cooperation of transcription factors Spl and c-Jun. J Biol Chem. 2003- 278: 45 848−45 857.
  120. Wang Y., Klijn J.G., Zhang Y., et al. Gene-expression profiles to predict distant metastasis of lymph-node-negative primary breast cancer. Lancet: 2005- 365: 671−679.
  121. Ward J.H. Hierarchical Grouping to Optimize an Objective Function. Journal of the American Statistical Association. 1963- 58(301): 236−244.
  122. Wei Z., Li H. A Markov random field model for network-based analysis of genomic data: Bioinformatics 2007- 23: 1537−1544.
  123. Weigelt B., Hu Z., He X., et al. Molecular portraits and 70-gene prognosis signature are preserved throughout the metastatic process of breast cancer. Cancer Res. 2005−65:9155−9158.
  124. Westergaard M., Henningsen J., Johansen C., et al. Expression and localization of peroxisome proliferator-activated receptors and nuclear factor kappaB in normal and lesional psoriatic skin. J Invest Dermatol. 2003- 121: 1104— 1117.
  125. Willis R.C., Hogue C.W. Searching, viewing, and visualizing data in the Biomolecular Interaction Network Database (BIND). Gurr Protoc Bioinformatics. 2006- 8: 8.9.
  126. Wirapati P., Sotiriou C., Kunkel S., et al. Meta-analysis of gene expression profiles in breast cancer: toward a unified understanding of breast cancer subtyping and prognosis signatures. Breast Cancer Res. 2008- 10: 65.
  127. Wood L.D., Parsons D.W., Jones S., et al. The genomic landscapes of human breast and colorectal cancers. Science. 2007- 318(5853): 1108−11 013'.
  128. Yao Y., Richman L., Morehouse C., et al. Type I interferon: potential therapeutic target for psoriasis? PLoS ONE. 2008- 3: 2737.
  129. Yu H., Greenbaum D., Xin Lu H., et al. Genomic analysis of essentiality within protein networks. Trends Genet. 2004- 20(6): 227−231.
  130. Zhang C., Li H.R., Fan J.B., et al. Profiling alternatively spliced mRNA isoforms for prostate cancer classification. BMC Bioinformatics. 2006- 7: 202.
  131. Zhao H.Y., Yue P.Y., Fang K.T. Identification of differentially expressed genes with multivariate outlier analysis. J. Biopharm: Stat. 2004- 14(3): 629−646.
  132. Zhao K.W., Li D., Zhao Q., et al. Interferon-alpha-induced expression of phospholipid scramblase 1 through STAT1 requires the sequential activation of protein kinase Cdelta and JNK. The Journal of biological chemistry 2005- 280: 42 707—42 714.
Заполнить форму текущей работой