ACSN — глобальный атлас сигнальных путей. От молекулярной географии рака к новым информационным технологиям в биологии
26 ноября 2014
ACSN — глобальный атлас сигнальных путей. От молекулярной географии рака к новым информационным технологиям в биологии
- 2309
- 2
- 2
-
Автор
-
Редакторы
Статья на конкурс «био/мол/текст»: Современная молекулярная биология испытывает серьезный системный кризис, связанный с «перепроизводсвом» экспериментальных данных. Но адаптация передовых информационных методов, таких, как технология Google Maps для визуализации молекулярно-биологической информации (система навигации NaviCell) в сочетании с биоинформатическими методами моделирования и анализа, открывает новые возможности для использования данных высокопроизводительных методик.
Конкурс «био/мол/текст»-2014
Эта статья представлена на конкурс научно-популярных работ «био/мол/текст»-2014 в номинации «Биоинформатика и молекулярная эволюция».
Главный спонсор конкурса — дальновидная компания «Генотек».
Конкурс поддержан ОАО «РВК».
Спонсором номинации «Биоинформатика» является Институт биоинформатики.
Спонсором приза зрительских симпатий выступила фирма Helicon.
Свой приз также вручает Фонд поддержки передовых биотехнологий.
Спонсор публикации этой статьи — Лев Макаров.
Кризис перепроизводства в науке и рождение системной биологии
Всего какие-то два—три десятка лет назад, не говоря уже о временах более отдаленных (ничтожный по историческим меркам промежуток времени), главной проблемой молекулярной биологии был острый дефицит экспериментальных данных. Очистка и кристализация белков и получение информации об их пространственной структуре были сложным многолетним таинством, похожим на алхимическое превращение. Секвенирование (расшифровка последовательности) гена или белка — таинством многомесячным, достойным отдельной статьи. Изучение взаимодействий макромолекул требовало «штучных» экспериментов, протоколы для которых оттачивались подолгу. Теоретическая биология занималась разработкой предсказательных алгоритмов для всего и вся, и предсказания эти при всей своей неточности были очень востребованы, позволяя хоть как-то прикрыть и залатать зияющие прорехи нашего незнания.
Ситуация изменилась быстро и драматично. Появились экспериментальные методы, позволяющие анализировать экспрессию десятков тысяч генов одновременно, следить за поведением тысяч белков, отслеживать мутации во всем геноме. Результаты, полученные в ходе таких высокопроизводительных (high-throughput) экспериментов расширили наши представления о молекулярных основах живого и одновременно стали источником принципиально нового системного кризиса... Молекулярная биология перестала страдать от дефицита данных и стала задыхаться, придавленная их избытком .
Иногда, обозревая многостраничные перечни статей, выдаваемые пабмедом в ответ на небольшой запрос, нет-нет, да и подумаешь: не исключено, что мы уже обладаем всей необходимой для понимания жизни информацией, просто эта информация из рук вон плохо организована... — Прим. авт.
Ответом на этот вызов стало рождение системной биологии — науки, ставящей своей целью интеграцию самой разной молекулярно-биологической информации в единую (и по мере сил внутренне непротиворечивую) систему. Эта задача эффективного «монтажа» разных типов данных, разных уровней научного познания не решена до сих пор, но в этой статье мы покажем по крайней мере несколько возможных направлений ее решения .
Заинтересованному читателю рекомендовано также обратиться к двум другим эссе, рассказывающим о преображении облика биологической науки уже в наши дни в сторону «сухой биологии»: «Я б в биоинформатики пошёл, пусть меня научат!» [1] и «Вычислительное будущее биологии» [2]. — Ред.
Визуальная биология на пути от «табличного» к «графическому» представлению данных
Одним из очевидных и эффективных способов интеграции информации является использование визуальных образов, хотя бы двумерных и неподвижных, хотя в идеале, конечно, и трехмерных, и динамических. Удачная «картинка» стóит многостраничного описания. И биологи (в отличие от представителей многих других наук) всегда отдавали должное этой особенности человеческого восприятия. Биология всегда была «визуальной» наукой, вплоть до того, что до недавнего времени умение рисовать являлось одним из важнейших профессиональных навыков ботаников и зоологов. И по сей день качественная инфографика является отличительным «фирменным знаком» лучших биологических публикаций. В фундаментальной статье Вайнберга об отличительных признаках рака (ко которой мы еще будем говорить ниже) много тонких мыслей и глубоких обобщений, но в память врезаются не они, а знаменитый рисунок с пиктограммами, отражающими разные аспекты злокачественной трансформации клеток, который вынесен в заголовок нашей статьи.
Поэтому не должно вызывать удивления, что именно «визуальный» подход был положен в основу системной биологии, и важнейшим способом интеграции молекулярно-биологических данных в ней стали графические схемы — карты молекулярных взаимодействий, молекулярных событий, связанных причинно-следственными связями и определяющих разные аспекты жизнедеятельности клетки (скорость деления, способность синтезировать те или иные вещества и так далее). Начало такому способу представления молекулярных данных положили биохимики, когда еще в 60-х годах 20-го века стали изображать этапы превращений низкомолекулярных веществ в виде графических схем, как относительно простых (например, известный любому выпускнику биофака цикл Кребса), так и гораздо более сложных (например, синтез аминокислот и витаминов). Формальный язык Графической Аннотации в Системной Биологии изначально был создан для визуализации именно биохимической информации, а уже потом стал использоваться молекулярными биологами [3].
Молекулярный детектив — реконструкция сигнальных путей
Задача системного биолога, реконструирующего в виде такой схемы цепочку молекулярных взаимодействий, ответственных, например, за деление клетки, в чем-то похожа на задачу археолога, воссоздающего из осколков древнюю вазу. Сначала необходимо из груды керамического мусора отобрать осколки, относящиеся именно к этой вазе (выбрать из множества публикаций именно те, которые описывают интересующие взаимодействия). Потом нужно расположить их друг относительно друга в правильном порядке, а имеющиеся пустоты (осколков всегда меньше, чем нужно для идеальной реконструкции) заполнить правдоподобными предположениями и гипотезами. Вазу имеет смысл реконструировать от днища к краям; воссоздание молекулярных взаимодействий также предполагает определенную логику и последовательность, соответствующую естественному порядку развития клеточного ответа, который, как правило, проходит в несколько стадий.
Сигнальная молекула (гормон, цитокин, токсин) связывается с рецептором на поверхности мембраны, рецептор активирует белки-посредники внутри клетки. Запускается каскад биохимических реакций, похожий на спортивную эстафету — первая киназа фосфорилирует вторую киназу, вторая — третью, та — четвертую. В конце концов, сигнал достигает клеточного ядра. В игру вступают транскрипционные факторы — белки, способные «разбудить» (или, напротив, «усыпить») те или иные гены. Каждый такой фактор управляет, как правило целой группой генов, так что в ответ на единичный сигнал синтезируется множество новых белков, которые заметно меняют правила клеточной игры. Этот процесс преобразования внешнего (по отношению к клетке) сигнала в собственную внутриклеточную активность, приводящий к тем или иным последствиям (например, росту, делению или гибели клетки), называется сигнальным путем. Разные сигнальные пути обеспечивают согласованную активность клеток в многоклеточном организме, позволяя ему функционировать как единое целое, определяют специализацию разных органов и тканей, регулируют рост и развитие организма. Переплетаясь и пересекаясь друг с другом, сигнальные пути образуют сети (рис. 1).
Каждый кусочек такой «молекулярной эстафеты» описан, как правило, в отдельной статье, и задача исследователя — собрать их все и правильно расположить на карте. На первый взгляд, это может показаться довольно простым делом, но, если иметь в виду, что одновременно в клетке происходит несколько сотен таких эстафет, и во многих из них участвуют одни и те же игроки... Пожалуй, археологическая реконструкция — это все-таки не самое удачное сравнение; процедура «распутывания» сети молекулярно-биологических взаимодействий больше похожа на детективное расследование.
Технологии NaviCell и ACSN, использующие Google Maps для визуализации биологических данных
На сегодняшний день существует множество как коммерческих, так и открытых (общедоступных) коллекций молекулярных карт самых разных клеточных процессов (например, коллекция таких карт собрана на сайте navicell.curie.fr). Но сказать, что проблема интеграции молекулярно-биологической информации полностью решена, было бы преждевременно. Все та же проблема «общего» и «частного» имеет место и здесь, хотя и на несколько другом уровне: маленькая карта — неполна, большая — необозрима...
Однако с подобными проблемами — сочетание разноуровневых аспектов информации в нашем стремительно усложняющемся мире — сталкиваются не только ученые-теоретики, но и инженеры-практики, и предлагают свои, может быть, не идеальные, но более чем работоспособные решения. Одной из таких технологий является программа Google Maps. Наверное, каждому пользователю интернета известен этот продукт и его возможность переходить от максимально общего (планетарного) плана к географическим частностям (дому, улице) буквально парой кликов, что позволяет «жонглировать» степенями приближения и эффективно комбинировать самые разные аспекты географической информации.
Это свойство технологии («семантический зум»), субъективно ощущаемое как удобство, отражает ее максимальное соответствие «естественному» человеческому взаимодействию с окружающим миром, основанному преимущественно на визуальной информации. Оглядеться, увидеть картину целиком, сфокусировать взгляд на заинтересовавшем предмете, приблизиться, взять в руки, рассмотреть получше, вернуть на место, перевести взгляд на следующий предмет... Нельзя ли применить подобный подход и для молекулярно-биологических карт? — задумались как-то ученые из парижского Института Кюри. Так на свет появился ACSN — глобальный атлас сигнальных путей, вовлеченных в злокачественное перерождение, в котором навигация осуществляется с помощью системы NaviCell — адаптации движка Google Maps для молекулярно-биологических карт (атлас доступен по адресу acsn.curie.fr) [4–6].
«Континентами мировой карты» ACSN являются зоны, соответствующие десяти ключевым признакам рака (hallmarks), выделенных Вайнбергом и Ханаханом [7]. Это — избегание запрограммированной клеточной смерти, поддержание высокого уровня пролиферативного сигнала, избегание супрессии (угнетения) клеточного роста, активация проникновения в окружающии ткани и метастазирования, неограниченное деление («клеточное бессмертие»), стимуляция роста сосудов (ангиогенез), нестабильность генома, нарушение процессов энергетического обмена, местная воспалительная реакция, избегание иммунного надзора.
Приближаясь, мы можем разглядеть на этих континентах отдельные «страны», соответствующие самым важным сигнальным путям, увидеть названия ключевых молекул, и, наконец, на максимальном увеличении можно увидеть взаимодействия между молекулами и молекулярными комплексами во всех деталях и ознакомиться с их краткими аннотациями (рис. 2).
На сегодняшний день уже описаны «континенты» Apoptosis (апоптоз — запрограммированная гибель клеток), Survival (выживание), Cell cycle (деление клеток, клеточный цикл), DNA Repair (репарация ДНК), EMT and Cell Motility (эпителиально-мезенхимальная трансформация и мобильность клеток). Другие аспекты канцерогенеза еще только ждут своего графического наполнения, присутствуя в атласе манящими надписями, какими на средневековых картах обозначали неизвестные земли — terra incognita (иммунный ответ, ангиогенез, воспаление). В ближайшем будущем будет подготовлена новая, расширенная версия глобальной карты ACSN.
Атлас позволяет увидеть картину сигнальных путей, вовлеченных в злокачественную трансформацию «с высоты птичьего полета» и детально анализировать отдельные взаимодействия, будучи в этом смысле абсолютно аналогичен «настоящему» географическому атласу, содержащему карты различной степени детализации. Географическая карта (особенно выполненная со старомодной тщательностью картографов былых веков) способна доставить большое эстетическое удовольствие, но основная их ценность отнюдь не декоративна. В географии карты — это прежде всего инструмент, позволяющий эффективно решать две основные группы задач: прокладка маршрутов и геоинформационная визуализация данных (рис. 3).
Аналогичное использование карт молекулярных взаимодействий в сочетании с методами моделирования и анализа могут быть полезны и биологам. Ниже приведено несколько примеров такого практического использования.
Перекресток семи дорог — анализ сигнальных путей для создания эффективной лабораторной модели рака толстого кишечника
Лабораторные мыши являются популярным модельным объектом для исследования многих видов рака, в том числе и рака толстого кишечника. Однако мышиная модель данной разновидности опухолей недостаточно хорошо соответствует человеческой болезни. Одним из принципиальных различий является то, что опухоль толстого кишечника у мышей практически не дает метастазов, в то время как у человека, наоборот, на поздних стадиях болезни она активно распространяется по организму. Соответственно, в лабораториях, занимающихся исследованием данной болезни и разработкой лекарственных препаратов для ее лечения, существует запрос на создание генетически модифицированной мыши, у которой свойства колоректальных опухолей будут более похожи на человеческие.
В метастазировании многих опухолей критическим моментом является стадия эпителиально-мезенхимального перехода (Epithelial-mesenchymal transition, EMT). Для ACSN была реконструирована карта сигнальных путей, управляющих этим процессом. После чего была поставлена задача найти такие немногие ключевые точки (макромолекулы) на этих путях, воздействие на которые потенциально могло бы усилить ЕМТ в мышиной модели до такой степени, чтобы это привело к метастазированию колоректальных опухолей (географическим аналогом подобных молекул-маршрутизаторов будет горный перевал или мост через широкую реку, к которому так или иначе сходятся все дороги большого региона).
Для этого карту пришлось последовательно упростить до схемы, учитывающей лишь важнейших игроков — подобно тому, как, планируя маршрут путешествия в Google Maps, водитель большого грузовика пренебрегает тропинками и проселочными дорогами и сосредотачивает внимание на основных трассах (рис. 4). И в конце концов были выделены две таких молекулы — транскрипционные факторы Notch и р53, через которые проходили многие пути на ЕМТ. При этом Notch усиливает ЕМТ на уровне регуляции геной активности, а р53, наоборот, ослабляет этот процесс, но уже на уровне регуляции синтеза ключевых белков (то есть может существенно ослабить эффект от Notch на генном уровне, подобно тому как низкая пропускная способность итогового сборочного цеха на заводе снижает производительность от сколь угодно быстрого производства исходных деталей).
В соответствии с этим анализом была предположена модель, в которой двойная мутация по этим двум генам (активирующая для Notch и ингибирующая для р53) должны были привести к резкой активации ЕМТ. И действительно: у мышей с таким генотипом колоректальные опухоли стали метастазировать (при том, что одиночные мутации по каждому из этих генов к подобному эффекту не приводили, то есть, на лицо был синергический эффект, предсказываемый моделью). Так, анализ сигнальных путей с помощью карт помогает разрабатывать новые эффективные экспериментальные модели болезней и предлагать эффективные молекулярные «мишени» для будущих лекарств [8], [9]. Другим, может быть даже более важным способом использования подобных карт, является «геоинформационное» представление экспрессионных данных.
Метод независимых компонент для анализа экспрессионных данных
Современные технологии секвенирования позволяют не только прочитать последовательность генома, но и измерить количество различных матричных РНК (мРНК), «плавающих» в клетке. В отличие от генома, который практически идентичен от клетки к клетке, состав мРНК существенно изменяется даже в процессе жизнедеятельности одной и той же клетки и тем более может значительно разниться между клетками разных органов и тканей. Число мРНК, «считанных» с определенного гена, служит мерой активности этого гена в клетке (разные клетки или даже одна и та же клетка, но в разных условиях, «включает» одни наборы генов и «выключает» другие). Результат анализа количественного состава всех мРНК в биологическом образце называется профилем экспрессии генов и обычно представляет собой большую таблицу, где строки соответствуют различным генам, а столбцы — измеренным образцам. В каждой ячейке этой таблицы находится число, характеризующее абсолютный или относительный уровень активации гена.
Такие таблицы экспрессии генов используют, в частности, для того, чтобы охарактеризовать образцы раковых опухолей, как например, это сделано в гигантском по своему масштабу проекте «Атлас Генома Рака» . Делается это с целью разобраться в молекулярных механизмах возникновения рака и перспективах его лечения.
В каком-то смысле раковые исследования становятся одним из локомотивов системной биологии: многочисленные данные геномных и транскриптомных исследований, в объединении и осознании которых ученые рассчитывают найти ключ к лечению этих заболеваний, могут быть адекватно обработаны только с помощью новейших биоинформатических инструментов: «Биоинформатика: Большие БД против “большого Р”» [10]. — Ред.
Однако, как анализ генома не сводится к прочтению его последовательности, так же и большие таблицы экспрессии требуют «расшифровки», то есть выделения общих факторов (внутриклеточных биологических, технических, факторов внешней среды), влияющих на экспрессию групп генов. В настоящее время разработано огромное количество статистических методов для этой цели. В одном из таких подходов, называемом Методом Независимых Компонент, исследователи используют метафору функционирования клетки как «коктейльной вечеринки».
Как расшифровать «коктейльную вечеринку»?
Так же как и в живой клетке, во время типичной вечеринки большое количество событий (процессов) происходит одновременно: несколько компаний разговаривает между собой, играет музыкальный центр, в одном углу плачет ребенок, которому давно пора спать, в другом хихикает влюбленная парочка, за окном раздается звук сирены полицейской машины, вызванной соседями... Представьте себе, что при этом в комнате расставлены микрофоны, записывающие звук. Громкость каждого из таких сигналов-процессов, записанного на отдельный микрофон, будет обратно пропорциональна расстоянию до источника звука. Задача «расшифровки» коктейльной вечеринки состоит в определении количества независимых сигналов и выделении каждого из источников сигнала из записанной смеси в чистом виде: разговоры разных компаний, звук сирены, мелодию отдельно друг от друга. Эта задача на удивление хорошо решается, если предположить, что разделяемые сигналы статистически независимы (разделить отдельные голоса в хоре гораздо труднее). На практике для этого используется максимизация меры негауссовости сигнала (негэнтропии), то есть мы считаем, что «интересный» сигнал имеет сильную негауссовскую компоненту (за математическими подробностями и ссылками можно обратиться к оригинальной статье, посвященной данному методу) [10].
Если при этом в нашем распоряжении кроме записей звуков имеется еще и план комнаты с нанесенным на нее расположением микрофонов, то в этом случае возможно не только выделить источники сигнала, но и расположить их на плане, одновременно показав их силу в каждый момент времени, «реконструировать» вечеринку и визуализировать нашу реконструкцию на плане. Аналогичный подход можно использовать и для анализа профилей экспрессии генов.
Картирование независимых компонент с помощью ACSN
Работу гена в живой клетке можно уподобить работе микрофона: его экспрессия также «записывает/отражает» влияние смеси различных факторов с различной интенсивностью сигнала. Каждый образец биологической ткани (например, раковой опухоли) может быть уподоблен вечеринке в отдельный момент времени, и быть охарактеризован определенным спектром интенсивности сигналов, глобально влияющих на экспрессию генов. Выделить эти сигналы из невнятного экспрессионного «шума» — важная биоинформатическая задача.
В недавнем проекте, выполненном в Институте Кюри в Париже, с помощью метода независимых компонент был охарактеризован набор данных, содержащий экспрессионные профили 6671 образцов раковых опухолей для 9 типов рака [11]. Таким образом чисто математически были выделены и охарактеризованы группы генов, управляемые каким-то общими сигналами-процессами — метагены (в нашей коктейльной аналогии этим метагенам примерно соответствовали бы спектры частот, соответствующие звуку автомобильной сирены, отделенные от спектра детского плача).
Но после того, как анализ был произведен, встал вопрос о том, каков биологический смысл результатов, какие аспекты биологической реальности отражает подобная кластеризация генов в группы? И поскольку каждый фактор (процесс) в проведенном анализе был глобально охарактеризован профилем интенсивности его влияния на экспрессию каждого гена в геноме, это сделало возможным применение геоинформационного метода для определения смысла сигнала и его визуализации. Визуализацию одного из таких факторов с использованием глобальной карты ACSN вы можете видеть на рисунке 5.
Глобальная карта молекулярных функций оказывается «подсвечена» согласно интенсивности влияния сигнала, полученного каждым из генов. Простой визуальный анализ раскраски карты дает представление о привязке сигнала к определенным молекулярным процессам и их взаимосвязям. В данном случае очевидно, что метаген фактора соответствует процессам деления и репарации ДНК. Таким образом, карта ACSN делает возможным применение геоинформационного подхода к анализу-расшифровке биологического смысла полногеномных молекулярных профилей, получаемых при изучении раковых опухолей.
Самозатмение науки? Нет — новое, более эффективное обобщение!
Мы вплотную подходим к тому драматическому моменту, когда главным препятствием на пути развития науки становится она сама. Мы много знаем, но знание это так плохо систематизировано и так мало обозримо «в целом», что уже порой становится не опорой для дальнейшего продвижения науки, а помехой.
Так буквально на наших глазах исполняется пророчество Станислова Лема о «самозатмении» в науке: «Ученые все чаще приходили к убеждению, что исследуемое явление кем-то где-то наверняка подробно исследовано, неизвестно только, где об этом можно узнать. Число научных дисциплин росло в геометрической прогрессии, и главным дефектом компьютеров — а теперь уже конструировались мегатонные ЭВМ — стал хронический информационный запор. Было подсчитано, что через каких-нибудь пятьдесят лет в университетах останутся лишь компьютеры-сыщики, которые будут рыться в микропроцессорах и мыслисторах всей планеты, чтобы узнать, где, в каком закоулке какой машинной памяти хранятся абсолютно необходимые нам сведения».
Единственным выходом из этого тупика является эффективное обобщение научной информации. И с этой точки зрения философия и технология Google Maps (или, если хотите, NaviCell) с заключенными в ней возможностями как для бесконечной детализации, так и для безграничного обобщения как нельзя лучше соответствуют естественной иерархической картине биологического знания. На сегодняшний день ACSN позволяет детализировать молекулярную жизнь злокачественной клетки (и ее ближайшего окружения) до уровня сигнальных путей. Но ничто не мешает нам в перспективе, добавляя сверху новые и новые «уровни», перейти от клетки к ткани, от органа к организму, от организма к виду, популяции, экосистеме... Вероятно, сейчас подобный проект выглядит чересчур фантастичным, но в перспективе такая иерархическая интеграция — это, видимо, единственная возможность преодолеть проклятие «сверхспециализации», тяготеющее над современной биологической наукой.
ACSN создавался, прежде всего, как удобный и наглядный инструмент в помощь ученым, занимающимся анализом данных, связанных со злокачественным перерождением клеток, но подход, положенный в его основу, гораздо шире собственных потребностей биологии рака и дает нам повод задуматься о новых формах представления биологического знания как такового. Совместное использование карт сигнальных путей и метода независимых компонент в анализе экспрессиионных профилей раковых опухолей может служить не только для представления уже известного знания, но и стать основой для новых открытий и более глубокого понимания молекулярных принципов организации живого.
Статья написана в соавторстве с Андреем Зиновьевым и Инной Куперштейн.
Литература
- Я б в биоинформатики пошёл, пусть меня научат!;
- Вычислительное будущее биологии;
- Nicolas Le Novère, Michael Hucka, Huaiyu Mi, Stuart Moodie, Falk Schreiber, et. al.. (2009). The Systems Biology Graphical Notation. Nat Biotechnol. 27, 735-741;
- Inna Kuperstein, David PA Cohen, Stuart Pook, Eric Viara, Laurence Calzone, et. al.. (2013). NaviCell: a web-based environment for navigation, curation and maintenance of large molecular interaction maps. BMC Systems Biology. 7, 100;
- Barillot E., Calzone L., Hupe P., Vert J.-P., Zinovyev A. Computational systems biology of cancer. CRC Press, 2012. — 461 p.;
- I Kuperstein, E Bonnet, H-A Nguyen, D Cohen, E Viara, et. al.. (2015). Atlas of Cancer Signalling Network: a systems biology resource for integrative analysis of cancer data with Google Maps. Oncogenesis. 4, e160-e160;
- Douglas Hanahan, Robert A. Weinberg. (2011). Hallmarks of Cancer: The Next Generation. Cell. 144, 646-674;
- Maia Chanrion, Inna Kuperstein, Cédric Barrière, Fatima El Marjou, David Cohen, et. al.. (2014). Concomitant Notch activation and p53 deletion trigger epithelial-to-mesenchymal transition and metastasis in mouse gut. Nat Commun. 5;
- I. Kuperstein, L. Grieco, D. P. A. Cohen, D. Thieffry, A. Zinovyev, E. Barillot. (2015). The shortest path is not the one you know: application of biological network resources in precision oncology research. Mutagenesis. 30, 191-204;
- Биоинформатика: большие БД против «большого Р»;
- Andrei Zinovyev, Ulykbek Kairov, Tatyana Karpenyuk, Erlan Ramanculov. (2013). Blind source separation methods for deconvolution of complex signals in cancer biology. Biochemical and Biophysical Research Communications. 430, 1182-1187;
- Anne Biton, Isabelle Bernard-Pierrot, Yinjun Lou, Clémentine Krucker, Elodie Chapeaublanc, et. al.. (2014). Independent Component Analysis Uncovers the Landscape of the Bladder Tumor Transcriptome and Reveals Insights into Luminal and Basal Subtypes. Cell Reports. 9, 1235-1245.