Центральным инфраструктурным объектом ЦКП является высокопроизводительный вычислительный комплекс, приобретенный в рамках программы СО РАН «Геномика, протеомика, биоинформатика» (рис. 1–3), в следующей комплектации:

  • вычислительный кластер c 64 двойными блейд-серверами HP BL2×220G6 пиковой производительностью 10.362 ТФлопс (всего 128 вычислительных модулей, каждый из которых включает два четырехъядерных процессора Intel Xeon Е5540, 2.53 Ггц и 16Гб оперативной памяти), технологически вычислительный кластер объединен с вычислительными ресурсами Сибирского суперкомпьютерного центра (32 двойных блейд-сервера HP BL2×220 G5: 64 вычислительных модуля по 2 процессора Intel Xeon E5450, 3.00 Ггц). Общая производительность объединенного кластера – 16.5 ТФлопс;
  • параллельная кластерная система хранения данных емкостью 48 Тбайт, используемая при вычислениях;
  • файловый сервер (сервер HP DL360G6 в комплектации: 2 четырехъядерных процессора Intel® Xeon® X5550 2,66 ГГц; 12 Гбайт оперативной памяти) с долговременным хранилищем данных (емкость – 36 Тбайт);
  • система резервного копирования в виде ленточной библиотеки HP MSL4048 (стандарт LTO-4), поддерживающей одновременную установку 48 картриджей;
  • специализированный сервер баз данных на основе HP DL380G6 (2 четырехъядерных процессора Intel® Xeon® X5560 2,80 ГГц, оперативная память 36 Гбайт) с дисковым массивом HP StorageWorks D2700 емкостью 3.6 Тбайт, установлены СУБД Oracle 11g, MySQL, PostgreSQL;
  • технологический сервер баз данных на основе HP DL380 G6 в следующей комплектации: 2 четырехъядер ных процессора Intel® Xeon® X5550 2,66 ГГц; оперативная память 12 Гбайт;
  • специализированный Web-cервер для доступа к информационным и вычислительным ресурсам ЦКП «Биоинформатика»;
  • высокоскоростная сеть для объединения экспериментальных установок и локальных компьютеров с высокопроизводительным вычислительным комплексом;
  • терминальный класс в ИЦиГ СО РАН (рабочие станции);
  • графическая рабочая станция HP Z800 Xeon, оперативная память 8 Гбайт, 2 монитора: рабочий монитор Dell U2410, для  работы монитор с 3D изображениями ACER G245HQBID 23.6”, и 3D устройство (рис. 3).

Рис. 1. Инфраструктура технологического кластера, объединяющего ресурсы организаций-учредителей ЦКП «Биоинформатика»


Программное обеспечение, включающее лицензионное системное программное обеспечение (операционные системы, ПО для управления файловыми системами, компиляторы и отладчики, СУБД «Oracle 11g», MySQL, PostgreSQL), а также специализированные пакеты программ для решения задач биоинформатики, геномики, протеомики, метаболомики, транскриптомики, в том числе:

  • Accelrys discovery studio для решения задач протеомики, молекулярного дизайна и конструирования лекарств, предсказания свойств больших и малых молекул и т. д.
  • Пакет прикладных программ MatLAB, ориентиро ванный на параллельные вычисления на кластере со специализированными модулями для решения задач биоинформатики.
  • Пакет прикладных программ Mathematica 7 Professional, в рамках которого работает множество систем обработки  биологических данных и моделирования биологических систем и процессов (Cellerator и xCellerator).
  • Пакеты программ для решения задач молекулярной динамики (amber, GROMACS с LAM/MPI и др.).

Программное обеспечение для решения задач биоинформатики и системной биологии, разработанное в ИЦиГ СО РАН и других организациях-учредителях ЦКП «Биоинформатика», включает:

  • Web-портал по биоинформатике и компьютерной системной биологии, содержащий пакеты про грамм по решению задач в области геномики, регуломики, транскриптомики, моделирования клетки и дизайна искусственных генетических конструкций, трансгенеза, анализа полиморфизмов.
  • Программная система «Protein Structure Discovery» для решения задач протеомики.
  • Программные системы ANDCell и ANDVisio, позволяющие извлекать знания о взаимодействии биомолекул из текстов научных публикаций и интегрировать эти знания в виде семантических сетей.
  • Программные системы проведения вычислительных экспериментов в области эволюционной биоинформатики, система «Эволюционный конструктор» для имитационного моделирования эволюционных процессов в популяциях.
  • Наиболее распространенные пакеты программ для решения задач биоинформатики включая EMBOSS, boost, Blast, Blast,
    BioC++ libraries, Bio++ Program Suite, BioJava, BioPerl, BioPython, R – среда программирования с большим числом ППП включая статистический анализ, графическое представление, анализ экспрессионных данных.

Для решения задач биоинформатики также используются ресурсы организаций-учредителей ЦКП «Биоинформатика» включая (рис. 2, 3 ):

  • вычислительные ресурсы ССКЦ (ИВМИМГ СО РАН), объединенные с вы числительным кластером ИЦиГ СО РАН;
  • высокопроизводительный вычислительный кластер НГУ (производительность – 13.2 ТФлопс);
  • хранилище данных ИВТ СО РАН  – 127 Тбайт.

 

Рис. 2. Стойка управления кластером НКС-30Т

Рис. 3. Графическая станция HP Z800.

Кластер – 16.5 ТФлопс.