Imaginarium
@Imaginarium

Как сконфигурировать вычислительный кластер?

Здравствуйте.

Как аккуратно подобрать аппаратную конфигурацию кластера в лабораторию, предназначенного для задач моделирования (CFD) и машинного обучения?
Сам я решение представляю следующим образом:
кластер состоит из блейдов, пока в одну стойку, каждый блейд имеет на борту:
  • CPU: на Xeon, типа E5-2667 v3 (Haswell) от 2 до 4 на плату;
  • Memory: не менее, чем по 128 ГБ, подбор конкретных планок по материнской плате;
  • GPU: Nvidia Tesla K80, по 2 на плату;
  • Network: Infiniband для связи между узлами;
  • SSD - много не надо на каждый узел, хватит по 250 ГБ;
  • Остальное - управляемое питание и проч. - уже к стойке.


Но все это я просто предполагаю, идя от требуемой производительности. Что еще мне нужно учесть? С электропитанием вопросов нет, т.к. есть отдельная серверная.
Нужно как-то учитывать характеристики ОС для его конфигурации? Я предполагаю использование RHEL/CentOS на нем.
Наверняка я не представляю даже 10% от подводных камней, связанных с конфигурированием и настройкой, поделитесь, пожалуйста, опытом, о чем еще полезно думать, до покупки железа?

Спасибо.
  • Вопрос задан
  • 521 просмотр
Пригласить эксперта
Ответы на вопрос 1
@oleksandr_veles
Ремарки.
1. Xeon E5-2640 или 2660 будут оптимальнее, а 2640 и дешевле в 2 раза.
e5-2xxx в 4х процессорном режиме не работают, там нужны 4ххх.
2. GPU: Nvidia Tesla K80 - не уверен что 2 штука влезут в 1U.
По оптимальности лучше брать titan black или titan z, если не нужна пожизненная гарантия (все равно устареют через 3-4 года). Если нужна только одинарная точность для числодробилки - titan x отличное решение.
3. Зачем ssd 250? Для системы хватит 40-60ГБ, для данных лучше внешнее хранилище. При 128ГБ памяти, всегда можно откусить 100ГБ под быстрый диск если что.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы