Я уже много раз писал и повторю, что для высоконагруженных систем, будь то нагруженность по объёмам данных или интенсивности запросов, не бывает готовых рецептов, решение всегда разрабатывается индивидуально под нюансы проекта. Чтобы уметь такие решения разрабатывать, надо сначала получить богатый опыт разработки и эксплуатации решений попроще. Поэтому для студентов в подавляющем большинстве случаев эта задача неподъёмная. Кроме того, если данные действительно колосальные, то понадобятся колосальные инвестиции, как минимум нужно будет строить ЦОД.
Если же просто хочется получить теоретические знания и разразработать конценпт не для реального применения, то начать стоит с чтения Клеппмана и статей об устройстве систем в Google, Яндекс, Facebook, VK и прочих.