Каждый понимает что ежедневно на ютуб загружаются миллионы видео, по некоторым данным количество роликов в день превышает 4 миллиона. В то же время на данный момент на ютубе больше одного миллиарда видеороликов и 37 миллиона каналов. В среднем длительность одного ролика составляет 11,7 минуты и именно такую длинную ролика лучше делать для того чтобы Ваши видео досматривали до конца.
И это огромный массив информации, который нужно где-то хранить и даже больше кроме того, что ютуб хранит все эти видео на своих серверах в дополнении к этом компания гугл активно кеширует все видео которые быстро набирают популярность на своих дополнительных серверах по всему миру.
Что такое CDN и где хранится популярное видео?
YouTube использует сети распространения контента (CDN) для эффективного показа видео пользователям по всему миру. CDN кэшируют копии популярных видео в нескольких местах, сокращая расстояние и задержку между пользователем и контентом.
Грубо говоря если видео популярно в Европе, а таким странам как Австралия или США оно не интересно, то оно будет кэшировано на серверах во Франкфурте и показываться пользователями с них, дабы уменьшить задержку.
А это значит, что одно видео (особенно популярное) может хранится в нескольких местах по всей планете. Так что кроме того что ютубу нужно хранить оригинал видео, так еще и несколько популярных копий, а это также место на диске.
Так сколько же серверов в распоряжении Ютуба?
И это тоже не очень правильный вопрос, потому как ютуб это всего лишь часть информации, ведь Youtube принадлежит компании гугл, а поисковая система гугл кроме того, что сканирует весь интернет по несколько раз в месяц и хранит все копии каждой страницы у себя на сервере в добавок к этому имеет еще пол сотни проектов таких как гугл карты, Gmail, гугл облако в котором у каждого пользователя имеется по 15 гигабайт, а некоторые заводят по несколько аккаунтов для того чтобы хранить свои фото. Так что более правильный вопрос …
Сколько и где хранит информацию гугл?
Так вот при нынешних накопителях на один ssd размером в 5 на 2 дюйма можно записать до 30 террабайт данных. Один ролик в сжатом формате на 10 минут будет занимать 100 мегабайт (чтобы легче считать, потому как каждое видео отличается по качеству, по картинке, по количество цветов и так далее). Если верить что у гугла имеется миллиард видео по 10 минут, то это 100 тысяч терабайт данных. Делим на 30 и получаем 3 тысячи SSD носителей. И это уже вполне реальная цифра, которую мы может представить, но проблема не в том где это хранить а в том, что для одновременного воспроизведения миллионов видео, загрузки миллионов страниц в секунду с различными поисковыми запросами требуются колоссальные мощности. Так что вопрос хранения данных также отпадает на второй план и правильный будет. Сколько серверов нужно для поддержки всей инфраструктуры. Но это уже совсем другая история которая еще более сложная нежели посчитать дисковое пространство.