Mock-собеседование по System Design от Team Lead из Яндекса

25 мая 2024 г. · 37 мин. чтения

Сегодня мы разберем техническое собеседование по System Design, проведенное тимлидом из Яндекса. В ходе интервью кандидат разрабатывает архитектуру новостной ленты Instagram, начиная с формализации требований и оценки нагрузки, а затем проектирует API, определяет хранилище данных и оценивает производительность системы. Мы детально разберем ответы кандидата, укажем на возможные недочеты и предоставим корректные решения с техническими пояснениями.

Вопрос 1. Предлагаю спроектировать ленту Instagram. Необходимо формализовать требования, оценить нагрузку, описать API и архитектуру, а также модель данных и железо.

Таймкод: 00:00:01

Ответ собеседника: Правильный. Интервьюер предлагает спроектировать ленту Instagram и перечисляет шаги: формализация требований, оценка нагрузки, описание API, архитектуры, модели данных и оценка необходимого железа.

Правильный ответ:

При проектировании такой системы необходимо:

Формализовать требования. Разделить их на функциональные (что система должна уметь: создание, отображение постов, поддержка подписок, обработка лайков/комментариев, если нужно) и нефункциональные (масштабируемость, время отклика, отказоустойчивость, геораспределённость).
Оценить нагрузку. Проанализировать предполагаемое число пользователей, частоту операций записи (создания постов) и чтения (просмотры ленты). Рассчитать RPS, трафик и требования к хранилищу данных.
Описать API. Определить набор эндпоинтов, например:
- GET /feed – получение ленты (с поддержкой пагинации),
- POST /post – загрузка поста,
- POST /subscribe и POST /unsubscribe – управление подписками.
Проектировать архитектуру. Выделить отдельные сервисы для обработки изображений (Image Service), постов (Post Service), формирования ленты (Feed Service) и управления подписками (Relation Service). Важно предусмотреть использование кэша (Redis), очередей сообщений (Kafka) для асинхронной обработки и репликацию данных для отказоустойчивости.
Определить модель данных и выбрать БД. Например, использовать реляционную базу (PostgreSQL) для хранения постов, графовую базу (Neo4j) для подписок и объектное хранилище (S3) для изображений.
Оценить железо. Исходя из прогнозируемых нагрузок, спланировать серверные мощности, распределённую инфраструктуру и возможность горизонтального масштабирования.

Вопрос 2. Начнем с функциональных требований. Что требуется для ленты Instagram?

Таймкод: 00:01:05

Ответ собеседника: Правильный. Кандидат предлагает начать с функциональных требований.

Правильный ответ:
Функциональные требования к ленте включают:

Отображение постов пользователей, на которых подписан текущий пользователь.
Обновление ленты в реальном времени или с минимальной задержкой.
Поддержку пагинации или бесконечной прокрутки.
Возможность сортировки (например, в обратном хронологическом порядке) и, при необходимости, фильтрации контента.
Обработку событий загрузки нового поста, что приводит к обновлению ленты подписчиков.
При дальнейшем развитии – поддержку лайков, комментариев и рекламных вставок.

Вопрос 3. Какие функциональные требования к ленте Instagram?

Таймкод: 00:01:19

Ответ собеседника: Неполный. Кандидат называет загрузку фото с описанием и получение ленты.

Правильный ответ:
Помимо базового функционала (загрузка одного фото с описанием и получение ленты), необходимо учитывать:

Возможность обновления ленты с новыми постами, поддержка уведомлений.
Пагинация или бесконечная прокрутка для подгрузки дополнительных постов.
Обработка и фильтрация контента (например, исключение постов, если пользователь отписался).
Поддержку механизмов кэширования для быстрого доступа.
В перспективе – интеграцию с системами рекомендаций, модерацией контента и дополнительными метаданными (например, хештеги, геолокация).

Вопрос 4. Нужны ли лайки и комментарии?

Таймкод: 00:01:36

Ответ собеседника: Правильный. Интервьюер спрашивает про лайки и комментарии, но предлагает отложить их.

Правильный ответ:
В контексте MVP (минимально жизнеспособного продукта) лайки и комментарии можно отложить, чтобы сосредоточиться на базовом функционале ленты. Однако в полном решении их интеграция важна для вовлечения пользователей, поэтому стоит предусмотреть возможность расширения API для добавления таких функций в будущем, без кардинальной переработки архитектуры.

Вопрос 5. Нужно ли удаление постов?

Таймкод: 00:01:47

Ответ собеседника: Правильный. Интервьюер спрашивает про удаление постов, но предлагает не реализовывать эту функцию.

Правильный ответ:
Удаление постов можно отложить для MVP, чтобы уменьшить сложность реализации. В дальнейшем можно реализовать мягкое удаление (soft delete), когда пост помечается как удалён, но фактически остаётся в системе для аналитики и восстановления, что упрощает соблюдение целостности данных и обеспечивает возможность аудита.

Вопрос 6. Относительно чего получаем ленту? Нужны ли подписки?

Таймкод: 00:02:00

Ответ собеседника: Правильный. Интервьюер уточняет, что лента формируется на основе подписок и спрашивает про порядок формирования ленты.

Правильный ответ:
Лента формируется на основе подписок: пользователю показываются посты тех, на кого он подписан. Это позволяет персонализировать контент. В системе необходимо обеспечить возможность быстро получать список подписок для каждого пользователя и эффективно обновлять ленту при появлении нового поста от любого из них.

Вопрос 7. В каком порядке формировать ленту на основе подписок?

Таймкод: 00:02:27

Ответ собеседника: Правильный. Интервьюер спрашивает про порядок формирования ленты.

Правильный ответ:
Начальным вариантом является сортировка в обратном хронологическом порядке, что позволяет показывать самые свежие посты первыми. В дальнейшем можно рассмотреть алгоритмы ранжирования, учитывающие взаимодействия, популярность и релевантность контента, но базовая реализация — именно обратный хронологический порядок.

Вопрос 8. Предлагаю формировать ленту в обратном хронологическом порядке.

Таймкод: 00:02:39

Ответ собеседника: Правильный. Кандидат предлагает формировать ленту в обратном хронологическом порядке.

Правильный ответ:
Обратный хронологический порядок является логичным выбором для начала, поскольку он интуитивно понятен пользователю и обеспечивает показ свежего контента. Такой подход также упрощает кэширование и обновление ленты, позволяя быстро добавлять новые посты в начало списка.

Вопрос 9. Переходим к нефункциональным требованиям. Сколько пользователей будет?

Таймкод: 00:02:52

Ответ собеседника: Правильный. Интервьюер переходит к нефункциональным требованиям и спрашивает про количество пользователей.

Правильный ответ:
Нефункциональные требования определяют масштаб системы. В данном случае, нужно рассчитывать на десятки миллионов пользователей, что влияет на распределение нагрузки, необходимость горизонтального масштабирования, репликацию данных и геораспределённость инфраструктуры. Это требует продуманного подхода к кешированию, балансировке нагрузки и отказоустойчивости.

Вопрос 10. Сколько пользователей будет в системе?

Таймкод: 00:03:00

Ответ собеседника: Правильный. Кандидат предлагает 50 миллионов пользователей.

Правильный ответ:
При оценке масштаба системы можно ориентироваться на 50 миллионов активных пользователей. Это число определяет требования к масштабированию базы данных, кэшированию, распределению нагрузки между серверами и необходимости географически распределённой инфраструктуры для снижения задержек.

Вопрос 11. Геораспределенная ли система?

Таймкод: 00:03:08

Ответ собеседника: Правильный. Интервьюер спрашивает про геораспределенность системы.

Правильный ответ:
Да, система должна быть геораспределенной, чтобы обеспечить низкую задержку и высокую доступность для пользователей по всему миру. Это подразумевает развёртывание серверов в разных регионах, использование CDN для статики, репликацию данных и локальные инстансы сервисов, что помогает уменьшить время отклика и повышает отказоустойчивость.

Вопрос 12. Тайминги загрузки поста и получения ленты?

Таймкод: 00:03:25

Ответ собеседника: Правильный. Интервьюер спрашивает про тайминги загрузки поста и получения ленты.

Правильный ответ:
Необходимо установить бизнес-требования по времени отклика: загрузка поста должна занимать не более 2 секунд, а получение ленты — около 1 секунды. Эти показатели определяют требования к производительности сервисов, скоростям передачи данных, работе кэшей и оптимизации запросов к базе данных.

Вопрос 13. Какое время загрузки поста будет быстрым?

Таймкод: 00:03:32

Ответ собеседника: Правильный. Интервьюер уточняет желаемое время загрузки поста с точки зрения бизнеса.

Правильный ответ:
Быстрым считается время загрузки поста в пределах 2 секунд. Это позволяет пользователю быстро увидеть результат своих действий, повышая удовлетворённость и вовлечённость, а также снижая вероятность ошибок при взаимодействии с системой.

Вопрос 14. Сколько времени займет загрузка поста?

Таймкод: 00:03:42

Ответ собеседника: Правильный. Кандидат предлагает 2 секунды на загрузку поста.

Правильный ответ:
Загрузка поста должна занимать не более 2 секунд, что достигается оптимизацией передачи данных, использованием CDN для изображений и эффективной работы серверной логики. Такой показатель является приемлемым для большинства пользователей и соответствует бизнес-требованиям.

Вопрос 15. Сколько времени займет получение ленты?

Таймкод: 00:03:55

Ответ собеседника: Правильный. Кандидат предлагает 1 секунду на получение ленты.

Правильный ответ:
Получение ленты должно занимать около 1 секунды. Это обеспечивается за счёт активного использования кэша (например, Redis), оптимизации запросов к базе данных и эффективного балансировщика нагрузки, что позволяет обеспечить высокую скорость отклика для пользователей.

Вопрос 16. Сколько храним посты?

Таймкод: 00:04:24

Ответ собеседника: Правильный. Интервьюер спрашивает про время хранения постов.

Правильный ответ:
Посты, как правило, хранятся бессрочно – система должна сохранять их на постоянной основе, за исключением случаев удаления (например, по запросу пользователя или в рамках политики soft delete). Это позволяет вести историю и обеспечивать возможность повторного использования данных (архивирование, аналитика).

Вопрос 17. Как долго храним посты?

Таймкод: 00:04:30

Ответ собеседника: Правильный. Кандидат отвечает, что посты хранятся всегда.

Правильный ответ:
Посты должны храниться на постоянной основе (с возможностью архивирования), что требует разработки эффективной стратегии резервного копирования и масштабируемого хранилища. Важно обеспечить баланс между постоянным хранением и затратами на инфраструктуру.

Вопрос 18. Какая нагрузка на чтение и запись постов?

Таймкод: 00:04:39

Ответ собеседника: Правильный. Интервьюер спрашивает про нагрузку на чтение и запись.

Правильный ответ:
Нагрузка на запись будет сравнительно невысокой, поскольку пользователь публикует пост нечасто (например, 1 пост на 5 дней). В то же время нагрузка на чтение значительно выше, так как каждый пользователь просматривает ленту несколько раз в день. Это соотношение (низкий write : высокий read) диктует выбор оптимизированных кэш-решений и стратегий репликации данных.

Вопрос 19. Сколько постов создает и просматривает пользователь в день?

Таймкод: 00:04:46

Ответ собеседника: Правильный. Интервьюер предлагает оценить поведение пользователей: 1 пост в 5 дней и 5 просмотров ленты в день.

Правильный ответ:
Принимая во внимание, что один пользователь публикует пост примерно раз в 5 дней, а просматривает ленту 5 раз в день, можно оценить нагрузку следующим образом:

Записи (write): ~0.2 поста в день на пользователя.
Чтения (read): 5 запросов в день на пользователя.
Это соотношение определяет, что оптимизация должна быть направлена на быструю обработку запросов на чтение.

Вопрос 20. Сколько постов выдавать в ленте?

Таймкод: 00:05:13

Ответ собеседника: Правильный. Интервьюер спрашивает про количество постов в ленте и желаемую "бесконечную ленту".

Правильный ответ:
Изначально можно выдавать ограниченное количество постов за один запрос (например, 10–20) с поддержкой пагинации или бесконечной прокрутки. При этом дизайн должен предусматривать возможность динамической подгрузки дополнительных постов по мере скроллинга, что позволяет снизить нагрузку на систему и оптимизировать потребление памяти.

Вопрос 21. Сколько постов выдавать за запрос?

Таймкод: 00:05:41

Ответ собеседника: Правильный. Интервьюер уточняет количество постов на запрос и предлагает 10-100.

Правильный ответ:
Оптимальным вариантом является выдача 10–20 постов за один запрос. Это значение можно сделать настраиваемым через параметр page_size, чтобы балансировать между скоростью отклика и удобством для пользователя. При необходимости для специальных сценариев можно расширить диапазон до 100.

Вопрос 22. Что такое пост? Из чего состоит?

Таймкод: 00:06:01

Ответ собеседника: Правильный. Интервьюер возвращается к формализации требований и спрашивает, что такое пост.

Правильный ответ:
Пост – это основной объект контента, который включает:

Идентификатор и метаданные (user_id, timestamp создания).
Содержимое: изображение (URL или ссылка на объект в хранилище) и текстовое описание.
Дополнительную информацию: счетчики лайков, комментариев, возможно, хештеги и геолокацию.
Такая структура позволяет легко индексировать, фильтровать и отображать посты в ленте.

Вопрос 23. Из чего состоит пост?

Таймкод: 00:06:12

Ответ собеседника: Неполный. Кандидат говорит, что пост — это описание и картинка.

Правильный ответ:
Помимо описания и картинки, пост должен включать:

Уникальный идентификатор (ID).
Идентификатор пользователя, создавшего пост.
Метку времени создания (created_at).
Дополнительные поля для аналитики (например, счетчики лайков, комментариев) и служебную информацию (например, статус публикации, флаги модерации).
Эта информация помогает обеспечить целостность данных и поддерживать функциональность системы.

Вопрос 24. Сколько картинок в посте?

Таймкод: 00:06:22

Ответ собеседника: Правильный. Интервьюер уточняет количество картинок и предлагает ограничиться одной.

Правильный ответ:
Для упрощения реализации на начальном этапе рекомендуется ограничиться одной картинкой на пост. В дальнейшем, при росте функциональности, можно расширить поддержку мультимедийного контента.

Вопрос 25. Какое ограничение на описание поста?

Таймкод: 00:06:34

Ответ собеседника: Правильный. Интервьюер предлагает ограничить описание 100 символами.

Правильный ответ:
Ограничение в 100 символов помогает обеспечить краткость и удобочитаемость контента, а также упрощает хранение и передачу данных. Такое ограничение можно задать на уровне API и БД (например, через ограничение длины текстового поля).

Вопрос 26. Размер картинки в посте?

Таймкод: 00:07:00

Ответ собеседника: Правильный. Начинается обсуждение оценки RPS и трафика.

Правильный ответ:
Для расчётов принято использовать средний размер картинки, например, около 500КБ. Это значение помогает оценить трафик при загрузке изображений и спланировать масштабируемость системы, особенно при хранении изображений в таких сервисах, как S3.

Вопрос 27. Посчитаем RPS на запись.

Таймкод: 00:07:01

Ответ собеседника: Правильный. Кандидат начинает считать RPS на запись.

Правильный ответ:
Исходя из того, что один пользователь публикует пост примерно раз в 5 дней, для 50 млн пользователей получаем:

\text{Записей в день} = \frac{50\,000\,000}{5} = 10\,000\,000

\text{RPS} = \frac{10\,000\,000}{86400} \approx 116 \text{ запросов в секунду}

Таким образом, RPS на запись составляет около 116 запросов в секунду.

Вопрос 28. Посчитаем RPS на чтение.

Таймкод: 00:07:47

Ответ собеседника: Правильный. Кандидат считает RPS на чтение.

Правильный ответ:
При 5 запросах ленты в день на 50 млн пользователей получаем:

5 \times 50\,000\,000 = 250\,000\,000 \text{ запросов в день}

\text{RPS} = \frac{250\,000\,000}{86400} \approx 2894 \text{ запросов в секунду}

Это подчёркивает, что нагрузка на чтение существенно выше, чем на запись, и требует масштабируемых решений с активным использованием кэширования.

Вопрос 29. Что можно сказать о нагрузке, исходя из расчетов RPS?

Таймкод: 00:08:25

Ответ собеседника: Правильный. Интервьюер спрашивает выводы из расчетов RPS.

Правильный ответ:
Расчёты показывают, что нагрузка на запись сравнительно невысока (~116 RPS), в то время как нагрузка на чтение значительно превышает её (~2900 RPS). Это указывает на необходимость оптимизации чтения за счёт использования кэшей (например, Redis), балансировки нагрузки и репликации данных. Архитектура должна быть спроектирована с приоритетом высокой производительности чтения.

Вопрос 30. Посчитаем трафик на запись.

Таймкод: 00:08:46

Ответ собеседника: Правильный. Кандидат начинает считать трафик на запись.

Правильный ответ:
При оценке трафика на запись необходимо умножить количество запросов на размер передаваемых данных. Если предположить, что каждый пост (с учетом изображения и метаданных) занимает около 500КБ, то:

116 \text{ запросов/сек} \times 500 \text{ КБ} = 58\,000 \text{ КБ/сек} \approx 58 \text{ МБ/сек}

Это значение поможет спланировать пропускную способность сети и требования к хранилищу, особенно для сервиса изображений.

Вопрос 31. Какой размер картинки возьмем для расчета трафика?

Таймкод: 00:09:13

Ответ собеседника: Правильный. Интервьюер предлагает выбрать размер картинки, чтобы пересчитать трафик.

Правильный ответ:
Для расчётов принято брать средний размер изображения в 500КБ. Это типичное значение для оптимизированных изображений, используемых в мобильных и веб-приложениях, и позволяет адекватно оценить нагрузку на сеть и хранилище.

Вопрос 32. Уточнение по расчету трафика.

Таймкод: 00:11:06

Ответ собеседника: Правильный. Интервьюер указывает на ошибку в расчетах трафика и помогает исправить.

Правильный ответ:
Важно проверить предположения: убедиться, что размер картинки взят корректно, и учесть, что не весь трафик идёт через основные сервисы (например, изображения могут обслуживаться через CDN). Пересмотр расчётов должен учитывать дополнительный оверхед на метаданные и сетевые протоколы.

Вопрос 33. Посчитаем капасити на год.

Таймкод: 00:13:18

Ответ собеседника: Правильный. Интервьюер предлагает посчитать capacity на год.

Правильный ответ:
Для оценки годового объёма хранилища нужно умножить дневную нагрузку на число дней в году. Например, если в день создаётся 10млн постов (как рассчитано ранее), за год получаем:

10\,000\,000 \times 365 = 3.65 \text{ млрд постов}

Учитывая средний размер поста (включая изображение, метаданные и прочее), можно получить требуемый объём дискового пространства. Такой расчёт поможет определить архитектурные решения для масштабируемого хранилища (например, распределённое файловое хранилище, использование S3).

Вопрос 34. Ошибка в расчете трафика на чтение.

Таймкод: 00:13:31

Ответ собеседника: Правильный. Интервьюер указывает на ошибку в расчете трафика чтения.

Правильный ответ:
При расчёте трафика на чтение необходимо учитывать, что один запрос ленты может возвращать сразу несколько постов. Если, например, один запрос возвращает 20 постов, то общий объём данных умножается на это число. Кроме того, стоит учитывать оптимизацию через кэширование – не каждый запрос требует обращения к основной БД. Пересмотр расчетов должен включать эти факторы для получения более точной оценки.

Вопрос 35. Оценка capacity хранилища.

Таймкод: 00:14:11

Ответ собеседника: Правильный. Продолжение обсуждения оценки capacity.

Правильный ответ:
Оценка емкости хранилища включает:

Объём данных для постов (изображения, метаданные), который растёт с каждым новым постом.
Объём кэшированных данных (например, ленты в Redis) – можно ограничить количеством постов на пользователя.
Резервирование для репликации и бэкапов.
Важно рассчитать, сколько данных будет генерироваться ежедневно и ежегодно, и выбрать масштабируемые решения (S3, распределённые БД) с учетом экономической эффективности.

Вопрос 36. Опиши API системы.

Таймкод: 00:14:20

Ответ собеседника: Правильный. Интервьюер просит описать API системы.

Правильный ответ:
API системы можно разделить на несколько основных групп:

Посты:
POST /post – загрузка нового поста (принимает изображение, описание, метаданные).
GET /post/{id} – получение подробной информации о посте.
- Лента:
GET /feed?user_id={id}&page_size=20&cursor={cursor} – получение ленты пользователя с поддержкой пагинации.
- Подписки:
POST /subscribe – подписка на пользователя.
POST /unsubscribe – отписка.
- Аутентификация и авторизация:
POST /login, POST /register и т.п.
Каждый эндпоинт должен возвращать данные в формате JSON, иметь стандартизированные коды ошибок и поддерживать версии API. Пример на Go (используя стандартную библиотеку):

func uploadPostHandler(w http.ResponseWriter, r *http.Request) {
    // Проверка аутентификации, валидация данных
    // Сохранение изображения (например, в S3) и метаданных в БД
    // Отправка события в Message Queue для обновления ленты подписчиков
    w.WriteHeader(http.StatusCreated)
    json.NewEncoder(w).Encode(map[string]string{"status": "success"})
}

Вопрос 37. API для получения ленты, загрузки поста и подписки/отписки?

Таймкод: 00:14:36

Ответ собеседника: Неполный. Кандидат описывает API: Get Feed, Upload Post, Subscription.

Правильный ответ:
Помимо базовых эндпоинтов (GET /feed, POST /post, POST /subscribe и POST /unsubscribe), API должно включать:

Поддержку пагинации (параметры cursor или page, page_size).
Аутентификацию (токены, сессии).
Валидацию входных данных и обработку ошибок.
Версионирование API для обеспечения обратной совместимости.
Дополнительно можно предусмотреть эндпоинты для обновления и удаления постов (если потребуется soft delete) и получения информации о пользователях.

Вопрос 38. Что не хватает в API для ленты?

Таймкод: 00:15:48

Ответ собеседника: Правильный. Интервьюер спрашивает, чего не хватает в API для ленты.

Правильный ответ:
В API для ленты не хватает:

Механизмов пагинации и сортировки (например, параметры cursor/page, фильтры по времени).
Поддержки параметров для обновления кэша (например, возможность ручного обновления ленты).
Детализации возвращаемых данных (не только идентификаторы постов, но и краткие сведения – URL изображения, описание, время создания).
Ограничений и контроля частоты запросов (rate limiting) для защиты от перегрузок.

Вопрос 39. Архитектура системы. Какие сервисы будут?

Таймкод: 00:16:52

Ответ собеседника: Правильный. Интервьюер предлагает перейти к проектированию архитектуры.

Правильный ответ:
Архитектура должна включать следующие ключевые компоненты:

Клиентское приложение.
Load Balancer/API Gateway. Распределяет входящие запросы.
Image Service. Обслуживает загрузку и хранение изображений (обычно интегрируется с S3 или аналогичным хранилищем).
Post Service. Обрабатывает создание, обновление и получение постов, работает с реляционной БД (например, PostgreSQL).
Feed Service. Формирует и кэширует ленту пользователя, используя in-memory хранилище (Redis).
Relation Service. Управляет подписками и фолловерами; для сложных запросов может использовать графовую БД (Neo4j).
Message Queue (например, Kafka). Для асинхронного обмена событиями между сервисами.
Такой подход позволяет масштабировать каждый компонент независимо и обеспечивает высокую отказоустойчивость.

Вопрос 40. Предлагаемая архитектура: клиент, load balancer, image service, post service, feed service, relation service.

Таймкод: 00:17:01

Ответ собеседника: Неполный. Кандидат предлагает архитектуру с клиентом, load balancer, image service, post service, feed service и relation service.

Правильный ответ:
Это базовая архитектура, но для полноты картины следует добавить:

API Gateway. Может объединять вызовы микросервисов и управлять аутентификацией.
Message Queue. Для асинхронного обмена событиями между Post Service и Feed Service, что решает проблему двухэтапной загрузки и уменьшает связность.
Кэширование. В виде Redis для быстрого доступа к ленте.
Мониторинг и логирование. Для контроля работоспособности системы.
Такое разделение позволяет независимо масштабировать сервисы, повышает отказоустойчивость и упрощает обслуживание.

Вопрос 41. Проблема двухэтапной загрузки поста?

Таймкод: 00:19:55

Ответ собеседника: Правильный. Интервьюер указывает на проблему двухэтапной загрузки поста: загрузка картинки без создания поста.

Правильный ответ:
Проблема заключается в том, что изображение может быть успешно загружено (например, в S3), но процесс создания метаданных поста в Post Service может завершиться с ошибкой. Это приводит к появлению "висячих" изображений, которые не отображаются в ленте. Для решения проблемы нужно обеспечить транзакционную согласованность между загрузкой изображения и созданием записи в БД или предусмотреть механизм периодической очистки неиспользуемых изображений.

Вопрос 42. Решение проблемы с незавершенной загрузкой поста?

Таймкод: 00:20:33

Ответ собеседника: Неполный. Кандидат предлагает временное хранилище для изображений.

Правильный ответ:
Лучшим решением является:

Использование транзакционного подхода или компенсационных механизмов. Например, после загрузки изображения отправлять событие в Message Queue, а Post Service создавать пост в рамках транзакции.
Если транзакция невозможна, внедрить механизм "staging", где изображение временно хранится и через определённое время производится проверка его использования.
Реализовать фоновую задачу по очистке неиспользуемых изображений.
Таким образом, обеспечивается согласованность данных и отсутствие "заброшенных" файлов.

Вопрос 43. Как Post Service сообщает Feed Service о новых постах?

Таймкод: 00:21:40

Ответ собеседника: Правильный. Интервьюер спрашивает, как Post Service уведомляет Feed Service о новых постах.

Правильный ответ:
Рекомендуется использовать событийно-ориентированную архитектуру:

После успешного создания поста Post Service публикует событие (например, в Kafka).
Feed Service подписывается на эти события и обновляет ленты соответствующих пользователей.
Такой подход позволяет асинхронно обрабатывать обновления и уменьшает связность между сервисами.

Вопрос 44. Использовать Message Queue для уведомления Feed Service о новых постах.

Таймкод: 00:21:46

Ответ собеседника: Правильный. Кандидат предлагает использовать Message Queue.

Правильный ответ:
Использование Message Queue (например, Kafka) позволяет асинхронно уведомлять Feed Service о создании нового поста, обеспечивая высокую отказоустойчивость и масштабируемость. Такой подход снижает время синхронных запросов между сервисами и позволяет обрабатывать пиковые нагрузки без задержек.

Вопрос 45. Где и как храним ленту в Feed Service?

Таймкод: 00:22:25

Ответ собеседника: Правильный. Интервьюер спрашивает про хранение ленты в Feed Service, структуру данных и объем.

Правильный ответ:
Лента может храниться в быстром in-memory хранилище, таком как Redis, где для каждого пользователя создаётся отдельная структура (например, список или отсортированное множество) с идентификаторами постов. Такой подход обеспечивает быстрый доступ к данным и позволяет хранить ограниченное число постов (например, последние 100), что помогает оптимизировать расход памяти.

Вопрос 46. Хранение ленты в Redis для быстрого чтения.

Таймкод: 00:22:49

Ответ собеседника: Правильный. Кандидат предлагает использовать Redis для быстрого чтения ленты.

Правильный ответ:
Использование Redis позволяет обеспечить молниеносный доступ к ленте за счёт хранения готовых списков идентификаторов (и, при необходимости, части данных) в оперативной памяти. Это снижает нагрузку на базу данных и позволяет эффективно обрабатывать запросы пользователей даже при высоком RPS.

Вопрос 47. Что храним в Feed Service: посты целиком или идентификаторы?

Таймкод: 00:23:47

Ответ собеседника: Правильный. Интервьюер спрашивает, что именно хранить в Feed Service: полные посты или только идентификаторы.

Правильный ответ:
Оптимальным решением является хранение в Feed Service только идентификаторов постов или кратких сводок (например, URL, описание, timestamp). Это позволяет уменьшить объём данных, передаваемых между сервисами, и ускорить запросы. При необходимости подробная информация подгружается из Post Service.

Вопрос 48. Хранить URL и описание поста в Feed Service, чтобы избежать запросов в Post Service.

Таймкод: 00:23:57

Ответ собеседника: Неполный. Кандидат предлагает хранить URL и описание поста непосредственно в Feed Service для оптимизации.

Правильный ответ:
Такой подход снижает задержки, так как позволяет сразу возвращать пользователю основную информацию о посте. Однако он создаёт проблему согласованности данных: при изменении поста в Post Service необходимо обновлять кэшированную информацию в Feed Service. Решение может включать механизм инвалидации кэша или периодическую синхронизацию данных.

Вопрос 49. Проблема изменения постов при хранении URL и описания в Feed Service?

Таймкод: 00:23:57

Ответ собеседника: Правильный. Интервьюер указывает на проблему, связанную с изменением постов, если в Feed Service хранятся URL и описания.

Правильный ответ:
Основная проблема – это рассинхронизация данных: если пользователь редактирует пост, кэшированная информация в Feed Service может устареть. Для решения следует:

Внедрить механизм оповещения (например, через Message Queue) об изменении поста,
Обновлять или инвалидацировать кэш,
Использовать стратегию, при которой в Feed Service хранится только критическая информация, а подробности всегда подтягиваются из Post Service.

Вопрос 50. Схема хранения ленты в Redis?

Таймкод: 00:25:13

Ответ собеседника: Правильный. Интервьюер просит нарисовать схему хранения ленты в Redis.

Правильный ответ:
Одним из распространённых вариантов является использование отсортированных множеств (Sorted Set) для каждого пользователя. Например:

Ключ: feed:{user_id}
Значения: идентификаторы постов с баллом – меткой времени создания
Команды Redis могут выглядеть так:

ZADD feed:123 1612345678 post_456
ZRANGE feed:123 0 19 WITHSCORES

Это позволяет быстро получать последние N постов в обратном хронологическом порядке.

Вопрос 51. Сколько постов хранить в ленте?

Таймкод: 00:25:58

Ответ собеседника: Правильный. Интервьюер поднимает вопрос об ограничении количества хранимых постов в ленте.

Правильный ответ:
Хранить ленту можно ограничив количество постов для каждого пользователя (например, 100 последних постов). Это помогает снизить требования к памяти и ускоряет операции чтения. Дополнительно можно реализовать механизм on-demand подгрузки более старых постов из Post Service.

Вопрос 52. Оценим объем хранилища для лент при ограничении 100 постов на пользователя.

Таймкод: 00:26:39

Ответ собеседника: Правильный. Интервьюер предлагает оценить объем хранилища при ограничении в 100 постов на пользователя.

Правильный ответ:
Если хранить 100 идентификаторов (или кратких сводок) на пользователя, и предположить, что один идентификатор занимает около 8 байт, то для 50млн пользователей потребуется:

50\,000\,000 \times 100 \times 8 \text{ байт} = 40 \text{ ГБ}

При добавлении служебных данных и с учётом оверхеда, объём может быть выше, но это остаётся управляемым при горизонтальном масштабировании Redis.

Вопрос 53. Обсуждение объема хранилища и стоимости Redis.

Таймкод: 00:30:50

Ответ собеседника: Правильный. Продолжается обсуждение объема хранилища и экономической целесообразности использования Redis.

Правильный ответ:
Использование Redis для кэширования ленты должно балансироваться между скоростью доступа и затратами на оперативную память. Для активных пользователей кэшировать полный список постов имеет смысл, а для неактивных – использовать on-demand генерацию ленты. Кроме того, можно реализовать шардирование Redis, чтобы распределить нагрузку и снизить затраты при увеличении числа пользователей.

Вопрос 54. Предлагаю сократить количество постов в ленте до 20, чтобы уменьшить затраты.

Таймкод: 00:32:00

Ответ собеседника: Правильный. Интервьюер предлагает уменьшить количество хранимых постов для оптимизации затрат.

Правильный ответ:
Сокращение числа кэшируемых постов до 20 для активной ленты снижает потребление памяти в Redis и уменьшает стоимость инфраструктуры. При этом, если пользователь требует больше данных, Feed Service может динамически подгружать дополнительный контент из Post Service, обеспечивая баланс между производительностью и затратами.

Вопрос 55. Учет неактивных пользователей, которые заходят редко.

Таймкод: 00:32:41

Ответ собеседника: Правильный. Интервьюер спрашивает про учет неактивных пользователей и хранение лент для них.

Правильный ответ:
Для неактивных пользователей имеет смысл ограничить или вовсе очищать кэш их ленты, чтобы экономить ресурсы. При повторном входе лента может генерироваться on-demand, используя данные из Post Service и Relation Service, что снижает нагрузку на in-memory хранилище.

Вопрос 56. Удаление лент для неактивных пользователей и запрос в Post Service в случае необходимости.

Таймкод: 00:33:19

Ответ собеседника: Неполный. Кандидат предлагает удалять ленты для неактивных пользователей и запрашивать посты из Post Service при их возвращении.

Правильный ответ:
Это подходящая стратегия, однако нужно уточнить детали:

Определить порог неактивности (например, 30 дней) для очистки кэша ленты.
При возвращении пользователя инициировать процесс "реварма" ленты – запрос последних постов из Post Service с учетом подписок.
Такой механизм позволяет снизить затраты на хранение кэша для неактивных пользователей.

Вопрос 57. Что делать, если пользователь хочет увидеть больше 20 постов?

Таймкод: 00:34:03

Ответ собеседника: Правильный. Интервьюер спрашивает, что делать, если пользователь хочет просмотреть больше 20 постов.

Правильный ответ:
В этом случае реализуется механизм пагинации или бесконечной прокрутки:

Первоначально возвращается 20 постов,
При достижении конца ленты клиент запрашивает следующий блок данных,
Если кэш содержит меньше 20 постов, система обращается к Post Service для подгрузки оставшихся.
Это позволяет эффективно управлять объёмом передаваемых данных и поддерживать быстрый отклик.

Вопрос 58. Запрашивать дополнительные посты из Post Service при необходимости.

Таймкод: 00:34:15

Ответ собеседника: Правильный. Кандидат отвечает, что в таком случае Feed Service будет обращаться к Post Service.

Правильный ответ:
Да, если кэшированная лента ограничена (например, 20 постами), при запросе дополнительных данных Feed Service должен обратиться к Post Service, чтобы получить оставшиеся посты, сохранив порядок и актуальность ленты. Это можно реализовать через механизм "lazy loading" или дополнительную пагинацию.

Вопрос 59. Как Feed Service узнает, чьи ленты перестраивать при создании нового поста?

Таймкод: 00:35:59

Ответ собеседника: Правильный. Интервьюер спрашивает, как Feed Service определяет, кому перестраивать ленту при создании нового поста.

Правильный ответ:
При создании нового поста Post Service генерирует событие, содержащее идентификатор автора. Затем, используя заранее подготовленные данные (например, список подписчиков, кэшированный в Relation Service или отдельном сервисе), Feed Service определяет, какие пользователи должны получить обновление. Этот процесс может выполняться через fan-out механизм, где обновления распределяются асинхронно.

Вопрос 60. Feed Service должен обращаться к Relation Service для получения информации о подписках.

Таймкод: 00:36:28

Ответ собеседника: Неправильный. Кандидат предлагает Feed Service обращаться к Relation Service, но это неэффективно.

Правильный ответ:
Синхронное обращение к Relation Service при каждом новом посте создаёт узкое место и увеличивает задержки. Вместо этого лучше заранее кэшировать информацию о подписчиках или использовать событийно-ориентированную архитектуру, где Relation Service публикует изменения, а Feed Service обновляет ленты на основании полученных событий, избегая прямых запросов.

Вопрос 61. Триггером для перестройки ленты должно быть создание поста, а не подписка.

Таймкод: 00:36:48

Ответ собеседника: Правильный. Интервьюер указывает, что триггером должно быть добавление поста.

Правильный ответ:
Правильным является запуск обновления ленты при создании нового поста. Это позволяет немедленно уведомлять подписчиков о новом контенте, а изменения подписок могут обрабатываться отдельно, так как они не требуют моментального обновления ленты.

Вопрос 62. Пример сценария: неделя назад подписался, сейчас пользователь постит. Как перестроить ленту?

Таймкод: 00:37:30

Ответ собеседника: Правильный. Интервьюер приводит пример сценария для уточнения механизма перестройки ленты.

Правильный ответ:
В данном сценарии необходимо учитывать время подписки: если пользователь подписался неделю назад, он должен получать все посты, созданные после подписки. Feed Service должен иметь возможность фильтровать обновления, используя метку времени подписки, чтобы не включать посты, созданные до её установления. Такой подход обеспечивает корректное формирование ленты, соответствующее ожиданиям пользователя.

Вопрос 63. Feed Service должен ходить в Relation Service.

Таймкод: 00:38:28

Ответ собеседника: Неправильный. Кандидат повторяет ошибочное решение: Feed Service идет в Relation Service.

Правильный ответ:
Синхронное обращение Feed Service к Relation Service при каждом обновлении ленты приводит к повышенной задержке и узким местам. Вместо этого необходимо использовать кэширование или асинхронное получение информации о подписках (через Message Queue или периодическое обновление кэша), что позволяет избежать циклической зависимости между сервисами.

Вопрос 64. Циклические связи между сервисами - это проблема?

Таймкод: 00:38:52

Ответ собеседника: Правильный. Интервьюер спрашивает про циклическую зависимость и проблемы, которые она может вызвать.

Правильный ответ:
Да, циклические связи между сервисами усложняют поддержку, приводят к взаимным задержкам и могут вызвать каскадные сбои. Поэтому архитектуру необходимо проектировать так, чтобы сервисы взаимодействовали асинхронно и были слабо связаны, что обеспечивает независимое масштабирование и упрощает обслуживание.

Вопрос 65. Как убрать циклическую связь?

Таймкод: 00:39:26

Ответ собеседника: Неполный. Кандидат предлагает использовать Message Queue для разрыва цикла.

Правильный ответ:
Для разрыва циклической зависимости следует использовать асинхронное взаимодействие через Message Queue. Это позволяет:

Публиковать события об изменениях,
Обрабатывать их в независимых сервисах,
Избегать прямых синхронных вызовов между сервисами.
Кроме того, можно применять стратегию денормализации данных, когда необходимая информация реплицируется в нескольких сервисах для снижения межсервисных вызовов.

Вопрос 66. Ограничение на количество подписчиков у пользователя?

Таймкод: 00:40:31

Ответ собеседника: Правильный. Интервьюер поднимает вопрос об ограничении количества подписчиков и проблеме "звезд".

Правильный ответ:
С точки зрения архитектуры следует учитывать, что у некоторых пользователей (например, знаменитостей) может быть миллион и более подписчиков. Это влияет на стратегию рассылки обновлений в ленту: для "звезд" необходимо применять специальные методы, такие как pull-модель или гибридный подход, чтобы избежать перегрузки системы при fan-out обновлений.

Вопрос 67. Проблема пользователя с миллионом подписчиков.

Таймкод: 00:40:42

Ответ собеседника: Правильный. Интервьюер уточняет проблему с пользователем, имеющим миллион подписчиков и создающим пост.

Правильный ответ:
У пользователя с большим числом подписчиков классическая модель push обновления ленты не масштабируется. В таких случаях целесообразно использовать pull-модель: при запросе ленты подписчиков данные генерируются on-demand, либо применяется гибридный подход, где для обычных пользователей применяется push, а для "звезд" – pull, что позволяет снизить нагрузку на систему.

Вопрос 68. Как обрабатывать пользователей с большим количеством подписчиков?

Таймкод: 00:41:38

Ответ собеседника: Правильный. Интервьюер спрашивает о подходах к обработке "звездных" пользователей.

Правильный ответ:
Для пользователей с большим числом подписчиков рекомендуется:

Использовать гибридный подход, когда для обычных пользователей применяется push-модель, а для "звезд" – pull-модель, при которой лента генерируется по запросу.
Организовать отдельный поток обработки обновлений для таких пользователей, чтобы не перегружать основную систему.
Кэшировать результаты генерации ленты для снижения нагрузки при повторных запросах.

Вопрос 69. Гибридный подход: разные стратегии для обычных пользователей и "звезд".

Таймкод: 00:42:50

Ответ собеседника: Правильный. Интервьюер предлагает гибридный подход.

Правильный ответ:
Гибридный подход предусматривает:

Push-модель для пользователей с небольшим числом подписчиков – лента обновляется сразу при создании поста,
Pull-модель для "звездных" пользователей – лента формируется по запросу, возможно с использованием предварительно кэшированных данных.
Это позволяет оптимизировать нагрузку и избежать проблем при массовой рассылке обновлений.

Вопрос 70. Хранить ленту "звезд" отдельно и мержить?

Таймкод: 00:44:16

Ответ собеседника: Неполный. Кандидат предлагает хранить ленты "звезд" отдельно и мержить их с лентами подписчиков.

Правильный ответ:
Правильное решение – для пользователей с огромным числом подписчиков хранить посты "звезд" в отдельном потоке или кэше, а затем мержить их с лентами подписчиков при запросе. Такой подход снижает нагрузку на систему push-уведомлений и позволяет эффективно обслуживать запросы пользователей с высоким числом подписок.

Вопрос 71. Сколько постов "звезд" хранить?

Таймкод: 00:44:48

Ответ собеседника: Правильный. Интервьюер спрашивает про объем хранения постов "звезд".

Правильный ответ:
Для "звезд" можно ограничиться хранением, например, последних 20–50 постов в специальном кэше, так как эти данные являются наиболее актуальными. При запросе подписчиков старые посты можно подгружать из Post Service по необходимости, что позволит оптимизировать расход памяти.

Вопрос 72. Выбор баз данных для сервисов. Post Service - PostgreSQL?

Таймкод: 00:46:06

Ответ собеседника: Правильный. Интервьюер предлагает обсудить выбор баз данных.

Правильный ответ:
Для Post Service хорошо подходит PostgreSQL, так как она обеспечивает:

ACID-свойства для целостности данных,
Богатый функционал для сложных запросов и индексации,
Возможность масштабирования через репликацию и шардирование.
При высоких нагрузках можно использовать горизонтальное масштабирование и партицирование таблиц.

Вопрос 73. Схема данных Post Service?

Таймкод: 00:46:35

Ответ собеседника: Правильный. Интервьюер просит описать схему данных для Post Service.

Правильный ответ:
Базовая схема данных может включать таблицу posts со следующими полями:

id – уникальный идентификатор поста,
user_id – идентификатор пользователя,
image_url – URL изображения,
description – текстовое описание (ограничение, например, 100 символов),
created_at – время создания поста.

Пример SQL-запроса:

CREATE TABLE posts (
    id BIGSERIAL PRIMARY KEY,
    user_id BIGINT NOT NULL,
    image_url TEXT NOT NULL,
    description VARCHAR(100),
    created_at TIMESTAMPTZ DEFAULT NOW()
);

Эта схема позволяет эффективно индексировать данные и выполнять запросы по времени и пользователю.

Вопрос 74. Хранилище изображений - S3?

Таймкод: 00:47:48

Ответ собеседника: Правильный. Интервьюер спрашивает про хранилище изображений.

Правильный ответ:
Использование облачных хранилищ, таких как Amazon S3, является стандартной практикой для хранения изображений. Это решение обеспечивает высокую масштабируемость, отказоустойчивость и экономическую эффективность при работе с большим объёмом данных.

Вопрос 75. Relation Service - графовая база данных Neo4j?

Таймкод: 00:48:27

Ответ собеседника: Правильный. Интервьюер спрашивает про базу данных для Relation Service и предлагает графовую БД Neo4j.

Правильный ответ:
Графовые базы данных, такие как Neo4j, отлично подходят для хранения и обработки данных о подписках и фолловерах, поскольку позволяют эффективно выполнять запросы на поиск связей между пользователями (например, взаимные подписки или рекомендации).

Вопрос 76. Как представить подписки в виде графа?

Таймкод: 00:49:57

Ответ собеседника: Правильный. Интервьюер просит объяснить, как представить подписки в виде графа.

Правильный ответ:
В графовой модели:

Каждая вершина представляет пользователя,
Направленное ребро от A к B означает, что пользователь A подписан на пользователя B.
Дополнительно можно хранить свойства на ребрах, например, дату подписки, что позволяет проводить более сложные аналитические запросы.

Вопрос 77. Вершина - пользователь, ребро - подписка.

Таймкод: 00:50:14

Ответ собеседника: Правильный. Кандидат объясняет представление подписок в виде графа: вершины - пользователи, ребра - подписки.

Правильный ответ:
Да, именно так: каждый пользователь является узлом, а подписка – направленным ребром между узлами. Это позволяет легко выполнять запросы для получения списка подписок, взаимных связей и строить рекомендации на основе графовых алгоритмов.

Вопрос 78. MQ - Kafka?

Таймкод: 00:51:09

Ответ собеседника: Правильный. Интервьюер спрашивает про выбор Message Queue и предлагает Kafka.

Правильный ответ:
Apache Kafka – отличный выбор для Message Queue, так как он обеспечивает высокую пропускную способность, отказоустойчивость и масштабируемость. Он подходит для обработки потоков событий, таких как уведомления о новых постах, обновлениях подписок и т.п.

Вопрос 79. Отказоустойчивость и масштабируемость архитектуры?

Таймкод: 00:51:19

Ответ собеседника: Правильный. Интервьюер переходит к вопросам отказоустойчивости и масштабируемости.

Правильный ответ:
Архитектура должна обеспечивать отказоустойчивость за счёт:

Репликации данных (как в БД, так и в кэше),
Горизонтального масштабирования сервисов (статeless-сервисы, масштабирование через добавление экземпляров),
Использования Load Balancer, распределения трафика и мониторинга состояния сервисов.
Такая архитектура способна выдерживать пиковые нагрузки и быстро восстанавливаться после сбоев.

Вопрос 80. Репликация баз данных и Kafka для отказоустойчивости.

Таймкод: 00:51:25

Ответ собеседника: Правильный. Кандидат предлагает репликацию баз данных и Kafka для отказоустойчивости.

Правильный ответ:
Для обеспечения отказоустойчивости необходимо настроить репликацию:

В реляционных БД (например, PostgreSQL) использовать репликацию для создания резервных копий и распределения нагрузки на чтение.
В Kafka настроить репликацию партиций, чтобы гарантировать, что сообщения не будут потеряны в случае сбоя брокера.
Эти меры помогают поддерживать высокую доступность и целостность данных.

Вопрос 81. Синхронная или асинхронная репликация?

Таймкод: 00:51:36

Ответ собеседника: Правильный. Интервьюер спрашивает про тип репликации.

Правильный ответ:
Асинхронная репликация чаще используется для масштабируемости и высокой производительности, так как не блокирует запись в основной БД. Однако, в критичных для целостности данных случаях может потребоваться синхронная репликация. В большинстве сценариев для ленты Instagram предпочтительна асинхронная репликация с учётом eventual consistency.

Вопрос 82. Асинхронная репликация для баз данных.

Таймкод: 00:51:55

Ответ собеседника: Правильный. Кандидат выбирает асинхронную репликацию.

Правильный ответ:
Использование асинхронной репликации позволяет обеспечить высокую производительность системы, так как запись не блокируется ожиданием подтверждения от реплик. Это допустимо, если система способна работать с eventual consistency, что является приемлемым компромиссом для ленты.

Вопрос 83. Возможные проблемы с асинхронной репликацией Redis?

Таймкод: 00:52:07

Ответ собеседника: Правильный. Интервьюер указывает на потенциальные проблемы асинхронной репликации Redis.

Правильный ответ:
При асинхронной репликации Redis возможны:

Задержки в обновлении данных между мастером и репликами,
Риск потери данных при сбое мастера до завершения репликации,
Сложности при failover, если реплики отстают от мастера.
Чтобы минимизировать риски, необходимо настроить периодические бэкапы, использовать Redis Cluster и применять корректные политики репликации.

Вопрос 84. Отказоустойчивость сервисов. Что произойдет, если сервис выйдет из строя?

Таймкод: 00:53:00

Ответ собеседника: Правильный. Интервьюер спрашивает про отказоустойчивость сервисов в случае сбоя.

Правильный ответ:
Система должна быть спроектирована так, чтобы при сбое одного сервиса другие экземпляры могли продолжать работу. Для этого:

Каждый сервис разворачивается в нескольких экземплярах,
Используются Load Balancer и DNS, распределяющие нагрузку,
Применяются механизмы автоматического обнаружения и замены неработающих узлов,
Реализуются fallback-стратегии и circuit breakers для предотвращения каскадных отказов.

Вопрос 85. Запуск сервисов в нескольких экземплярах для отказоустойчивости.

Таймкод: 00:53:31

Ответ собеседника: Правильный. Кандидат предлагает запуск сервисов в нескольких экземплярах.

Правильный ответ:
Развёртывание сервисов в нескольких экземплярах позволяет обеспечить отказоустойчивость и горизонтальное масштабирование. При этом важно правильно настроить мониторинг, авто-масштабирование и балансировку нагрузки, чтобы при сбое одного экземпляра остальные могли оперативно подхватить его функции.

Вопрос 86. Load Balancer для распределения нагрузки между экземплярами сервисов.

Таймкод: 00:53:38

Ответ собеседника: Правильный. Интервьюер спрашивает про Load Balancer.

Правильный ответ:
Load Balancer распределяет входящие запросы между работающими экземплярами сервисов, обеспечивая равномерное распределение нагрузки, обнаружение неработающих узлов и автоматическое переключение трафика. Это ключевой компонент для обеспечения отказоустойчивости и масштабируемости микросервисной архитектуры.

Вопрос 87. Как клиент узнает, в какой Load Balancer идти?

Таймкод: 00:53:51

Ответ собеседника: Правильный. Интервьюер спрашивает, как клиент определяет, к какому Load Balancer обращаться.

Правильный ответ:
Обычно используется DNS Load Balancing, когда DNS-сервер возвращает несколько IP-адресов, распределяя трафик между различными инстансами Load Balancer. Дополнительно может применяться API Gateway, который абстрагирует детали внутренней инфраструктуры от клиента.

Вопрос 88. DNS Load Balancing.

Таймкод: 00:53:59

Ответ собеседника: Правильный. Кандидат предлагает DNS Load Balancing.

Правильный ответ:
DNS Load Balancing позволяет распределять запросы между несколькими IP-адресами, что упрощает масштабирование и повышает отказоустойчивость. Это один из методов балансировки нагрузки, который можно комбинировать с другими решениями (например, с аппаратными Load Balancer-ами) для оптимального результата.

Вопрос 89. Масштабируемость архитектуры?

Таймкод: 00:54:02

Ответ собеседника: Правильный. Интервьюер возвращается к вопросу масштабируемости.

Правильный ответ:
Архитектура должна поддерживать горизонтальное масштабирование за счёт:

Независимого масштабирования каждого микросервиса,
Использования распределённых БД и кэшей,
Асинхронного обмена данными через Message Queue.
Такая структура обеспечивает возможность обработки пиковых нагрузок и адаптации к росту числа пользователей.

Вопрос 90. Горизонтальное масштабирование сервисов.

Таймкод: 00:54:25

Ответ собеседника: Правильный. Кандидат говорит о горизонтальном масштабировании сервисов.

Правильный ответ:
Горизонтальное масштабирование подразумевает добавление новых экземпляров сервиса для распределения нагрузки. Это достигается за счёт без сохранения состояния (stateless) в сервисах, использования внешнего кэширования и балансировщиков нагрузки, что позволяет увеличивать производительность без кардинальной переработки архитектуры.

Вопрос 91. Масштабирование баз данных?

Таймкод: 00:54:28

Ответ собеседника: Правильный. Интервьюер спрашивает про масштабирование баз данных.

Правильный ответ:
Масштабирование баз данных осуществляется через:

Репликацию (read replicas для распределения нагрузки на чтение),
Шардирование (разбиение данных по ключу, например, по user_id),
Кэширование часто запрашиваемых данных.
Эти методы позволяют обрабатывать большой объём данных и поддерживать высокую скорость отклика.

Вопрос 92. Шардирование баз данных.

Таймкод: 00:54:37

Ответ собеседника: Правильный. Кандидат предлагает шардирование баз данных.

Правильный ответ:
Шардирование делит данные на независимые части (шарды) по выбранному ключу (например, user_id), что позволяет распределить нагрузку между несколькими серверами. Каждый шард содержит подмножество данных, что упрощает масштабирование и повышает производительность системы.

Вопрос 93. Масштабирование Kafka - партицирование.

Таймкод: 00:54:53

Ответ собеседника: Правильный. Интервьюер спрашивает про масштабирование Kafka.

Правильный ответ:
Для масштабирования Kafka используется партицирование, которое распределяет сообщения между несколькими брокерами. Это позволяет увеличивать пропускную способность, обеспечивать параллельную обработку и повышать отказоустойчивость системы.

Вопрос 94. Масштабируемость S3 и Redis?

Таймкод: 00:55:15

Ответ собеседника: Правильный. Интервьюер спрашивает про масштабируемость S3 и Redis.

Правильный ответ:
Amazon S3 обеспечивает практически неограниченное масштабирование для хранения объектов, а Redis можно масштабировать за счёт кластеризации и шардирования. При этом важно правильно настроить политики кэширования, репликации и автоматического масштабирования, чтобы удовлетворять требованиям по скорости и объёму данных.

Вопрос 95. Вопросы по систем дизайну и собеседованию?

Таймкод: 00:56:10

Ответ собеседника: Правильный. Интервьюер спрашивает, есть ли вопросы у кандидата.

Правильный ответ:
На этом этапе важно уточнить любые моменты, связанные с масштабируемостью, отказоустойчивостью или бизнес-требованиями. Кандидату стоит задать вопросы о приоритетах (например, важнее ли время отклика или консистентность данных), существующих ограничениях инфраструктуры и планах по развитию системы, чтобы лучше понимать контекст задачи.

Вопрос 96. Общий фидбек по собеседованию.

Таймкод: 00:56:25

Ответ собеседника: Правильный. Интервьюер начинает давать фидбек.

Правильный ответ:
Фидбек по собеседованию включает оценку технических знаний, понимание масштабируемости системы и грамотное обоснование архитектурных решений. Важно отметить, что продуманные подходы к проектированию, внимание к деталям и способность адаптироваться к требованиям бизнеса являются ключевыми критериями для успешного решения задачи.

Вопрос 97. Оценка собеседования и общий фидбек?

Таймкод: 01:01:34

Ответ собеседника: Правильный. Кандидат спрашивает общую оценку и фидбек.

Правильный ответ:
Общий фидбек должен охватывать сильные стороны – глубокое понимание архитектуры, грамотное разделение функциональных и нефункциональных требований, а также способность проводить подробные расчёты нагрузки и объёма хранилища. При этом стоит отметить области для улучшения, такие как более детальное проработка механизмов кэширования и согласованности данных между сервисами.

Вопрос 98. Итог собеседования - пройден.

Таймкод: 01:01:38

Ответ собеседника: Правильный. Интервьюер говорит, что собеседование пройдено.

Правильный ответ:
Подтверждение успешного прохождения собеседования говорит о том, что кандидат продемонстрировал достаточные знания по системному дизайну, масштабируемости и отказоустойчивости, а также понимание принципов построения распределённых систем. Это завершающий этап, подтверждающий готовность к решению сложных инженерных задач.

Вопрос 1. Предлагаю спроектировать ленту Instagram. Необходимо формализовать требования, оценить нагрузку, описать API и архитектуру, а также модель данных и железо.​

Вопрос 2. Начнем с функциональных требований. Что требуется для ленты Instagram?​

Вопрос 3. Какие функциональные требования к ленте Instagram?​

Вопрос 4. Нужны ли лайки и комментарии?​

Вопрос 5. Нужно ли удаление постов?​

Вопрос 6. Относительно чего получаем ленту? Нужны ли подписки?​

Вопрос 7. В каком порядке формировать ленту на основе подписок?​

Вопрос 8. Предлагаю формировать ленту в обратном хронологическом порядке.​

Вопрос 9. Переходим к нефункциональным требованиям. Сколько пользователей будет?​

Вопрос 10. Сколько пользователей будет в системе?​

Вопрос 11. Геораспределенная ли система?​

Вопрос 12. Тайминги загрузки поста и получения ленты?​

Вопрос 13. Какое время загрузки поста будет быстрым?​

Вопрос 14. Сколько времени займет загрузка поста?​

Вопрос 15. Сколько времени займет получение ленты?​

Вопрос 16. Сколько храним посты?​

Вопрос 17. Как долго храним посты?​

Вопрос 18. Какая нагрузка на чтение и запись постов?​

Вопрос 19. Сколько постов создает и просматривает пользователь в день?​

Вопрос 20. Сколько постов выдавать в ленте?​

Вопрос 21. Сколько постов выдавать за запрос?​

Вопрос 22. Что такое пост? Из чего состоит?​

Вопрос 23. Из чего состоит пост?​

Вопрос 24. Сколько картинок в посте?​

Вопрос 25. Какое ограничение на описание поста?​

Вопрос 26. Размер картинки в посте?​

Вопрос 27. Посчитаем RPS на запись.​

Вопрос 28. Посчитаем RPS на чтение.​

Вопрос 29. Что можно сказать о нагрузке, исходя из расчетов RPS?​

Вопрос 30. Посчитаем трафик на запись.​

Вопрос 31. Какой размер картинки возьмем для расчета трафика?​

Вопрос 32. Уточнение по расчету трафика.​

Вопрос 33. Посчитаем капасити на год.​

Вопрос 34. Ошибка в расчете трафика на чтение.​

Вопрос 35. Оценка capacity хранилища.​

Вопрос 36. Опиши API системы.​

Вопрос 37. API для получения ленты, загрузки поста и подписки/отписки?​

Вопрос 38. Что не хватает в API для ленты?​

Вопрос 39. Архитектура системы. Какие сервисы будут?​

Вопрос 40. Предлагаемая архитектура: клиент, load balancer, image service, post service, feed service, relation service.​

Вопрос 41. Проблема двухэтапной загрузки поста?​

Вопрос 42. Решение проблемы с незавершенной загрузкой поста?​

Вопрос 43. Как Post Service сообщает Feed Service о новых постах?​

Вопрос 44. Использовать Message Queue для уведомления Feed Service о новых постах.​

Вопрос 45. Где и как храним ленту в Feed Service?​

Вопрос 46. Хранение ленты в Redis для быстрого чтения.​

Вопрос 47. Что храним в Feed Service: посты целиком или идентификаторы?​

Вопрос 48. Хранить URL и описание поста в Feed Service, чтобы избежать запросов в Post Service.​

Вопрос 49. Проблема изменения постов при хранении URL и описания в Feed Service?​

Вопрос 50. Схема хранения ленты в Redis?​

Вопрос 51. Сколько постов хранить в ленте?​

Вопрос 52. Оценим объем хранилища для лент при ограничении 100 постов на пользователя.​

Вопрос 53. Обсуждение объема хранилища и стоимости Redis.​

Вопрос 54. Предлагаю сократить количество постов в ленте до 20, чтобы уменьшить затраты.​

Вопрос 55. Учет неактивных пользователей, которые заходят редко.​

Вопрос 56. Удаление лент для неактивных пользователей и запрос в Post Service в случае необходимости.​

Вопрос 57. Что делать, если пользователь хочет увидеть больше 20 постов?​

Вопрос 58. Запрашивать дополнительные посты из Post Service при необходимости.​

Вопрос 59. Как Feed Service узнает, чьи ленты перестраивать при создании нового поста?​

Вопрос 60. Feed Service должен обращаться к Relation Service для получения информации о подписках.​

Вопрос 61. Триггером для перестройки ленты должно быть создание поста, а не подписка.​

Вопрос 62. Пример сценария: неделя назад подписался, сейчас пользователь постит. Как перестроить ленту?​

Вопрос 63. Feed Service должен ходить в Relation Service.​

Вопрос 64. Циклические связи между сервисами - это проблема?​

Вопрос 65. Как убрать циклическую связь?​

Вопрос 66. Ограничение на количество подписчиков у пользователя?​

Вопрос 67. Проблема пользователя с миллионом подписчиков.​

Вопрос 68. Как обрабатывать пользователей с большим количеством подписчиков?​

Вопрос 69. Гибридный подход: разные стратегии для обычных пользователей и "звезд".​

Вопрос 70. Хранить ленту "звезд" отдельно и мержить?​

Вопрос 71. Сколько постов "звезд" хранить?​

Вопрос 72. Выбор баз данных для сервисов. Post Service - PostgreSQL?​

Вопрос 73. Схема данных Post Service?​

Вопрос 74. Хранилище изображений - S3?​

Вопрос 75. Relation Service - графовая база данных Neo4j?​

Вопрос 76. Как представить подписки в виде графа?​

Вопрос 77. Вершина - пользователь, ребро - подписка.​

Вопрос 78. MQ - Kafka?​

Вопрос 79. Отказоустойчивость и масштабируемость архитектуры?​

Вопрос 80. Репликация баз данных и Kafka для отказоустойчивости.​