27  Анализ данных с помощью SQL запросов

27.1 Рекомендуемая литература

  • Лекция № 14, 15

27.2 Задание №1. Реализация БД

Опираясь на Figure 27.1 и используя СУБД, реализовать БД и наполнить её содержимым из гугл-таблицы. Предусмотреть проверки на валидность данных внутри СУБД и прочие ограничения (constraints). Предоставить результаты в виде git репозитория с sql запросами на создание БД и скриптов по наполнению БД (Python или SQL). Скрипт с запросами на создание можно составить с помощью функционала создания резервных копий БД.

27.3 Задание №2. Аналитические запросы

С помощью отдельных запросов MySQL или скриптом на Python (продвинутые могут построить дашбоард) ответьте на следующие вопросы:

  1. Как распределены метрики качества секвенирования?

  2. Сколько результатов было выдано партнерам?

  3. Сколько семей участвовало в исследовании? Какова доля близкородственных браков?

  4. Каково соотношение типов исследований? Каков вклад партнеров, и что они чаще заказывали?

  5. Какова доля просроченных анализов?

  6. Сколько анализов было сделано в рамках каких проектов?

  7. Каков соотношение полов, распределение возраста в исследовании среди пробандов?

  8. Грубо оцените размер вставки (insert size) для каждого образца. Соотнесите с техническими возможностями метода.

    Подсказка

    Для этого вам потребуются количество прочтений, покрытие и средняя глубина

  9. Оцените нагрузку приборов.

  10. Сколько пробандов, каким заболеванием болеет. Что это за заболевания?