27 Анализ данных с помощью SQL запросов
27.1 Рекомендуемая литература
- Лекция № 14, 15
27.2 Задание №1. Реализация БД
Опираясь на Figure 27.1 и используя СУБД, реализовать БД и наполнить её содержимым из гугл-таблицы. Предусмотреть проверки на валидность данных внутри СУБД и прочие ограничения (constraints). Предоставить результаты в виде git репозитория с sql запросами на создание БД и скриптов по наполнению БД (Python или SQL). Скрипт с запросами на создание можно составить с помощью функционала создания резервных копий БД.
27.3 Задание №2. Аналитические запросы
С помощью отдельных запросов MySQL или скриптом на Python (продвинутые могут построить дашбоард) ответьте на следующие вопросы:
Как распределены метрики качества секвенирования?
Сколько результатов было выдано партнерам?
Сколько семей участвовало в исследовании? Какова доля близкородственных браков?
Каково соотношение типов исследований? Каков вклад партнеров, и что они чаще заказывали?
Какова доля просроченных анализов?
Сколько анализов было сделано в рамках каких проектов?
Каков соотношение полов, распределение возраста в исследовании среди пробандов?
Грубо оцените размер вставки (insert size) для каждого образца. Соотнесите с техническими возможностями метода.
ПодсказкаДля этого вам потребуются количество прочтений, покрытие и средняя глубина
Оцените нагрузку приборов.
Сколько пробандов, каким заболеванием болеет. Что это за заболевания?
