Автор материала: Юрий Кашницкий (@yorko в Slack ODS). Материал распространяется на условиях лицензии Creative Commons CC BY-NC-SA 4.0. Можно использовать в любых целях (редактировать, поправлять и брать за основу), кроме коммерческих, но с обязательным упоминанием автора материала.
В задании предлагается с помощью Pandas ответить на несколько вопросов по данным репозитория UCI Adult (качать данные не надо – они уже есть в репозитории). Для отправки решений используйте онлайн-форму.
Уникальные значения признаков (больше информации по ссылке выше):
import pandas as pd
data = pd.read_csv("../../data/adult.data.csv")
data.head()
1. Сколько мужчин и женщин (признак sex) представлено в этом наборе данных?
# Ваш код здесь
2. Каков средний возраст (признак age) женщин?
# Ваш код здесь
3. Какова доля граждан Германии (признак native-country)?
# Ваш код здесь
4-5. Каковы средние значения и среднеквадратичные отклонения возраста тех, кто получает более 50K в год (признак salary) и тех, кто получает менее 50K в год?
# Ваш код здесь
6. Правда ли, что люди, которые получают больше 50k, имеют как минимум высшее образование? (признак education – Bachelors, Prof-school, Assoc-acdm, Assoc-voc, Masters или Doctorate)
# Ваш код здесь
7. Выведите статистику возраста для каждой расы (признак race) и каждого пола. Используйте groupby и describe. Найдите таким образом максимальный возраст мужчин расы Amer-Indian-Eskimo.
# Ваш код здесь
8. Среди кого больше доля зарабатывающих много (>50K): среди женатых или холостых мужчин (признак marital-status)? Женатыми считаем тех, у кого marital-status начинается с Married (Married-civ-spouse, Married-spouse-absent или Married-AF-spouse), остальных считаем холостыми.
# Ваш код здесь
9. Какое максимальное число часов человек работает в неделю (признак hours-per-week)? Сколько людей работают такое количество часов и каков среди них процент зарабатывающих много?
# Ваш код здесь
10. Посчитайте среднее время работы (hours-per-week) зарабатывающих мало и много (salary) для каждой страны (native-country).
# Ваш код здесь