1. Iris 데이터셋을 불러옵니다. 2. sepal_length가 평균보다 큰 데이터와 평균보다 작은 데이터를 각각 필터링하여 두 개의 데이터프레임을 만드세요. 3. 새로운 열 category를 추가하여 각 행이 'above_average'인지 'below_average'인지 표시하세요. 4. 위 두 데이터프레임을 concat을 사용하여 하나로 합칩니다. (category가 above_average인 데이터 프레임 → category가 below_average인 데이터프레임 순서) 5. 최종 데이터프레임 concat_df의 50, 120번째 행을 출력하세요. * 조건 : concat을 사용할 때, ignore_index=True 옵션을 추가하여 인덱스를 재설정하세요.
Skeleton code
# Iris 데이터셋 로드
iris = sns.load_dataset("iris")
"""
코드 입력
"""
# 최종 데이터프레임 출력
print(concat_df.iloc[50])
print(concat_df.iloc[120])
1. Iris 데이터셋을 불러옵니다. 2. species별 평균 petal_length와 평균 petal_width를 계산하여 새로운 데이터프레임 species_avg를 만드세요. reset_index()를 사용하여, index를 재지정하세요. 3. 데이터프레임의 열 이름은 species, avg_petal_length, avg_petal_width로 지정합니다. species_avg와 원래의 Iris 데이터셋을 merge를 사용해 species를 기준으로 병합하세요. 4. 최종 데이터프레임 merged_df의 10, 50, 120번째 행을 출력하세요.
힌트 groupby()와 mean()을 사용하여 그룹별 평균을 계산하세요. merge에서 on 인자를 사용해 공통 열(species)을 기준으로 병합하세요.
Skeleton code
# Iris 데이터셋 로드
iris = sns.load_dataset("iris")
"""
코드 입력
"""
# 결과 출력
print(merged_df.iloc[10])
print(merged_df.iloc[50])
print(merged_df.iloc[120])
1. Tips 데이터셋을 불러옵니다. 2. 요일(day)과 시간(time)을 기준으로 그룹화하여 평균 팁(tip)과 총 금액(total_bill)을 계산하세요. 3. 결과를 피벗 테이블로 변환하여 출력하세요. 행은 day, 열은 time으로 설정하세요.
힌트 : groupby()와 pivot_table()을 활용하세요.
Skeleton code
# Tips 데이터셋 로드
tips = sns.load_dataset("tips")
"""
코드 작성
"""
print(pivot_table)
출력결과
'''
tip total_bill
time Lunch Dinner Lunch Dinner
day
Thur 2.767705 3.000000 1077.55 18.78
Fri 2.382857 2.940000 89.92 235.96
Sat NaN 2.993103 0.00 1778.40
Sun NaN 3.255132 0.00 1627.16
'''