Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- error
- JSON
- 컨테이너
- paramiko
- SSH
- Visual Studio
- 채보
- 프로그래머스
- VS Code
- pip
- 기타 연주
- label
- C++
- pytorch
- Selenium
- OpenCV
- Numpy
- ubuntu
- LIST
- pandas
- Python
- 오류
- 핑거스타일
- YOLO
- Linux
- Docker
- mysql
- windows forms
- C
- C#
Archives
- Today
- Total
기계는 거짓말하지 않는다
Python Pandas 조건에 맞는 데이터 일정 비율 추출 본문
DataFrame에서 조건을 만족하는 행 중 일정 비율 추출하는 예시이다.
count가 50보다 작은 행들 중 40% 데이터만 랜덤으로 추출하려면 아래와 같이 할 수 있다.
import pandas as pd
import random
df = pd.read_csv("custom_data.csv", encoding="utf-8")
# count가 50보다 큰 행의 인덱스
rows_to_select = df[df["count"] < 50].index
print(rows_to_select)
print(df.iloc[rows_to_select])
print("-" * 50)
# 조건에 맞는 인덱스 중 랜덤하게 40% 추출
rows_to_select = list(rows_to_select)
random.seed(42)
random.shuffle(rows_to_select)
print(rows_to_select)
select_ratio = 0.4
rows_to_select = rows_to_select[:int(select_ratio * len(rows_to_select))]
selected_df = df.iloc[rows_to_select]
print(selected_df)
'Python' 카테고리의 다른 글
Python subprocess pipe stdin write 중단 문제 (0) | 2023.08.19 |
---|---|
Python Paramiko module SSH exec_command 블록(wait) (0) | 2023.07.08 |
Python SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position 8-9: truncated \UXXXXXXXX escape 오류 (0) | 2023.04.29 |
Python String u'\ufeff' (0) | 2023.04.21 |
Python operator itemgetter, attrgetter (0) | 2023.04.15 |
Comments