Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- windows forms
- 프로그래머스
- YOLO
- 명령어
- ubuntu
- OpenCV
- LIST
- 기타 연주
- Linux
- 채보
- Visual Studio
- C++
- Numpy
- mysql
- C
- pytorch
- 오류
- C#
- Selenium
- pip
- JSON
- label
- paramiko
- 핑거스타일
- VS Code
- Docker
- SSH
- Python
- pandas
- error
Archives
- Today
- Total
목록데이터 분리 (1)
기계는 거짓말하지 않는다
Python DataFrame 데이터 분리 후 csv 생성
특정 데이터 값을 기준으로 나눠 각각 csv로 저장 아래는 하나의 data csv 파일에서 AI 학습용 train, test, valid dataset으로 분리한다. 비율만큼 분리는 sklearn의 train_test_split을 이용했다. def trim_string(x, trim_word_count=100): x = x.split(maxsplit=trim_word_count) x = ' '.join(x[:trim_word_count]) return x def create_split_csv(raw_data_path=".", dest_path=".", label_numbers=[0, 1, 2], train_csv_name="train.csv", valid_csv_name="valid.csv", test_..
Python
2021. 10. 8. 15:50