머신러닝 프로덕션 코드를 구성하는 방법
본 포스트에서는 머신러닝 프로젝트에서 사용되는 프로덕션 코드가 어떻게 구성되어야하고 어떤 것들에 주의하는지를 소개하고자 한다. 프로덕션 코드는 실험을 위한 연구용 코드와 달리 사용자에게의 배포를 위한 코드를 일컫는다. 프로덕션 코드는 테스트, 유지보수, 확장성, 성능, 재생산성을 고려하여 작성되어야 한다. 프로덕션 코드와 연구용 코드의 큰 파이프라인은 비슷하다: 라이브러리와 데이터를 불러오고, 데이터를 훈련/테스트 데이터로 나누고, 데이터 정제를 하고, 모델 훈련을 하고, 모델 평가를 하고, 훈련한 모델을 저장하고, 테스트 데이터에 대해 예측을 한다. 프로덕션 코드를 어떻게 구조화를 하는가? 1. Convention 선택하기 버전 관리(versioning): 버전 관리 시스템을 사용하여 코드 변경 사항 ..
2023. 6. 25.