ISSN: 1976-2380 / E-ISSN: 2713-9565
한국골프학회(골프연구), Vol.19 no.3 (2025)
pp.41~51
PGA 투어 데이터를 활용한 골프 선수 경기력 예측 모델 개발 및 성능 분석 연구
[목적] 본 연구는 2001년부터 2024년까지의 PGA 투어 데이터를 기반으로 선수의 경기 성적(총 타수)을 예측할 수 있 는 인공지능(AI) 회귀 모델을 구축하고, 그 성능을 분석·검증하는 데 목적이 있다. [방법] 선수별 시즌 기록(평균 타 수, 상금, 순위 등)을 활용하여 Random Forest Regressor와 Gradient Boosting Regressor 두 가지 모델을 구현하였다. 학습 데이터는 전체 경기 기록을 기반으로 구성되었으며, 예측 성능 평가는 MAE(평균 절대 오차), RMSE(평균 제곱 근 오차), R²(결정계수) 등의 지표를 중심으로 수행하였다. [결과] 두 모델 모두 안정적인 예측 성능을 보였으며, Gradient Boosting Regressor는 MAE 5.48, RMSE 6.94, R² .836을 기록하여 비교적 우수한 결과를 나타냈다. 이는 기 존 골프 예측 연구의 평균 오차 수준(6~8타)과 비교해 실용 가능성이 높은 수준으로 해석된다. [결론] 본 연구는 오픈 스포츠 데이터를 기반으로 경기력 예측 AI 모델의 실현 가능성을 제시하였으며, 향후 다양한 종목 및 성과 지표에 대한 확장 가능성과 실무 적용 가능성을 확인하였다.
Development and Evaluation of a Golf Performance Prediction Model Based on PGA Tour Data
[Purpose] This study aims to develop and evaluate AI-based regression models to predict golf players' performance—specifically total strokes—using PGA Tour data from 2001 to 2024. [Methods] Season-level player statistics, including average score, prize money, and ranking, were used as input variables to build two machine learning models: Random Forest Regressor and Gradient Boosting Regressor. Model performance was evaluated using standard regression metrics such as Mean Absolute Error (MAE), Root Mean Squared Error (RMSE), and R-squared (R²). [Results] Both models demonstrated stable prediction performance, with the Gradient Boosting Regressor showing superior results (MAE: 5.48, RMSE: 6.94, R²: 0.836). These outcomes indicate a competitive level of accuracy compared to existing golf prediction studies, which typically report MAE values in the range of 6 to 8 strokes. [Conclusion] The findings suggest that practical performance prediction is feasible using publicly available golf statistics, without the need for advanced shot-tracking data. The study also highlights the potential for future application in other sports domains and performance indicators.







