1. 프로젝트 배경
팬데믹 이후 공유 오피스 시장은 급성장했지만, 스타트업 위축과 위워크의 파산 등으로 시장에 큰 변화를 겪고 있습니다. 특히 결제 전환율의 둔화는 서비스의 지속적인 성장을 방해하는 중요한 문제로 떠오르고 있습니다. 본 프로젝트의 목표는 결제 전환율을 높이고, 이를 위한 실질적인 전략을 데이터 분석과 예측 모델링을 통해 도출하는 것입니다.

2. 데이터 분석 및 예측 모델
2-1. 데이터 전처리 및 문제 정의
분석에 사용된 데이터는 2021년 5월부터 2023년 12월까지의 공유 오피스 출입 데이터로, 방문 기록과 결제 여부, 지점별 면적 등의 정보를 포함하고 있습니다. 핵심 목표는 결제 전환율을 높일 수 있는 인사이트를 도출하는 것이었습니다.
- 데이터 전처리: 중복값, 결측치, 이상치 처리를 통해 데이터를 정제했습니다. 특히, 체류 시간, 방문 일수, 지점 면적 등의 변수들은 결제 전환율에 큰 영향을 미칠 수 있는 특성으로 파악되어, 이를 바탕으로 파생 변수를 생성하고, 사이클릭 인코딩 및 원핫 인코딩을 적용하여 모델에 적합한 형태로 가공했습니다.
2-2. 시계열 예측 모델
시계열 예측에서는 방문자 수와 결제 수 간의 관계를 확인했습니다. 이들 간의 상관관계는 0.82로, 방문자 수가 증가할수록 결제 수가 비례하여 증가하는 경향이 있었습니다. 이를 바탕으로 Prophet 모델을 활용하여 향후 180일 동안의 방문자 수 변화를 예측했습니다.
- Prophet 모델 활용: Prophet 모델은 계절성, 추세, 휴일 효과 등을 반영할 수 있는 시계열 예측 모델로, 특히 비즈니스 데이터를 다룰 때 효과적입니다. Prophet을 통해 향후 방문자 수의 변화를 예측하고, 이를 바탕으로 결제 전환율 향상을 위한 전략을 도출할 수 있었습니다.
2-3. 앙상블 모델을 활용한 결제 전환 예측
결제 전환율 예측을 위해 앙상블 모델을 사용했습니다. 여러 모델을 비교한 결과, CatBoost 모델이 AUC-PR 0.61로 가장 높은 성능을 보였고, 결제 전환율을 예측하는 데 효과적인 모델로 선정되었습니다.
- 문제 발생: 데이터 불균형
- 결제 여부는 대부분 미결제인 경우가 많았고, 이는 모델 성능에 영향을 미쳤습니다. 이 문제를 해결하기 위해 오버샘플링 기법을 적용하여 미결제 데이터를 보강하고, 데이터 불균형 문제를 해결했습니다.
- 해결: 앙상블 모델과 하이퍼파라미터 튜닝
- 여러 개의 모델을 결합하여 성능을 극대화한 앙상블 모델을 활용했습니다. 또한, 하이퍼파라미터 튜닝을 통해 모델 성능을 더욱 개선할 수 있었습니다.
2-4. 사이클릭 인코딩을 통한 성능 향상
시계열 데이터에는 시간, 요일, 월, 계절 등의 주기적 특성이 포함됩니다. 이를 제대로 반영하기 위해 사이클릭 인코딩을 적용했습니다. 시간 데이터를 단순히 수치화하면, 모델이 시간의 주기성을 잘 반영하지 못할 수 있기 때문에, 주기적인 변수를 사이클적인 형식으로 변환하여 모델에 적용했습니다.
- 사이클릭 인코딩 효과: 사이클릭 인코딩을 통해 주기적인 특성(예: 월별, 요일별, 시간대별)을 모델에 잘 반영할 수 있었고, 예측 성능이 약 0.3 향상되었습니다. 이는 모델이 시간대나 주기의 영향을 더 잘 학습하게 만들었습니다.
3. 비즈니스 전략 제안
3-1. 신규 요금제 기획
분석을 통해 얻은 방문 패턴, 체류 시간, 방문 요일 등의 특성을 바탕으로 고객 맞춤형 요금제를 제안했습니다. 기존의 단일 요금제를 개선하여 다양한 고객층을 유치하고, 이용률을 극대화할 수 있는 전략을 도출했습니다.
- 주말/평일 전용 요금제: 주말에만 이용할 수 있는 요금제를 통해 재택근무자나 프리랜서 고객을 타겟으로 했습니다.
- 이용 횟수 기반 요금제: 주 3회 또는 5회 방문할 수 있는 요금제로, 유동적인 근무 일정을 가진 고객을 겨냥했습니다.
- 횟수권 요금제: 종일권과 5시간권 등을 제공하여 단기 이용 고객을 유치할 수 있는 유연한 요금제를 제시했습니다.
3-2. 무료 체험 기간 조정
현재 제공되는 3일 무료 체험은 고객의 결제 전환율을 높이는 데 비효율적이었습니다. 분석을 통해 평균 방문 일수가 결제 고객 1.8일, 미결제 고객 1.6일로 대부분 2일 이내에 결제를 결정하는 경향이 있음을 확인했습니다.
- 이를 바탕으로 무료 체험 기간을 2일로 조정하는 것이 비용 절감과 결제 전환율 증대에 더 유효할 것이라 판단했습니다.
4. 결론 및 향후 개선점
이번 프로젝트는 앙상블 모델과 비즈니스 전략을 결합하여 실질적인 결제 전환율 개선을 위한 전략을 도출하는 데 집중했습니다. 데이터 분석과 예측 모델링을 통해 고객 행동을 예측하고, 그에 맞는 맞춤형 요금제를 제안하여 비즈니스 수익성을 개선할 수 있었습니다.
향후 개선점
- 모델 성능 최적화: 하이퍼파라미터 튜닝을 더 정교하게 진행하여, 예측 정확도를 더욱 향상시킬 계획입니다.
- 고객 세분화 데이터 강화: 고객 속성 데이터를 추가로 수집하여, 더 정교한 예측 모델을 구축하고 더욱 맞춤형 전략을 수립할 것입니다.
마무리
이번 프로젝트를 통해 데이터 분석이 실제 비즈니스 의사결정에 어떻게 반영될 수 있는지 경험할 수 있었습니다. 특히 앙상블 모델을 활용한 결제 예측은 결제 전환율을 높이는 데 중요한 역할을 했고, 고객 맞춤형 요금제 기획은 비즈니스 수익성 개선할 법한 경험을 했습니다.
이러한 과정에서 문제 해결 능력과 데이터 기반 의사결정의 중요성을 다시 한 번 실감할 수 있었습니다.
프로젝트 회고
- 잘한 점: 데이터 기반으로 정확한 예측 모델을 구축하고, 고객 맞춤형 전략을 제시할 수 있었던 점이 매우 효과적이었습니다. 사이클릭 인코딩을 통해 시계열 데이터를 잘 반영한 것도 큰 성과였고, 그로 인해 모델 성능이 크게 향상되었습니다.
- 아쉬운 점: 일부 예측 모델의 성능이 기대보다 낮았으며, 하이퍼파라미터 튜닝을 더 정교하게 해야 했다는 점이 아쉽습니다. 데이터 부족 문제도 있었기 때문에, 향후 추가적인 데이터 수집과 개선이 필요합니다.
'프로젝트' 카테고리의 다른 글
🤔 왜 사람들은 이 앱을 떠났을까? | 10대 익명 투표 SNS 데이터 분석 회고 (4) | 2025.06.09 |
---|---|
🏠︎COMPAS LH 공모전 - 지식산업센터 공실률 최소화 (5) | 2025.06.06 |
💻 LLM 시대, 다나와보다 더나와: 컴퓨터 견적 챗봇을 만들기까지 (2024년도의 졸업작품) (2) | 2025.06.01 |
🇵🇹 포르투갈 은행 정기 예금을 가입 예측 및 마케팅 전략 (4) | 2025.05.18 |