베이지안 주기 모델링 설명: 날짜 대신 시그마를 보여 드리는 이유

대부분의 주기 앱은 확신에 찬 날짜를 보여 줍니다. "예정일: 14월." 마치 사실처럼 보이죠. 하지만 이는 확률 분포를 하나의 숫자 뒤에 숨기는 UX 선택일 뿐입니다. 베이지안 주기 모델링도 같은 계산을 하지만, 그 분포의 폭까지 함께 보여 줍니다.

이 글에서는 이 계산이 실제로 어떻게 작동하는지, Soulwise가 확실한 척하는 대신 시그마를 드러내는 이유, 그리고 그것이 일상 UI에서 어떤 모습으로 나타나는지 설명합니다.

여기서 "베이지안"이 실제로 의미하는 것

베이지안 추론은 두 가지를 결합합니다.

  • 사전 확률(prior): 특정 사용자의 데이터를 얻기 전, 주기 길이에 대한 처음의 믿음입니다.
  • 우도(likelihood): 새로 기록된 각 주기가 알려주는 정보입니다.

이 둘을 곱하고 정규화하면 사후 확률(posterior), 즉 갱신된 믿음을 얻게 됩니다. 그 사후 확률은 다음 주기의 사전 확률이 됩니다. 주기가 더 많이 쌓일수록 모델은 더 정밀해집니다.

Soulwise는 평균 mu = 28일을 중심으로 하고 표준편차가 sigma = 5일인 가우시안 사전 확률로 시작합니다. 이는 더 넓은 인구 집단에서 나타나는 주기 길이의 대략적인 형태입니다. 본인의 주기가 기록될수록 모델은 중심을 개인 평균 쪽으로 옮기고, 변동성에 따라 sigma를 좁히거나 넓힙니다.

켤레 업데이트, 한 문단으로

가우시안 사전분포와 가우시안 우도가 만나면 수식이 깔끔하게 정리돼요. 사전분포가 cycle ~ N(mu_0, sigma_0)라고 하고 주기 x_1, x_2, ..., x_n을 관측하면, 사후분포 역시 가우시안이 됩니다:

posterior_mean = (mu_0 / sigma_0^2 + sum(x_i) / sigma_observed^2) / (1 / sigma_0^2 + n / sigma_observed^2)
posterior_sigma = sqrt(1 / (1 / sigma_0^2 + n / sigma_observed^2))

해석하자면, 주기를 많이 기록할수록 사전분포의 영향은 줄어들고 개인 데이터가 더 큰 비중을 차지하게 돼요. 약 3개의 주기를 기록하면 집단 사전분포의 기여는 작아지고, 약 10,개를 넘으면 사실상 잡음 수준이 됩니다.

사용자에게 보이는 것

사후확률은 곡선입니다. UI는 알림 안에서 곡선을 보여줄 수 없어요. 그래서 Soulwise는 이를 두 가지로 압축합니다.

  • 가능성 있는 범위. 사후확률 질량의 대부분이 모이는 구간이에요(예: 중심 68% 구간, 대략 +/- 1 시그마).
  • 신뢰도 라벨. 세 가지 쉬운 표현 중 하나예요.
    • 시그마가 좁고 데이터가 최근일 때는 "가능성 있는 상관관계".
    • 시그마가 넓거나 데이터가 드물 때는 "약한 신호".
    • 모델의 최소 기록 주기 수보다 데이터가 적을 때는 "데이터 부족".

그래서 "생리 예정일: 14,월"이 아니라 "12월 16,일 무렵 가능성, 약한 신호"처럼 보이게 됩니다. 이것은 UX 연출이 아니라 모델의 실제 출력값이에요.

아무것도 숨기지 않는 이유

세 가지입니다.

정직함. 패턴 추적기는 알지 못하는 날짜를 약속할 수 없습니다. 시그마를 드러내는 것이 사용자가 신뢰를 조정할 수 있는 유일한 방법입니다.

안전성. 확신에 찬 듯한 날짜는 임신, 피임, 임상적 결정을 포함해 앱이 뒷받침할 수 없는 일을 그 날짜에 맞춰 계획하도록 부추깁니다. 신뢰도 표시는 "이것은 추정치입니다"라고 말하며, 실제로 그렇습니다.

불규칙한 주기에 대한 견고함. 다낭성난소증후군(PCOS), 폐경 전후기, 피임약 중단 후 주기, 호르몬 요법은 모두 시그마를 넓힙니다. 전통적인 추적기는 크게 빗나가거나 사용자를 조용히 놓아버립니다. 베이지안 추적기는 그저 추정치에 "약한 신호"라는 표시를 붙이고 계속 작동합니다.

이 모델이 하지 않는 것

흔들리지 않도록 명확히 적어 둔 몇 가지 한계입니다.

  • 다음 생리 예정 기간 범위를 넘어서는 특정 주기 이벤트는 추정하지 않습니다.
  • 가족계획 가능 시기를 제시하지 않습니다.
  • 임신이나 피임 용도로 설계되지 않았습니다.
  • 임상적으로 검증되지 않았으며, 생리 지연, 불규칙한 출혈, 지속되는 증상에 대한 임상적 조언을 대체하지 않습니다.

이러한 한계는 모델이 보수적으로 설계되었기 때문이 아닙니다. 모델의 범위가 올바르게 정해졌기 때문입니다. 생리 예측과 가족계획 예측은 서로 다른 데이터가 필요하고 규제 기준도 다른, 별개의 문제입니다.

수학이 일상의 리추얼과 만나는 곳

Soulwise에서는 베이즈 결과가 매일의 체크인에 사용되는 주기 단계 맥락으로 이어져요. 20초짜리 리추얼은 지금 기분이 어떤지 묻고, 그 응답은 주기 단계를 다섯 가지 입력값 중 하나로 활용해요. 시그마가 넓을 때는 응답 카드가 주기 단계에 더 적은 가중치를 둬요. 시그마가 좁을 때는 주기 단계에 더 큰 가중치를 두고요. 수학은 자신이 얼마나 확신하는지를 솔직하게 드러냄으로써 그 가중치를 정당하게 얻어요.

더 간단히 말하면, 진짜 베이즈 추적기는 시그마를 보여줘요. 만약 앱이 자신만만한 날짜 하나만 제시한다면, 내부 모델은 같을지 몰라도 그 표현 방식이 모델이 실제로 아는 것을 감추고 있는 거예요.

자주 묻는 질문

무료 도구 사용해 보기

출생차트를 바탕으로 한 맞춤형 인사이트를 받아보세요

이 글 공유하기