Bayesiansk cyklusmodellering forklaret: Hvorfor vi viser sigma, ikke en dato

De fleste cyklus-apps viser dig en skråsikker dato. "Menstruation: 14. marts." Det ligner et faktum. Det er et UX-valg, der gemmer en sandsynlighedsfordeling bag et enkelt tal. Bayesiansk cyklusmodellering laver den samme udregning, men viser dig spredningen.

Dette indlæg forklarer, hvordan matematikken egentlig fungerer, hvorfor Soulwise viser sigma i stedet for at lade som om alt er sikkert, og hvordan det ser ud i den daglige brugerflade.

Hvad "bayesiansk" egentlig betyder her

Bayesiansk inferens kombinerer to ting:

  • En prior: din udgangstro om cykluslængde, før du har data fra netop denne bruger.
  • En likelihood: hvad hver nyregistreret cyklus fortæller dig.

Gang dem sammen, normalisér, og du får en posterior: din opdaterede tro. Den posterior bliver til prior for næste cyklus. Modellen bliver skarpere, efterhånden som flere cyklusser kommer til.

Soulwise starter med en gaussisk prior centreret om mu = 28 dage med en standardafvigelse på sigma = 5 dage. Det er den grove form på cykluslængde på tværs af den bredere befolkning. Efterhånden som dine egne cyklusser registreres, flytter modellen centrum mod dit personlige gennemsnit og strammer (eller løsner) sigma ud fra din variation.

Den konjugerede opdatering, i ét afsnit

For en Gaussisk prior og en Gaussisk likelihood falder matematikken pænt på plads. Hvis din prior siger cycle ~ N(mu_0, sigma_0), og du observerer cyklusser x_1, x_2, ..., x_n, er posterioren også Gaussisk:

posterior_mean = (mu_0 / sigma_0^2 + sum(x_i) / sigma_observed^2) / (1 / sigma_0^2 + n / sigma_observed^2)
posterior_sigma = sqrt(1 / (1 / sigma_0^2 + n / sigma_observed^2))

Oversat: jo flere cyklusser du logger, jo mindre betyder prioren, og jo mere dominerer dine personlige data. Efter ~3 loggede cyklusser bidrager populationsprioren kun lidt; efter ~10, er den ren støj.

Hvad brugeren ser

Posterioren er en kurve. UI'et kan ikke vise en kurve i en notifikation. Så Soulwise komprimerer den til to ting:

  • Et sandsynligt interval. Vinduet, hvor posterioren placerer det meste af sin masse (f.eks. det centrale 68%-interval, cirka +/- 1 sigma).
  • En tillidsmærkat. Én af tre mærkater i almindeligt sprog:
    • "Sandsynlig korrelation" når sigma er smal og data er ny.
    • "Svagt signal" når sigma er bred eller data er sparsomme.
    • "Ikke nok data" når der er færre end modellens mindste antal loggede cyklusser til rådighed.

Så i stedet for "Menstruation: 14,. marts" ser brugeren "Sandsynligvis 12.-16,. marts svagt signal." Det er modellens faktiske output, ikke et UX-krummelurer.

Hvorfor vi ikke skjuler noget

Tre grunde.

Ærlighed. En mønstertracker kan ikke love en dato, den ikke kender. At synliggøre sigma er den eneste måde, brugeren kan kalibrere sin tillid på.

Sikkerhed. En dato, der ser sikker ud, får folk til at planlægge ud fra den til ting, appen ikke kan understøtte, herunder undfangelse, prævention og kliniske beslutninger. En sikkerhedsmærkning siger "dette er et skøn", hvilket netop er, hvad det er.

Robusthed over for uregelmæssige cyklusser. PCOS, perimenopause, cyklusser efter p-piller og hormonbehandling gør alle sigma bredere. En traditionel tracker rammer enten helt forkert eller taber stille og roligt brugeren. En bayesiansk tracker mærker bare skønnet som "svagt signal" og arbejder videre.

Hvad modellen ikke er

Et par hårde grænser, skrevet ned så de ikke kan skride:

  • Den vurderer ikke specifikke cyklushændelser ud over datointervallet for næste menstruation.
  • Den giver ikke et vindue til familieplanlægning.
  • Den er ikke designet til brug ved undfangelse eller prævention.
  • Den er ikke klinisk valideret og erstatter ikke klinisk rådgivning ved udeblevne menstruationer, uregelmæssige blødninger eller vedvarende symptomer.

Disse grænser betyder ikke, at modellen er forsigtig. De betyder, at modellen har det rette anvendelsesområde. Estimering af menstruation og estimering af familieplanlægning er forskellige problemer med forskellige databehov og forskellige lovgivningsmæssige krav.

Hvor matematikken møder den daglige rutine

I Soulwise føder det bayesianske output ind i cyklusfase-konteksten, der bruges i det daglige tjek-ind. Den 20 sekunder lange rutine spørger, hvordan du har det; svaret bruger cyklusfasen som ét af fem input. Når sigma er bred, vægter svarkortet cyklusfasen mindre. Når sigma er smal, vægter det cyklusfasen mere. Matematikken gør sig fortjent til sin vægt ved at være ærlig om, hvor sikker den er.

Den korte version: en rigtig bayesiansk tracker viser sigma. Hvis din app viser en enkelt selvsikker dato, er modellen under motorhjelmen måske den samme, men måden at fremstille det på skjuler, hvad den faktisk ved.

Ofte stillede spørgsmål

Prøv vores gratis værktøjer

Få personlige indsigter baseret på dit fødselshoroskop

Del denne artikel