Bayesisk cykelmodellering förklarad: därför visar vi sigma, inte ett datum

De flesta cykelappar visar dig ett självsäkert datum. "Mens: 14 mars." Det ser ut som ett faktum. Men det är ett UX-val som döljer en sannolikhetsfördelning bakom ett enda tal. Bayesisk cykelmodellering gör samma beräkning men visar dig spridningen.

Det här inlägget förklarar hur matematiken faktiskt fungerar, varför Soulwise lyfter fram sigma i stället för att låtsas vara säker, och hur det ser ut i det dagliga gränssnittet.

Vad "Bayesiansk" egentligen betyder här

Bayesiansk inferens kombinerar två saker:

  • En prior: din utgångstro om cykellängd innan du har data från just den här användaren.
  • En likelihood: vad varje nyloggad cykel berättar för dig.

Multiplicera dem, normalisera, så får du en posterior: din uppdaterade tro. Den posteriorn blir prior för nästa cykel. Modellen blir skarpare ju fler cykler som tillkommer.

Soulwise startar med en gaussisk prior centrerad kring mu = 28 dagar med en standardavvikelse på sigma = 5 dagar. Det är den grova formen på cykellängd i den bredare befolkningen. När dina egna cykler loggas flyttar modellen centrum mot ditt personliga medelvärde och drar åt (eller släpper på) sigma utifrån din variation.

Den konjugerade uppdateringen, i ett stycke

För en gaussisk prior och en gaussisk likelihood faller matematiken på plats fint. Om din prior säger cycle ~ N(mu_0, sigma_0) och du observerar cykler x_1, x_2, ..., x_n blir även posteriorn gaussisk:

posterior_mean = (mu_0 / sigma_0^2 + sum(x_i) / sigma_observed^2) / (1 / sigma_0^2 + n / sigma_observed^2)
posterior_sigma = sqrt(1 / (1 / sigma_0^2 + n / sigma_observed^2))

Översättning: ju fler cykler du loggar, desto mindre betyder priorn och desto mer dominerar dina personliga data. Efter ~3 loggade cykler bidrar populationspriorn bara lite; efter ~10, är den brus.

Vad användaren ser

Posteriorn är en kurva. Gränssnittet kan inte visa en kurva i en notis. Därför komprimerar Soulwise den till två saker:

  • Ett sannolikt intervall. Det fönster där posteriorn lägger merparten av sin massa (t.ex. det centrala 68%-intervallet, ungefär +/- 1 sigma).
  • En tillförlitlighetsetikett. En av tre enkla taggar:
    • "Sannolik korrelation" när sigma är snäv och data är färsk.
    • "Svag signal" när sigma är bred eller data är gles.
    • "Otillräckligt med data" när färre än modellens minsta antal loggade cykler finns tillgängliga.

Så i stället för "Mens: 14, mars" ser användaren "Troligen 12–16, mars svag signal." Det är modellens faktiska utdata, inte en gränssnittsfiness.

Varför vi inte döljer något

Tre skäl.

Ärlighet. En mönsterspårare kan inte lova ett datum den inte känner till. Att visa sigma är enda sättet för användaren att kalibrera sin tillit.

Säkerhet. Ett datum som ser säkert ut får folk att planera kring det för sådant som appen inte kan stötta, bland annat befruktning, preventivmedel och kliniska beslut. En konfidensetikett säger "detta är en uppskattning", vilket är precis vad det är.

Robusthet vid oregelbundna cykler. PCOS, perimenopaus, cykler efter p-piller och hormonbehandling vidgar alla sigma. En traditionell spårare missar antingen rejält eller släpper tyst användaren. En Bayesiansk spårare märker bara uppskattningen som "svag signal" och fortsätter fungera.

Vad modellen inte är

Några tydliga gränser, nedskrivna så att de inte kan glida iväg:

  • Den uppskattar inga specifika cykelhändelser utöver nästa mensperiods datumintervall.
  • Den anger inget fönster för familjeplanering.
  • Den är inte utformad för befruktning eller preventivmedel.
  • Den är inte kliniskt validerad och ersätter inte medicinsk rådgivning vid utebliven mens, oregelbundna blödningar eller ihållande symtom.

De här gränserna betyder inte att modellen är försiktig. De betyder att modellen har rätt omfattning. Att uppskatta mens och att uppskatta familjeplanering är olika problem med olika datakrav och olika regulatoriska krav.

Där matematiken möter den dagliga ritualen

I Soulwise matas det Bayesianska resultatet in i cykelfaskontexten som används vid den dagliga incheckningen. Den 20 sekunder långa ritualen frågar hur du mår; svaret använder cykelfasen som en av fem indata. När sigma är brett väger svarskortet cykelfasen lägre. När sigma är smalt väger det cykelfasen högre. Matematiken förtjänar sin tyngd genom att vara ärlig om hur säker den är.

Den kortare versionen: en riktig Bayesiansk spårare lyfter fram sigma. Om din app visar ett enda självsäkert datum kan modellen under huven vara densamma, men inramningen döljer vad den faktiskt vet.

Vanliga frågor

Testa våra gratis verktyg

Få personliga insikter baserat på ditt födelsehoroskop

Dela denna artikel