Un esempio di Matematica applicata...
Un contributo da Andrea Palladino, PhD
• 2°
Senior Data scientist at GSK | PhD in Physics |
"๐๐ฐ๐ฏ๐ง๐ณ๐ฐ๐ฏ๐ต๐ข๐ฏ๐ฅ๐ฐ ๐ถ๐ฏ๐ฐ
๐ด๐ต๐ถ๐ฅ๐ช๐ฐ ๐ด๐ถ ๐ญ๐ข๐ณ๐จ๐ข ๐ด๐ค๐ข๐ญ๐ข ๐ฑ๐ณ๐ฐ๐ท๐ฆ๐ฏ๐ช๐ฆ๐ฏ๐ต๐ฆ
๐ฅ๐ข๐ญ๐ญ๐ข ๐๐ช๐ฏ๐ข ๐ฆ ๐ณ๐ฆ๐ฑ๐ฐ๐ณ๐ต ๐ฑ๐ณ๐ฐ๐ท๐ฆ๐ฏ๐ช๐ฆ๐ฏ๐ต๐ช
๐ฅ๐ข๐ญ๐ญ'๐๐ต๐ข๐ญ๐ช๐ข, ๐ต๐ณ๐ฐ๐ท๐ช๐ข๐ฎ๐ฐ ๐ค๐ฉ๐ฆ ๐ช๐ญ ๐ต๐ข๐ด๐ด๐ฐ ๐ฅ๐ช
๐ญ๐ฆ๐ต๐ข๐ญ๐ช๐ตร ๐ฅ๐ฐ๐ท๐ถ๐ต๐ฐ ๐ข๐ญ ๐๐ฐ๐ท๐ช๐ฅ รจ ๐ช๐ฏ๐ง๐ฆ๐ณ๐ช๐ฐ๐ณ๐ฆ ๐ช๐ฏ
๐๐ต๐ข๐ญ๐ช๐ข ๐ฑ๐ฆ๐ณ ๐ต๐ถ๐ต๐ต๐ฆ ๐ญ๐ฆ ๐ง๐ข๐ด๐ค๐ฆ ๐ฅ'๐ฆ๐ตร , ๐ฎ๐ฆ๐ฏ๐ต๐ณ๐ฆ
๐ช๐ญ ๐ต๐ข๐ด๐ด๐ฐ ๐ฅ๐ช ๐ญ๐ฆ๐ต๐ข๐ญ๐ช๐ตร ๐ค๐ฐ๐ฎ๐ฑ๐ญ๐ฆ๐ด๐ด๐ช๐ท๐ฐ
๐ณ๐ช๐ด๐ถ๐ญ๐ต๐ข ๐ด๐ถ๐ฑ๐ฆ๐ณ๐ช๐ฐ๐ณ๐ฆ.
๐๐ฆ๐จ๐ฏ๐ข๐ญ๐ช๐ข๐ฎ๐ฐ ๐ฅ๐ถ๐ฏ๐ฒ๐ถ๐ฆ ๐ญ๐ข ๐ฑ๐ณ๐ฆ๐ด๐ฆ๐ฏ๐ป๐ข ๐ฅ๐ฆ๐ญ ๐ฑ๐ข๐ณ๐ข๐ฅ๐ฐ๐ด๐ด๐ฐ ๐ฅ๐ช ๐๐ช๐ฎ๐ฑ๐ด๐ฐ๐ฏ ๐ฏ๐ฆ๐ช ๐ต๐ข๐ด๐ด๐ช ๐ฅ๐ช ๐ญ๐ฆ๐ต๐ข๐ญ๐ช๐ตร ๐ฅ๐ฆ๐ช ๐ค๐ข๐ด๐ช ๐ฅ๐ช ๐๐๐๐๐-19."
Quindi in Italia il Covid รจ stato meno letale che in Cina, ma ce ne possiamo accorgere solo facendo l'analisi in modo corretto, ossia stratificando per fasce d'etร .
La frase d'apertura del post, riportata nel paper dal titolo
"Simpson's Paradox in COVID-19 Case Fatality Rates: A Mediation Analysis of Age-Related Causal Effects" (link nel 1° commento),
segnalatomi dal mio collega Alessandro Brozzi, rappresenta uno dei migliori esempi riguardanti il "Paradosso di Simpson".
Difatti, nel tasso di letalitร complessivo entra in gioco la distribuzione demografica, che รจ completamente diversa tra Cina (etร media 37 anni) e Italia (etร media 46,2 anni).
Poichรฉ il tasso di letalitร non รจ costante nelle diverse fasce d'etร ma aumenta all'aumentare dell'etร , quando si fanno confronti medi tra popolazioni con distribuzioni demografiche diverse, si cade in pieno nel tranello del paradosso di Simpson, giungendo a conlusioni errate e fuorvianti.
Ovviamente se il tasso di letalitร fosse costante per tutte le fasce d'etร , questo problema non si porrebbe e non ci sarebbe differenza fra confrontare il tasso di letalitร nelle diverse fasce d'etร o il tasso di letalitร complessivo.
๐ Questa pubblicazione ci espone in modo cristallino un concetto che รจ stato ribadito piรน volte durante la pandemia: confrontare i numeri totali di Paesi con distribuzioni demografiche diverse equivale a confrontare ciliegie con avocadi!
๐๐ฆ๐จ๐ฏ๐ข๐ญ๐ช๐ข๐ฎ๐ฐ ๐ฅ๐ถ๐ฏ๐ฒ๐ถ๐ฆ ๐ญ๐ข ๐ฑ๐ณ๐ฆ๐ด๐ฆ๐ฏ๐ป๐ข ๐ฅ๐ฆ๐ญ ๐ฑ๐ข๐ณ๐ข๐ฅ๐ฐ๐ด๐ด๐ฐ ๐ฅ๐ช ๐๐ช๐ฎ๐ฑ๐ด๐ฐ๐ฏ ๐ฏ๐ฆ๐ช ๐ต๐ข๐ด๐ด๐ช ๐ฅ๐ช ๐ญ๐ฆ๐ต๐ข๐ญ๐ช๐ตร ๐ฅ๐ฆ๐ช ๐ค๐ข๐ด๐ช ๐ฅ๐ช ๐๐๐๐๐-19."
Quindi in Italia il Covid รจ stato meno letale che in Cina, ma ce ne possiamo accorgere solo facendo l'analisi in modo corretto, ossia stratificando per fasce d'etร .
La frase d'apertura del post, riportata nel paper dal titolo
"Simpson's Paradox in COVID-19 Case Fatality Rates: A Mediation Analysis of Age-Related Causal Effects" (link nel 1° commento),
segnalatomi dal mio collega Alessandro Brozzi, rappresenta uno dei migliori esempi riguardanti il "Paradosso di Simpson".
Difatti, nel tasso di letalitร complessivo entra in gioco la distribuzione demografica, che รจ completamente diversa tra Cina (etร media 37 anni) e Italia (etร media 46,2 anni).
Poichรฉ il tasso di letalitร non รจ costante nelle diverse fasce d'etร ma aumenta all'aumentare dell'etร , quando si fanno confronti medi tra popolazioni con distribuzioni demografiche diverse, si cade in pieno nel tranello del paradosso di Simpson, giungendo a conlusioni errate e fuorvianti.
Ovviamente se il tasso di letalitร fosse costante per tutte le fasce d'etร , questo problema non si porrebbe e non ci sarebbe differenza fra confrontare il tasso di letalitร nelle diverse fasce d'etร o il tasso di letalitร complessivo.
๐ Questa pubblicazione ci espone in modo cristallino un concetto che รจ stato ribadito piรน volte durante la pandemia: confrontare i numeri totali di Paesi con distribuzioni demografiche diverse equivale a confrontare ciliegie con avocadi!
No comments:
Post a Comment