Voorwoord
Dit persbericht gaat in wezen over statistiek. Drie termen spelen een rol: p-waarden en statistische significante verschillen versus echte verschillen. Hoe zit dat? Een p-waarde geeft de kans aan dat een gevonden resultaat in een steekproef berust op toeval. Is die p-waarde hoog, meestal groter dan 5% dan is het gevonden verschil niet statistisch significant en wordt de hypothese verworpen.
Er doet zicht een bijzonderheid voor: hoe groter de steekproef hoe kleiner het verschil hoeft te zijn om significant te zijn. In het onderstaande onderzoek was er sprake van een zeer grote steekproef (‘big data’) met statistisch significante verschillen. Kijk je echter nog eens goed naar de data dan blijkt er helemaal geen reëel verschil te zijn.
Voorbeeld: we hebben een steekproef van 1000000 mensen. We verwachten dat daarin evenveel mannen als vrouwen aantreffen. We vinden 499987 mannen en 500013 vrouwen. Dat verschil is wellicht statistisch significant maar nauwelijks reëel: als al die mensen samen gaan demonstreren dan zien we echt geen verschil in het aantal mannen en vrouwen.
Het nieuws
Onderzoekers van het Baylor College of Medicine weerleggen in een artikel in Neuron het verband tussen Herpes en Alzheimer. In dit artikel voorzien de auteurs ook in nieuw statistisch raamwerk voor de analyse van grote hoeveelheden genetische gegevens (sequencing data).
De ziekte van Alzheimer – die het geheugen, de cognitie en de spraak aantast – treft wereldwijd ongeveer 50 miljoen mensen en dit groeit aantal snel. Bij Alzheimer sterven hersencellen (neuronen) massaal af. Hoe dat in zijn werk gaat, is onderwerp van veel studies. Er bestaan geen behandelingen om de voortschrijding van de ziekte te stoppen.
Een studie uit 2018 meldde hoge niveaus van herpesvirussen in de hersenweefsels van net overleden Alzheimerpatiënten – in vergelijking met anderen. Deze studie veroorzaakte grote opwinding die leidde tot het opstarten van een groot aantal nieuwe studies naar de aard van het gevonden verband.
De auteurs namen de dataverzameling van de 2018-studie opnieuw onder de loep. Ze bleken niet in staat op de gevonden resultaten te herhalen. Ze vonden geen verband tussen de hoeveelheid herpes-DNA en -RNA enerzijds en de waarschijnlijkheid van Alzheimer anderzijds.
Waarom zagen de onderzoekers nu geen verband?
De auteurs betogen: Geavanceerde biomedische technieken (genomics, proteomics, metabolomics) worden steeds goedkoper en beter bereikbaar. Die technieken leveren een enorme hoeveelheid gegevens (‘big data’) op. Klassieke statische methoden – zoals het vaststellen van de significantie met behulp van p-waarden – zijn waardevol en nuttig maar voor dit soort onderzoek op zichzelf niet toereikend.
Een van de auteurs zegt: “Hoewel p-waarden een zeer waardevolle statistische parameter zijn, kunnen ze (in dit soort onderzoek) niet worden gebruikt als een op zichzelf staande maat voor statistische correlatie. In onze publicatie zetten we daarom op ‘big data’ toegespitste statische tools en richtlijnen uiteen waarmee je tot statistisch correcte en biologisch zinvolle conclusies kunt komen”.
Vertaling: Dick Schrauwen
Dit nieuwsbericht is een samenvattende bewerking van de Engelse versie:
https://www.bcm.edu/news/alzheimers-disease/herpes-virus-linked-to-alzheimers
Het wetenschappelijke artikel vindt u hier:
https://www.cell.com/neuron/fulltext/S0896-6273(19)30972-9.
Voor genomics, proteomics en metabolomics, zie:
– https://en.wikipedia.org/wiki/Genomics
– https://www.merriam-webster.com/dictionary/proteomics
– https://www.britannica.com/science/metabolomics