Du surfar just nu på en begränsad version av umu.se. Vad innebär det här?

Navigerat till

Att skapa mening i komplexa data

De flesta egenskaper hos växter och djur uppstår genom komplexa interaktioner mellan gener, proteiner och metaboliter. Att identifiera och analysera dessa komplexa genetiska egenskaper är mycket utmanande, särskilt när de sekvenserade genomen är fragmenterade. När Bastian Schiffthaler var doktorand i Nathaniel Streets forskargrupp förbättrade han genominformationen från europeisk asp och utvecklade bioinformatiska verktyg som hjälper till att analysera komplexa genetiska egenskaper hos växter.

Publicerad: 2025-11-25 Text: Anne Honsel

Mer om programmet

Masterprogrammet i bioinformatik

Bild på Bastian Schiffthaler stående utomhus, i bakgrunden sjö, skog och snöklädda bergstoppar

Bastian Schiffthaler.

Bild: Alena Aliashkevich

För att sekvensera ett genom klipps DNA vanligtvis i små bitar, sekvensen läses av och sedan sätter bioinformatisk programvara ihop hela sekvensinformationen genom att använda överlappande regioner i dessa små bitar i en iterativ process som helst resulterar i fullängdskromosomer. Hos träd, som ofta har mycket komplexa genom, är de flesta tillgängliga ihopsättningar av genom därför inte särskilt sammanhängande. Bastian Schiffthaler arbetade med att förbättra resultatet för sådana genom med fokus på europeisk asp.

När Bastian Schiffthaler började var genomsekvensen för europeisk asp redan ganska bra jämfört med till exempel gran. Men den var fortfarande fragmenterad, vilket gjorde det svårt att genomföra analyser som är beroende av en mycket kontinuerlig ihopsättning. Exempel på detta är att upptäcka DNA-signaturer som relaterar till egenskaper via genomomfattande associationer eller att studera evolutionär historia genom att titta på storskaliga genomiska omarrangemang.

Överväldigande mängd information

– Vår strategi inkluderade modern långläsningssekvensering, polerad med mycket noggranna kortläsningsdata och kombinerad med en optisk och genetisk karta för att ytterligare länka de initialt monterade delarna till fullt monterade kromosomer. Med nära 20 000 genetiska markörer är den genetiska kartan en av de mest omfattande som skapats för någon organism hittills. Detta var en överväldigande mängd information som de flesta vanliga gratisprogram inte kunde hantera.

Att ordna markörer på en genetisk karta är en klassisk tillämpning av det så kallade handelsresandeproblemet, som syftar till att hitta den kortaste vägen mellan en uppsättning punkter eller platser. Att beräkna den perfekta ordningen för bara sextio markörer skulle kräva fler beräkningar än det finns atomer i universum. Därför bygger all programvara på approximationer – men även dessa var för långsamma för ett dataset av denna storlek. För att lösa detta problem utvecklade Bastian Schiffthaler ”BatchMap”, ett mjukvarupaket som påskyndar beräkningarna som krävs för att hitta ordningen på genetiska markörer med högsta sannolikhet utifrån deras nedärvningsmönster.

Parallella beräkningar

”BatchMap” delar upp beräkningarna i små delar som är lätta att beräkna och kan köras parallellt. Detta minskade beräkningstiden drastiskt och Bastian Schiffthaler kunde skapa en tät karta över genetiska signaturer på europeisk asps kromosomer. Sedan skapandet av BatchMap har det nu använts i andra genomprojekt, såsom montering av granens genom eller jordgubbsgenomet, som omfattar åtta kromosomuppsättningar.

– Vi ville utvärdera vår förbättrade montering i samband med genomomfattande associationsstudier för att leta efter gener som är involverade i salicinoid-metabolismen. Dessa metaboliter finns endast hos arter inom Populus och Salix och hjälper till att skydda växten mot växtätare, förklarar Bastian Schiffthaler. När vi jämförde med tidigare försök som använde den mer fragmenterade monteringen kunde vi se att vår nya genomversion förbättrade analysen av denna komplexa egenskap avsevärt och vi kunde få nya insikter om evolutionen hos olika Populus-arter.

Utvecklade nytt verktyg

Att identifiera gener som styr komplexa egenskaper är mycket utmanande. Bastian Schiffthaler och hans kollegor studerade variationen i bladform hos europeisk asp, en komplex egenskap som är ärvd från föräldrarna, men ändå mycket varierande mellan individer. Resultaten visar att bladformen styrs av ett komplext nätverk av många olika gener, men att enskilda gener ofta har endast en liten påverkan på den slutliga bladformen.

Bastian Schiffthaler anser att för att bättre förstå hur egenskaper som bladform fungerar krävs ett integrerat angreppssätt, där egenskaper analyseras i alla stadier som bidrar till deras uppkomst. Han utvecklade därför ”Seidr”, ett verktyg för att studera interaktioner mellan gener som aktivt omvandlas till protein i en organism. Han hoppas att integrering av Seidr med andra datalager kommer att göra det möjligt för forskare att bättre förutsäga komplexa egenskaper i framtiden.

Bastian Schiffthaler försvarade framgångsrikt sin avhandling vid Umeå universitet i juni 2025.