eISSN: 1689-1716
ISSN: 0324-8267
Archiwum Medycyny Sądowej i Kryminologii/Archives of Forensic Medicine and Criminology
Bieżący numer Archiwum Artykuły zaakceptowane O czasopiśmie Suplementy Rada naukowa Recenzenci Bazy indeksacyjne Prenumerata Kontakt Zasady publikacji prac
SCImago Journal & Country Rank
1/2020
vol. 70
 
Poleć ten artykuł:
Udostępnij:
Wytyczne/zalecenia

Zalecenia Polskojęzycznej Grupy Międzynarodowego Towarzystwa Genetyki Sądowej dotyczące analizy polimorfizmu chromosomu Y dla celów sądowych

Krzysztof Rębała
1
,
Wojciech Branicki
2, 3
,
Ryszard Pawłowski
1
,
Magdalena Spólnicka
3
,
Tomasz Kupiec
4
,
Agnieszka Parys-Proszek
4
,
Marcin Woźniak
5
,
Tomasz Grzybowski
5
,
Michał Boroń
3
,
Maria Wróbel
4
,
Marzanna Ciesielka
6
,
Andrzej Ossowski
7
,
Renata Jacewicz
8

  1. Katedra i Zakład Medycyny Sądowej, Gdański Uniwersytet Medyczny, Polska
  2. Małopolskie Centrum Biotechnologii, Uniwersytet Jagielloński, Kraków, Polska
  3. Centralne Laboratorium Kryminalistyczne Policji, Warszawa, Polska
  4. Pracownia Genetyki Sądowej, Instytut Ekspertyz Sądowych w Krakowie, Polska
  5. Katedra Medycyny Sądowej, Collegium Medium w Bydgoszczy, Uniwersytet Mikołaja Kopernika w Toruniu, Polska
  6. Katedra i Zakład Medycyny Sądowej, Uniwersytet Medyczny w Lublinie, Polska
  7. Zakład Genetyki Sądowej, Pomorski Uniwersytet Medyczny w Szczecinie, Polska
  8. Pracownia Genetyki Medycznej i Sądowej, Uniwersytet Medyczny w Łodzi, Polska
Arch Med Sadowej Kryminol 2020; 70 (1): 1–18
Data publikacji online: 2020/07/02
Plik artykułu:
- zalecenia.pdf  [0.56 MB]
Pobierz cytowanie
 
Metryki PlumX:
 

Wstęp

Nierekombinująca część chromosomu Y (non-recombining Y – NRY) stanowi fragment genomu specyficzny dla płci męskiej, przekazywany z pokolenia na pokolenie bez rekombinacji jako największy haplotyp w ludzkim genomie. Ponieważ NRY obejmuje prawie cały chromosom Y (95%) [1], w większości opracowań dotyczących wykorzystania jego polimorfizmu w genetyce sądowej określa się go po prostu „chromosomem Y” i takie uproszczenie zastosowano również w niniejszych zaleceniach.
Ze względu na swoje unikatowe cechy chromosom Y zajmuje szczególne miejsce w genetyce sądowej [2]. Jego specyficzność dla płci męskiej czyni go preferowanym narzędziem do wykrywania i różnicowania materiału genetycznego pochodzącego od mężczyzn w mieszaninach DNA kobiety i mężczyzny – nawet wówczas, gdy udział męskiej frakcji w badanym materiale biologicznym jest znikomy. Z kolei dziedziczenie chromosomu Y z ojca na syna bez rekombinacji pozwala na jego wykorzystanie w ustalaniu pokrewieństwa w linii męskiej, np. w ustalaniu ojcostwa w sytuacji, gdy materiał od domniemanego ojca jest nieosiągalny i zamiast niego w badaniu uczestniczą jego krewni w linii męskiej.
Wspomniany brak rekombinacji w obrębie chromosomu Y powoduje konieczność analizy wyników badania polimorfizmu markerów zlokalizowanych na tym chromosomie w formie haplotypu i wyklucza możliwość mnożenia przez siebie częstości lub ilorazów wiarygodności dla poszczególnych markerów chromosomu Y w celu szacowania wartości dowodu z badania jego polimorfizmu w genetyce sądowej.

Nazewnictwo markerów i alleli

Wytyczne dotyczące nazewnictwa markerów mikrosatelitarnych (krótkich powtórzeń tandemowych, short tandem repeats – STR) chromosomu Y i ich alleli zostały szczegółowo omówione w rekomendacjach Komisji ds. DNA przy Międzynarodowym Towarzystwie Genetyki Sądowej (DNA Commission of the International Society for Forensic Genetics – ISFG) [3, 4] i uznaje się je za obowiązujące. Polskojęzyczna Grupa Robocza ISFG zaleca jednak dwie zmiany w stosunku do oryginalnych wytycznych. Decyzja o rekomendacji odmiennego od zalecanego przez ISFG sposobu nazywania alleli wynika z powszechności takiego podejścia w narzędziach wykorzystywanych rutynowo w genetyce sądowej do analizy polimorfizmu chromosomu Y, tj. w komercyjnych zestawach do amplifikacji markerów Y-STR, i w referencyjnych bazach haplotypów Y-STR.

Pierwsze zalecenie – zmiana w odniesieniu do dotychczasowych wytycznych

W 2006 r. Komisja ds. DNA przy ISFG określiła locus GATA H4 jako fragment obejmujący dwa blisko położone loci: GATA H4.1 i GATA H4.2. Locus GATA H4.2 nie wykazuje polimorfizmu u ludzi [4] i nie podlega amplifikacji przy użyciu starterów używanych w zestawie AmpFlSTR Yfiler [5], który jest jednym z najpowszechniej wykorzystywanych narzędzi do analizy polimorfizmu Y-STR w laboratoriach genetyczno-sądowych. Przy nazywaniu alleli GATA H4.1 amplifikowanych za pomocą zestawu AmpFlSTR Yfiler Komisja ds. DNA przy ISFG zaleciła zliczanie wszystkich jednostek czteronukleotydowych, zarówno tych wykazujących polimorfizm, jak i tych o stałej sekwencji. Zalecenia te nie zostały jednak wprowadzone do praktyki. Wszystkie komercyjne zestawy do analizy polimorfizmu Y-STR, do których włączono ten marker, a także Referencyjna Baza Danych Haplotypów STR Chromosomu Y (Y-Chromosome STR Haplotype Reference Database – YHRD) wykorzystują uproszczone nazewnictwo alleli oparte na liczbie jednostek repetytywnych (TAGA)n, zaś polimorficzny locus GATA H4.1 określany jest po prostu jako GATA H4.

W celu ujednolicenia nomenklatury w opiniach uwzględniających ten marker zaleca się używanie nazewnictwa powszechnie stosowanego w praktyce, tj. nazwy GATA H4 jako nazwy markera oraz nazw alleli opartych na liczbie jednostek repetytywnych (TAGA)n.

Drugie zalecenie – zmiana w odniesieniu do dotychczasowych wytycznych

W dokumentach opublikowanych w latach 2001 i 2006 Komisja ds. DNA przy ISFG zaleciła stosowanie łącznika w zapisie alleli markerów wielokopijnych. Do zestawów komercyjnych dostępnych na rynku włączone zostały dwa takie markery: DYS385 i DYF387S1. Przy wymienianiu alleli obserwowanych w badanej próbce w opiniach z zakresu genetyki sądowej powszechnie stosowane są przecinki, które wykorzystuje również baza YHRD w przypadku alleli markerów DYS385 i DYF387S1.

W związku z powyższym w przypadku markerów wielokopijnych oraz duplikacji markerów jednokopijnych zaleca się rozdzielanie zaobserwowanych alleli przecinkami, np. DYS385*11,14. Jeśli obserwowany jest tylko jeden allel markera, który zwykle wykazuje więcej niż jeden allel, zaleca się podawanie w opinii tylko jednego, zaobserwowanego allelu zamiast np. jego podwajania (DYS385*11 zamiast DYS385*11,11).

Opracowane przez Komisję ds. DNA przy ISFG rekomendacje z 2001 i 2006 r. dotyczą nomenklatury alleli Y-STR oznaczanych na podstawie obserwowanej długości produktu PCR przy użyciu elektroforezy kapilarnej. Obecnie w genetyce sądowej popularność zyskuje badanie polimorfizmu DNA za pomocą technik sekwencjonowania wysokoprzepustowego (high-throughput sequencing – HTS), zwanego również masowym sekwencjonowaniem równoległym (massively parallel sequencing – MPS) lub sekwencjonowaniem następnej generacji (next-generation sequencing – NGS). Opracowywane są kolejne zestawy, które umożliwiają analizę polimorfizmu STR człowieka, w tym chromosomu Y, pod kątem zastosowań w genetyce sądowej. Technologia HTS zwykle dostarcza zdecydowanie więcej informacji o polimorfizmie DNA w badanym regionie STR w postaci różnic w liczbie i strukturze nieregularnych jednostek repetytywnych czy zmian nukleotydów w samej sekwencji STR i regionach flankujących, co generuje trudności w stworzeniu prostego i uniwersalnego nazewnictwa obserwowanych wariantów genetycznych. W 2016 r. Komisja ds. DNA przy ISFG opublikowała ogólne zalecenie, aby opracowana w przyszłości nomenklatura alleli STR oznaczanych metodą HTS była kompatybilna z obowiązującą od lat nomenklaturą alleli oznaczanych metodą elektroforezy kapilarnej [6]. Do tych zaleceń dołączono sekwencje referencyjne markerów STR chromosomu Y powszechnie wykorzystywanych w genetyce sądowej.
Sekwencjonowanie techniką HTS umożliwia wykazanie w badanym materiale genetycznym obecności dwóch lub więcej alleli izometrycznych, czyli alleli o różnych sekwencjach, które posiadają identyczną długość i identyczną nazwę i które w badaniu polimorfizmu STR z użyciem elektroforezy kapilarnej widoczne są jako jeden allel.

W związku z zaleceniem Komisji ds. DNA przy ISFG, aby nomenklatura alleli STR oznaczanych metodą HTS była kompatybilna z nomenklaturą alleli oznaczanych metodą elektroforezy kapilarnej, w przypadku alleli izometrycznych zaleca się stosowanie w opiniach zapisu tylko z jednym allelem. Jeśli obecność alleli izometrycznych została wykorzystana do porównania profili, analizy statystycznej i opracowania opinii, informacja o ich obecności i wykazanych różnicach w sekwencji powinna zostać umieszczona w nawiasie po nazwie allelu w tabeli z haplotypem Y-STR lub w formie przypisu pod tabelą odnoszącego się do markera, w którym wykazano allele izometryczne.

Populacja referencyjna

Do szacowania wartości dowodu z badania polimorfizmu Y-STR należy posługiwać się bazą YHRD. Z uwagi na fakt, że znaczną część zgromadzonych w niej haplotypów Y-STR stanowią haplotypy rzadko obserwowane, wartość dowodowa dla chromosomu Y zależy w dużym stopniu od wielkości próby populacyjnej. Przykładowo, dla haplotypu Y-STR, który nie został zaobserwowany w bazie YHRD, wartość dowodowa będzie tym większa, im więcej zbadano chromosomów Y z populacji referencyjnej. W celu zwiększenia liczebności prób populacyjnych pod kątem statystycznej oceny wartości dowodu z badań DNA w bazie YHRD stworzono metapopulacje stanowiące grupy populacji wykazujących relatywnie małe odległości genetyczne haplotypów Y-STR. Możliwość analizy statystycznej na podstawie struktury genetycznej haplotypów Y-STR została uwzględniona w rekomendacjach Komisji ds. DNA przy ISFG [4]. W bazie YHRD populację polską zaliczono do metapopulacji wschodnioeuropejskiej wraz z innymi populacjami północnej Słowiańszczyzny, a także Słoweńcami, Litwinami i Łotyszami [7].
Liczne dane sugerują odrębność genetyczną haplotypów Y-STR w populacji polskiej względem innych populacji słowiańskich, a także Litwinów i Łotyszy mówiących językami bałtyckim [8, 9]. Przypuszczalnie wynika ona z istotnych różnic międzypopulacyjnych w występowaniu haplogrup chromosomu Y [10, 11]. Ponadto w ostatnich latach liczebność bazy YHRD znacząco wzrosła, również dla populacji polskiej, co eliminuje konieczność stosowania metapopulacji obejmujących bliskie, ale jednak genetycznie odrębne populacje.

W związku z powyższym zaleca się, aby do opiniowania wyników analizy polimorfizmu Y-STR na podstawie bazy YHRD stosować jako populację referencyjną bazę haplotypów Y-STR z Polski.

Polskojęzyczna Grupa Robocza ISFG zaleca też, by laboratoria genetyczno-sądowe w Polsce regularnie przekazywały haplotypy Y-STR oznaczane w ramach działalności usługowej i badań naukowych do bazy YHRD w celu dalszego zwiększania ich liczebności.
Ponieważ pula haplotypów Y-STR w populacjach z różnych regionów Polski wykazuje homogenność [12], nie ma konieczności stosowania lokalnych baz haplotypów Y-STR w typowych sytuacjach dotyczących mężczyzn z polskiej populacji. W przypadku osób z populacji innych niż polska (np. kiedy pozwany o ojcostwo pochodzi z kraju, w którym matka dziecka przebywała w okresie koncepcyjnym) wskazane byłoby przeprowadzenie dodatkowej analizy statystycznej profilu Y-STR na podstawie bazy haplotypów dla najbliższej populacji w odniesieniu do pochodzenia badanego mężczyzny.

Zakres badań

W bazie YHRD można oszacować wartość dowodową z badania polimorfizmu chromosomu Y, opierając się na różnych zestawach markerów Y-STR. Liczbę haplotypów z populacji polskiej oznaczonych różnymi zestawami markerów Y-STR i zdeponowanych w bazie YHRD przedstawiono w tabeli I.
Większa liczba zbadanych markerów Y-STR wiąże się z większą siłą dyskryminacji, zatem w praktyce korzystne jest stosowanie zestawów o jak największej liczbie markerów. Z tabeli I wynika jednak, że w bazie YHRD znajduje się stosunkowo niewiele haplotypów oznaczonych najnowszymi zestawami do identyfikacji, które umożliwiają jednoczesną analizę ponad 20 markerów Y-STR, tj. zestawami PowerPlex Y23 i AmpFlSTR Yfiler Plus. W związku z tym wartość dowodu z badania polimorfizmu chromosomu Y dla tych zestawów wydaje się dość ograniczona. Z kolei zestaw AmpFlSTR Yfiler o nieco mniejszej liczbie markerów oferuje prawie 5 tysięcy chromosomów Y do porównania w bazie YHRD, co odpowiada prawie 60% wszystkich chromosomów Y z populacji polskiej obecnych w bazie.

Z tego względu zaleca się, aby w opiniach z zakresu genetyki sądowej wykorzystywać standardowy, minimalny zestaw do analizy polimorfizmu Y-STR składający się z 16 markerów amplifikowanych przy użyciu zestawu AmpFlSTR Yfiler, tj. DYS19, DYS385, DYS389I, DYS389II, DYS390, DYS391, DYS392, DYS393, DYS437, DYS438, DYS439, DYS448, DYS456, DYS458, DYS635 i GATA H4.

Do oznaczenia tych 16 markerów służą zestawy oferowane przez różnych producentów, dzięki czemu biegły wykonujący badania nie jest ograniczony do jednego zestawu.
Jeśli analiza polimorfizmu Y-STR opiera się na wynikach sekwencjonowania następnej generacji, dopuszczalne jest opracowywanie ekspertyz z zakresu genetyki sądowej na podstawie 13 markerów Y-STR wchodzących w skład zestawu AmpFlSTR Yfiler, z pominięciem markerów DYS393, DYS456 i DYS458. Nie włączono ich do niektórych zestawów do oznaczania haplotypów Y-STR metodą HTS stosowanych w polskich laboratoriach genetyczno- -sądowych.
Przy porównywaniu uzyskanych profili Y-STR z bazą YHRD wskazane jest przeprowadzenie dodatkowych porównań, opierając się na haplotypach obejmujących mniejszą liczbę markerów, dla których w bazie YHRD dostępnych jest więcej chromosomów Y (tabela I) w celu zwiększenia wartości dowodowej. Wynikiem o największej wartości dowodowej jest ten, który dla danej populacji daje najniższą częstość identycznych haplotypów wśród porównywanych profili. Przy porównywaniu profili Y-STR z bazą danych z pominięciem części markerów zalecane jest jednak wykluczenie z analizy statystycznej pasujących haplotypów z bazy YHRD różniących się w zakresie tych markerów, które zostały pominięte przy przeszukiwaniu bazy danych [13].
Przykład: Oznaczony u badanego mężczyzny haplotyp 16 markerów Y-STR (Yfiler) pojawia się w populacji polskiej w bazie YHRD z częstością obserwowaną 0/4683 haplotypy. Dodatkowe porównanie z bazą YHRD w zakresie 8 markerów Y-STR (haplotyp minimalny) wskazuje, że identyczny profil Y-STR występuje w populacji polskiej z częstością obserwowaną 1/7974 haplotypy. W naszym przykładzie zakładamy, że dla pasującego haplotypu minimalnego z bazy YHRD jest dostępna informacja o allelach markerów spoza haplotypu minimalnego wchodzących w skład zestawu Yfiler. Ponieważ pasujący haplotyp minimalny różni się od haplotypu oznaczonego u badanego mężczyzny w markerach niewchodzących w zakres haplotypu minimalnego, haplotyp ten wykluczamy z analizy statystycznej, odejmując go od liczby obserwacji w danej populacji. Uzyskujemy zatem częstość obserwowaną 0/7974, która ma większą wartość dowodową niż częstość obserwowana uzyskana dla całego zestawu Yfiler.
Obecnie baza YHRD nie pozwala na wgląd w pozostałe allele haplotypów Y-STR, które w przeszukiwanym zakresie są zgodne z analizowanym profilem DNA, dlatego przy ocenie wartości dowodu z badań genetycznych na podstawie bazy YHRD wystarczy oszacowanie częstości haplotypu Y-STR w danej populacji przy użyciu oznaczonego haplotypu oraz haplotypów obejmujących mniejszą liczbę markerów i wybranie wyniku o największej wartości dowodowej.
Jeśli istnieje konieczność rozróżnienia materiału biologicznego pochodzącego od mężczyzn spokrewnionych w linii męskiej na podstawie analizy polimorfizmu chromosomu Y, wskazane jest rozszerzenie badania o szybko mutujące markery Y-STR (rapidly mutating Y-STR – RM Y-STR) [14]. Markery RM Y-STR zostały włączone do najnowszych zestawów do analizy polimorfizmu Y-STR: zestaw PowerPlex Y23 zawiera dwa takie markery (DYS570, DYS576), zaś zestaw AmpFlSTR Yfiler Plus sześć (DYS449, DYS518, DYS570, DYS576, DYS627, DYF387S1). Również do zestawu ForenSeq opartego na technologii HTS włączono cztery markery szybko mutujące (DYS570, DYS576, DYS612, DYF387S1). Mimo wysokiego współczynnika mutacji pełen zestaw 13 opisanych dotąd markerów RM Y-STR daje 19,5% prawdopodobieństwa zaobserwowania różnicy między ojcem a synem; prawdopodobieństwo to rośnie, jeśli badanie dotyczy mężczyzn o mniejszym stopniu pokrewieństwa, np. biologicznych braci. Dla porównania: niezawierający markerów szybko mutujących zestaw AmpFlSTR Yfiler umożliwia rozróżnienie haplotypów Y-STR ojca i syna zaledwie w 4,7% przypadków [15].
Jeśli materiał genetyczny jest silnie zdegradowany, uzyskany np. ze szczątków kostnych, w badaniu polimorfizmu Y-STR możliwe jest zaobserwowanie profilu szczątkowego, a nawet braku jakichkolwiek produktów amplifikacji. W takiej sytuacji informacji o chromosomie Y badanego materiału biologicznego może dostarczyć badanie polimorfizmu pojedynczych nukleotydów (single nucleotide polymorphism – SNP). Obecnie na rynku nie ma gotowych komercyjnych zestawów do analizy polimorfizmu SNP chromosomu Y, dlatego badanie markerów Y-SNP wymaga stosowania metod opracowanych we własnym zakresie lub już opublikowanych i zwalidowanych przez laboratorium. Haplotypy chromosomu Y zdefiniowane przez markery Y-SNP są określane mianem haplogrup i pochodzą od wspólnego przodka. Haplogrupy chromosomu Y wykazują wysoki stopień specyficzności populacyjnej, co może zostać wykorzystane np. w przewidywaniu pochodzenia biogeograficznego sprawcy przestępstwa. W pracach naukowych powszechnie wykorzystuje się dwa rodzaje nomenklatury haplogrup chromosomu Y: hierarchiczną, wykorzystującą naprzemiennie litery i liczby w celu określenia dokładnej lokalizacji w drzewie filogenetycznym ludzkiego chromosomu Y, oraz skróconą, zawierającą informację o głównej haplogrupie (jednej z 21 oznaczanych wielkimi literami Y i A–T) i terminalnej (filogenetycznie najmłodszej) mutacji definiującej daną haplogrupę [16, 17]. Ponieważ nomenklatura hierarchiczna haplogrup chromosomu Y zależy od liczby poznanych dotąd polimorfizmów Y-SNP, która nieustannie się zmienia, obecnie odchodzi się od jej stosowania. Na przykład jedna z częstszych haplogrup w populacji polskiej zgodnie z nomenklaturą hierarchiczną nosiła nazwę E3b w 2002 r. i E1b1b1 w 2008 r., posiada natomiast jedną, niezmienną nazwę skróconą E-M35. Jeśli badanie obejmuje markery definiujące podhaplogrupy oznaczonej haplogrupy, w których nie wykryto alleli zmutowanych, nazwa skrócona jest poszerzana o tę informację. Przykładowo, nazwa R-M17*(xM458) oznacza haplogrupę R-M17, w której nie wykryto allelu zmutowanego w markerze M458, który z kolei definiuje haplogrupę R-M458 stanowiącą podhaplogrupę haplogrupy R-M17.

Zaleca się, aby wynik analizy polimorfizmu Y-SNP w badaniach z zakresu genetyki sądowej był przedstawiany w postaci listy badanych polimorfizmów Y-SNP i oznaczonych alleli oraz haplogrupy nazwanej zgodnie z nomenklaturą skróconą. Jeżeli do analizy statystycznej wyników wykorzystano częstość oznaczonej haplogrupy w danej populacji, należy podać źródło (np. publikację naukową), z którego zaczerpnięto informację o częstości.

Analiza profilu Y-STR pochodzącego od jednej osoby

Przy analizie i interpretacji wyniku analizy polimorfizmu Y-STR pochodzącego od jednej osoby, zwłaszcza w celu wykluczenia mieszaniny, należy wziąć pod uwagę następujące zjawiska:
1. Większość markerów Y-STR posiada jeden allel (tzw. markery jednokopijne). Istnieje jednak liczna grupa markerów, których startery amplifikują zwykle więcej niż jeden locus chromosomu Y (tzw. markery wielokopijne). Jednym z nich jest DYS385 wchodzący w skład najczęściej wykorzystywanych w praktyce zestawów do analizy polimorfizmu Y-STR, który posiada zwykle dwa allele. Innym przykładem jest DYF387S1 wchodzący w skład zestawów AmpFlSTR Yfiler Plus i ForenSeq, który również wykazuje zwykle dwa allele, choć w jego przypadku stosunkowo często obserwuje się trzy, a niekiedy nawet cztery allele [18].
Wystąpienie tylko jednego allelu DYS385 lub DYF387S1 często interpretowane jest jako obecność dwóch identycznych alleli i taki podwojony zapis (np. DYS385*11,11) jest wykorzystywany w bazie YHRD. Ponieważ przyczyna wystąpienia tylko jednego allelu w przypadku markerów wielokopijnych (dwa identyczne allele lub brak amplifikacji jednego locus, np. na skutek delecji) często jest nieznana, zaleca się stosowanie w opiniach zapisu tylko z jednym allelem (np. DYS385*11). Komisja ds. DNA przy ISFG zaleca, aby nomenklatura alleli STR oznaczanych metodą HTS była kompatybilna z nomenklaturą alleli oznaczanych metodą elektroforezy kapilarnej, zapis z jednym allelem powinien być stosowany również w przypadku wystąpienia alleli izometrycznych i dodatkowo uzupełniony o informację o ich obecności i wykazanych różnicach w sekwencji (w nawiasie po nazwie allelu w tabeli z haplotypem Y-STR lub w formie przypisu pod tabelą odnoszącego się do markera, w którym wykazano allele izometryczne), jeśli obecność alleli izometrycznych została wykorzystana do porównania profili, analizy statystycznej i opracowania opinii.
2. W przypadku niektórych markerów jednokopijnych obserwuje się duplikacje lub nawet triplikacje. Większość duplikacji stanowią allele różniące się jedną jednostką repetytywną (83% w amerykańskiej bazie haplotypów Y-STR) [13].
3. Niektóre duplikacje mogą dotyczyć większych fragmentów chromosomu Y, co przejawia się w postaci duplikacji markerów jednokopijnych zlokalizowanych blisko siebie na chromosomie.
4. Delecja fragmentu chrosomomu Y skutkuje brakiem amplifikacji danego markera i jest określana jako allel zerowy. Mutacja w miejscu przyłączania startera także może prowadzić do wystąpienia allelu zerowego. Taki allel powinien być potwierdzony przez drugą niezależną amplifikację. Jednocześnie należy wykluczyć jako możliwą przyczynę braku amplifikacji wypadnięcie locus (locus dropout) z powodu zbyt małej ilości DNA użytej do reakcji, jego degradacji lub obecności inhibitorów.
5. Niektóre delecje mogą dotyczyć większych fragmentów chromosomu Y, co ujawnia się jako brak amplifikacji markerów zlokalizowanych blisko siebie na chromosomie.
Próg stochastyczny nie ma zastosowania w przypadku jednokopijnych markerów Y-STR. Duplikacje są bardzo rzadkie, w związku z tym niewykrycie drugiego allelu w przypadku duplikacji nie wpływa istotnie na wynik analizy statystycznej [13]. Dla wielokopijnych markerów Y-STR należy wyznaczyć próg stochastyczny identycznie jak dla heterozygot w przypadku markerów autosomalnych.

Analiza mieszanych profili Y-STR

Osoby o fenotypie kobiety mogą wykazywać obecność pełnego lub częściowego profilu Y-STR np. na skutek translokacji, wrodzonych zaburzeń rozwoju płci lub operacji zmiany płci. Genetyczno-sądowe badanie polimorfizmu długości fragmentu genu amelogeniny u zdrowych mężczyzn z delecją tego genu na chromosomie Y dostarcza wyniku, który wskazuje na płeć żeńską. Na 37454 mężczyzn, których profile zgromadzone są w krajowej bazie danych DNA, delecja genu amelogeniny na chromosomie Y pojawiła się 9 razy, zatem występuje ona u mężczyzn w Polsce z częstością około 0,024%. Z tego względu polimorfizm Y-STR należy oznaczyć w materiale porównawczym pobranym od wszystkich osób, od których może pochodzić DNA zawarty w mieszaninie, w której wykryto allele Y-STR, niezależnie od płci fenotypowej lub genetycznej badanych osób.
Próbkę DNA uznaje się za pochodzącą od więcej niż jednego mężczyzny, jeśli zaobserwowano dwa lub więcej alleli w przypadku dwóch lub więcej markerów jednokopijnych [13]. Przy takiej interpretacji należy wziąć pod uwagę możliwość duplikacji większego fragmentu chromosomu Y, obejmującego markery zlokalizowane blisko siebie na chromosomie. Dodatkowo za obecnością mieszaniny może przemawiać obecność alleli znacznie różniących się liczbą jednostek repetytywnych (większość duplikacji ujawnia się jako allele różniące się tylko jedną jednostką repetytywną).
Haplotyp Y-STR pochodzący od jednej osoby może być odtworzony przy analizie mieszaniny DNA jako wyraźnie odznaczający się wysokością pików profil większościowy (ewentualnie również mniejszościowy) lub w przypadku próbek intymnych, w których wykryto mieszaninę o zbliżonej wysokości pików, poprzez wykluczenie z profilu mieszanego alleli pochodzących od wytypowanej osoby w sytuacji, gdy zakłada się obecność jej DNA w mieszaninie (np. alleli ofiary). Takie odtworzone haplotypy Y-STR pochodzące z jednego źródła (od jednego dawcy) mogą być użyte do celów porównawczych.
Mieszaniny alleli Y-STR, w których nie da się wyróżnić pojedynczych profili, mogą być bezpośrednio użyte do wykluczenia obecności w mieszaninie DNA osoby, od której badany jest materiał porównawczy, jeśli allele tej osoby nie są obecne w mieszaninie. Obliczenie ilorazu wiarygodności (likelihood ratio – LR) dla obecności chromosomu Y wskazanej osoby w takiej mieszaninie jest możliwe np. przy użyciu narzędzia „Y-STR Mixture Calculation”, dostępnego na stronie internetowej YHRD.

Analiza statystyczna

Jeśli pełny lub częściowy profil Y-STR pochodzący od jednej osoby, który zaobserwowano w badanym materiale biologicznym jako profil bez cech mieszaniny lub dający się wyodrębnić składnik mieszaniny, jest zgodny z profilem Y-STR materiału porównawczego, należy oszacować częstość obserwowaną i częstość oczekiwaną (prawdopodobieństwo zaobserwowania profilu Y-STR) w populacji na podstawie danych z odpowiedniej bazy populacyjnej.
Częstość obserwowana wyrażona jest wzorem n/N, gdzie n oznacza liczbę obserwacji w danej populacji, zaś N oznacza liczbę zbadanych haplotypów z danej populacji zdeponowanych w bazie YHRD. Wynika z tego, że jeśli badanego haplotypu Y-STR nie zaobserwowano ani razu w bazie danych, częstość obserwowana przyjmuje wartość 0.
Aktualnie baza YHRD umożliwia oszacowanie częstości oczekiwanej z użyciem 3 różnych metod:
• jako częstość powiększoną (augmented frequency), która odpowiada częstości obserwowanej po dodaniu do bazy danych zaobserwowanego haplotypu i wyrażona jest wzorem (n + 1)/(N + 1), gdzie liczba 1 odpowiada badanemu haplotypowi (dzięki uwzględnieniu we wzorze badanego haplotypu częstość powiększona nigdy nie przyjmuje wartości 0),
• na podstawie metody kappa, która uwzględnia udział unikatowych haplotypów (zaobserwowanych tylko jeden raz) w próbce populacyjnej [19],
• na podstawie metody DL (discrete Laplace – dyskretny model Laplace’a), która uwzględnia rozkład alleli w populacji.
Najważniejszym ograniczeniem stosowania częstości powiększonej do opiniowania wyników analizy polimorfizmu Y-STR jest bezpośrednia zależność wartości dowodu z badania chromosomu Y od wielkości bazy danych. Problem ten omijają metody kappa i DL, które poddają analizie użytą bazę danych i na podstawie występowania pojedynczych haplotypów lub rozkładu alleli w populacji szacują częstość oczekiwaną badanego haplotypu Y-STR. Mimo że metoda DL została niedawno zarekomendowana do badań genetyczno-sądowych w Niemczech [20, 21], ma ona kilka istotnych ograniczeń, które uniemożliwiają jej uniwersalne wykorzystanie w praktyce. W bazie YHRD jest ona dostępna tylko dla dwóch wybranych zestawów markerów Y-STR (haplotyp minimalny i zestaw AmpFlSTR Yfiler) wyłącznie na poziomie metapopulacji. Ponadto nie jest możliwe jej użycie w przypadku częściowych profili DNA, w których brakuje informacji choćby dla jednego markera, a także w przypadku haplotypów Y-STR oznaczanych przy użyciu zestawu ForenSeq, który nie obejmuje trzech markerów z zestawu AmpFlSTR Yfiler, w tym jednego markera z haplotypu minimalnego (DYS393). Nie jest również możliwe bezpośrednie oszacowanie częstości oczekiwanej metodą DL w populacji polskiej. Natomiast poprawność założeń metody kappa w szacowaniu prawdopodobieństwa wystąpienia haplotypu chromosomu Y potwierdzają najnowsze analizy [22].

Polskojęzyczna Grupa Robocza ISFG zaleca stosowanie w ekspertyzach z zakresu genetyki sądowej metody kappa do szacowania prawdopodobieństwa zaobserwowania profilu Y-STR w populacji i odpowiadającego mu ilorazu wiarygodności.

W przypadku zgodności między profilem Y-STR wykrytym w materiale dowodowym a profilem Y-STR z materiału porównawczego iloraz wiarygodności LR oblicza się jako stosunek prawdopodobieństwa zaobserwowania identycznych profili – przy założeniu, że pochodzą z jednego źródła (przyjmuje wartość 1) – do prawdopodobieństwa, że zaobserwowany w materiale dowodowym profil pochodzi od innej osoby z danej populacji, niespokrewnionej z mężczyzną, od którego pobrano materiał porównawczy, zaś zgodność profili jest jedynie dziełem przypadku (równego częstości oczekiwanej haplotypu Y-STR). Wartość LR stanowi zatem odwrotność częstości oczekiwanej. Jeśli w badaniach uzyskano profil częściowy, który pasuje do profilu z materiału porównawczego, analiza statystyczna powinna dotyczyć wyłącznie profilu obejmującego markery Y-STR o oznaczonych allelach. Pojedyncza różnica wyklucza pochodzenie profili Y-STR od jednego mężczyzny.
W ustalaniu pokrewieństwa w linii męskiej w przypadku identycznych haplotypów Y-STR iloraz wiarygodności LR oblicza się jako stosunek prawdopodobieństwa zaobserwowania identycznych profili przy założeniu, że np. badane dziecko jest synem badanego mężczyzny (zakłada się wartość 1, która pomija rzadkie zjawisko mutacji), do prawdopodobieństwa, że np. chromosom Y dziecka pochodzi od innego, niespokrewnionego mężczyzny z danej populacji (równego częstości oczekiwanej haplotypu Y-STR). Postępowanie przy obliczaniu LR w takiej sytuacji wygląda zatem identycznie jak w przypadku zgodności profili Y-STR między materiałem dowodowym a materiałem porównawczym: iloraz wiarygodności LR stanowi odwrotność częstości oczekiwanej.
W przypadku zaobserwowania różnic między haplotypami Y-STR w badaniu pokrewieństwa należy w liczniku (wyrażającym prawdopodobieństwo, że np. haplotyp dziecka pochodzi od badanego mężczyzny) uwzględnić współczynnik mutacji (mutation rate – μ) [23]. Współczynniki mutacji markerów Y-STR obliczone na podstawie danych z wielu badań dostępne są w internetowej bazie YHRD. W najprostszym przypadku pojedynczej mutacji jednokrokowej zaobserwowanej u domniemanego syna, licznik we wzorze na LR (prawdopodobieństwo przekazania synowi haplotypu z zaobserwowaną mutacją) zamiast wartości 1 przyjmuje postać μ · ½, gdzie liczba ½ odpowiada udziałowi skróceń lub wydłużeń alleli STR wśród obserwowanych mutacji (badania pokazują, że skrócenia i wydłużenia występują równie często i stanowią po połowie obserwowanych mutacji markerów STR). Przy wystąpieniu dwóch mutacji jednokrokowych licznik we wzorze na LR ulega odpowiedniej modyfikacji i przyjmuje postać μ1 · ½ · μ2 · ½, gdzie μ1 i μ2 oznaczają współczynniki mutacji zmutowanych markerów Y-STR.
W przypadkach dalszego pokrewieństwa w linii męskiej prawdopodobieństwo pojawienia się mutacji markera Y-STR rośnie proporcjonalnie do liczby transmisji chromosomu Y. Jeśli w badaniu uczestniczy dwóch domniemanych braci lub domniemany dziadek i domniemany wnuk, licznik we wzorze na LR należy pomnożyć przez 2 (badanych mężczyzn dzielą dwie transmisje chromosomu Y), jeśli zaś np. badany jest domniemany stryj i domniemany bratanek, należy licznik pomnożyć przez 3.
Ponieważ mutacje wielokrokowe alleli STR obserwowane są znacznie rzadziej niż mutacje jednokrokowe, w przypadku zaobserwowania mutacji dwukrokowej należy licznik we wzorze na LR zmniejszyć proporcjonalnie do częstości mutacji wielokrokowych wśród wszystkich zaobserwowanych mutacji. Prowadzone dotąd badania częstości mutacji Y-STR obejmowały stosunkowo mało par ojciec–syn, aby móc wiarygodnie ocenić częstość tak rzadkiego zjawiska jak mutacja wielokrokowa allelu STR. Dostępne są natomiast wyniki szeroko zakrojonych badań mutacyjności markerów STR zlokalizowanych na autosomach. Badanie, które objęło 1587 mutacji mikrosatelitów autosomalnych, wykazało, że mutacje wielokrokowe pojawiają się 33 razy rzadziej niż mutacje jednokrokowe [24]. Ponieważ nie ma jakichkolwiek podstaw do założenia różnic w mechanizmie mutacji markerów STR autosomów i chromosomu Y, obserwacje poczynione dla markerów autosomalnych można bezpośrednio przenieść na markery Y-STR, mnożąc licznik we wzorze na LR przez ¹⁄33, jeśli wyniki analizy polimorfizmu Y-STR sugerują mutację dwukrokową.
Obliczenie ilorazu wiarygodności LR w ustalaniu pokrewieństwa w linii męskiej na podstawie profili Y-STR jest możliwe przy użyciu narzędzia „Y-STR Kinship-Index Calculation” dostępnego przez internetową bazę danych YHRD. Program ten umożliwia obliczenie wartości LR w ustalaniu pokrewieństwa na podstawie częstości haplotypów Y-STR w metapopulacjach i uwzględnia jedynie mutacje jednokrokowe.
Częstości profilu i wartości LR dla haplotypu Y-STR mnoży się przez odpowiednie wartości uzyskane dla markerów zlokalizowanych na innych chromosomach i dla mitochondrialnego DNA – zarówno w analizie śladów biologicznych pod kątem pochodzenia zawartego w nich DNA od wytypowanej osoby, jak i w badaniu pokrewieństwa [13].

Autorzy deklarują brak konfliktu interesów.

Introduction

The non-recombining part of the Y chromosome (non-recombining Y – NRY) is a male-specific region of the genome passed along from generation to generation without recombination as the largest haplotype in the human genome. Since the NRY spans almost the entire Y chromosome (95%) [1], most studies on the application of the NRY polymorphism in forensic genetics refer to this fragment of the Y chromosome simply as the Y chromosome. This generalisation will also be used in the present recommendations.
Based on its unique features, the Y chromosome has found a special place in forensic genetics [2]. On account of its male specificity, it is the preferred tool for the detection and differentiation of genetic material originating from men in male and female DNA mixtures, even if the proportion of the male DNA fraction in the studied biological material is negligible. In addition, since the Y chromosome is passed from father to son without recombination, it can be used for determining kinship in the male line, for example for establishing paternity in situations when genetic material from the alleged father is unavailable and hence his relatives in the male line participate in paternity testing.
Because of the absence of recombination within the Y chromosome, it is necessary to analyse the results of studies evaluating the polymorphism of markers located on this chromosome in the form of a haplotype, and there is no possibility to multiply the frequencies or likelihood ratios for individual Y chromosome markers in order to estimate the value of evidence based on the study of the polymorphism of this chromosome in forensic genetics.

Nomenclature of markers and alleles

Guidelines for the nomenclature of microsatellite markers (short tandem repeats – STR) of the Y chromosome and their alleles have been described in detail in the recommendations prepared by the DNA Commission of the International Society for Forensic Genetics [3, 4], and widely recognised. However, the Polish Speaking Working Group of the ISFG proposes two changes to the recommendations issued by the ISFG DNA Commission. The decision to recommend a different method of naming alleles to that proposed by the ISFG stems from the widespread use of this approach in tools routinely employed in forensic genetics to analyse the Y chromosome polymorphism, i.e. in commercial kits for the amplification of Y-STR markers and in reference databases of Y-STR haplotypes.

First recommendation – change to existing guidelines

In 2006, the ISFG DNA Commission defined the locus GATA H4 as a fragment comprising two closely located loci: GATA H4.1 and GATA H4.2. GATA H4.2 is a locus that does not exhibit polymorphism in humans [4], and is not amplified using primers contained in the AmpFlSTR Yfiler kit [5], which has become one of the most widely used tools for the analysis of Y-STR polymorphism in forensic genetic laboratories. In the naming of GATA H4.1 alleles amplified using the AmpFlSTR Yfiler kit the ISFG DNA Commission recommended counting all four-nucleotide units, both those exhibiting polymorphism and those with a constant sequence. However, these recommendations have not been incorporated into practice. All commercially available kits for the analysis of Y-STR polymorphism containing this marker, as well as the Y-Chromosome STR Haplotype Reference Database (YHRD), make use of the simplified allele nomenclature based on the number of repeat units (TAGA)n, whereas the polymorphic locus GATA H4.1 is simply referred to as GATA H4.

Therefore, in order to harmonise the nomenclature, it is recommended that forensic opinions including this marker employ the nomenclature which is commonly used in practice, i.e. GATA H4 as the name of the marker and allele names based on the number of repeat units (TAGA)n.

Second recommendation – change to existing guidelines

In documents published in 2001 and 2006, the ISFG DNA Commission recommended using a hyphen in the notation of alleles of multi-copy markers. Commercial kits available on the market incorporate two such markers: DYS385 and DYF387S1. When listing alleles observed in the test sample in forensic genetic expert opinions, commas are widely used. This system is also employed in the YHRD for the alleles of the markers DYS385 and DYF387S1.

Therefore, in the case of multi-copy markers, as well as duplication of single-copy markers, it is recommended that the observed alleles are separated by commas, e.g. DYS385*11,14. If only one allele is observed of the marker which typically shows more than one allele, it is recommended that only the single observed allele is specified in expert opinions instead of, for example, the double notation (DYS385*11 instead of DYS385*11,11).

The 2001 and 2006 recommendations developed by the ISFG DNA Commission relate to the nomenclature of the Y-STR alleles determined on the basis of the observed length of the PCR product using the method of capillary electrophoresis. At present, DNA polymorphism is increasingly commonly investigated in forensic genetics using the techniques of high-throughput sequencing (HTS), also referred to as massively parallel sequencing (MPS) or next-generation sequencing (NGS). Also, further kits are developed to enable the analysis of human STR polymorphism, including the Y chromosome, specifically for applications in forensic genetics. HTS is a technology which normally provides far more information about DNA polymorphism in the studied STR region in the form of differences in the number and structure of irregular repeat units or nucleotide changes in the STR sequence itself and in the flanking regions, which leads to difficulties in the development of simple and universal nomenclature for the observed genetic variants. In 2016, the ISFG DNA Commission published the general recommendation that the future nomenclature for STR alleles determined by the HTS method should be compatible with the nomenclature for alleles determined by capillary electrophoresis which has been in use for years [6]. The recommendations were accompanied by reference sequences of the STR markers of the Y chromosome widely applied in forensic genetics.
HTS sequencing provides an opportunity to examine genetic material for the presence of two or more isometric alleles, i.e. alleles with different sequences which have identical lengths and an identical name, and are visible as a single allele in the analysis of STR polymorphism based on the technique of capillary electrophoresis.

In relation to the recommendation issued by the ISFG DNA Commission that the nomenclature of STR alleles evaluated by HTS should be consistent with the nomenclature of alleles determined by capillary electrophoresis, a notation with just one allele is recommended for isometric alleles in the preparation of forensic opinions. If the presence of isometric alleles is used for the comparison of profiles, statistical analysis and preparation of expert opinions, information on their presence and differences identified in the sequence should be placed in parentheses after the allele name in the table with the Y-STR haplotype or as a footnote under the table, referring to the marker in which the isometric alleles are detected.

Reference population

The value of evidence obtained by examining the Y-STR polymorphism should be estimated by referring to the YHRD. Due to the fact that a significant proportion of the Y-STR haplotypes deposited in the YHRD is constituted by rarely observed haplotypes, the evidential value for the Y chromosome depends to a large extent on the size of the population sample. For example, for a Y-STR haplotype which has not been observed even once in the YHRD, the evidential value will be greater proportionally to the growing number of examined Y chromosomes from the reference population. In order to increase the size of population samples for the statistical assessment of the value of evidence from DNA testing, a number of metapopulations were established in the YHRD, representing groups of populations characterised by relatively small genetic distances of the Y-STR haplotypes. The possibility of statistical analysis based on the genetic structure of Y-STR haplotypes has been included in the recommendations of the ISFG DNA Commission [4]. In the YHRD, the Polish population has been classified among the Eastern European metapopulations along with other northern Slavic populations as well as the Slovenes, Lithuanians and Latvians [7].
However, multiple data indicate genetic distinctiveness of the Y-STR haplotypes in the Polish population compared to other Slavic populations, as well as Lithuanians and Latvians speaking Baltic languages [8, 9], which probably arises from significant interpopulation differences in the occurrence of the Y chromosome haplogroups [10, 11]. In addition, the size of the YHRD has increased significantly in recent years, also for the Polish population, which eliminates the need to rely on metapopulations comprising close but nevertheless genetically distinct populations.

Therefore, it is recommended that a database of the Polish Y-STR haplotypes is employed as a reference population in the preparation of forensic opinions incorporating the results of Y-STR polymorphism analysis based on the YHRD.
At the same time, the Polish Speaking Working Group of the ISFG recommends that forensic genetic laboratories in Poland should regularly transfer Y-STR haplotypes from the Polish population (determined as part of their research projects and commercial services) to the YHRD in order to further increase the number of Y chromosome haplotypes occurring in Poland.
Since the pool of Y-STR haplotypes in populations living in different regions of Poland is homogeneous [12], there is no need to use local Y-STR haplotype databases in typical situations involving male representatives of the Polish population. In situations involving men from populations other than Polish (e.g. when the defendant in a paternity case comes from a country in which the child’s mother stayed during the period of conception), it might be advisable to conduct an additional statistical analysis of the Y-STR profile based on the database of haplotypes for the nearest population in relation to the origin of the man whose paternity is to be adjudicated.

Scope of analysis

Using the YHRD, it is possible to estimate the evidential value of the analysis of the Y chromosome polymorphism based on various sets of the Y-STR markers. The number of haplotypes in the Polish population determined with different sets of Y-STR markers and included in the YHRD is shown in Table I.
The greater the number of examined Y-STR markers, the higher the power of discrimination, so in practice it appears beneficial to use kits with the largest possible number of markers. However, as the Table I shows, the YHRD contains relatively few haplotypes analysed by the latest identification kits supporting simultaneous analysis of more than 20 Y-STR markers (i.e. PowerPlex Y23 and AmpFlSTR Yfiler Plus kits). Consequently, the value of evidence based on the examination of Y chromosome polymorphism using these kits appears to be fairly limited. In contrast, the AmpFlSTR Yfiler kit containing a slightly smaller number of markers provides – for the purpose of comparison with the YHRD – a total of nearly 5,000 Y chromosomes, which accounts for close to 60% of all Y chromosomes from the Polish population deposited in the database.

For this reason, 16 markers amplified with the AmpFlSTR Yfiler kit, i.e. DYS19, DYS385, DYS389I, DYS389II, DYS390, DYS391, DYS392, DYS393, DYS437, DYS438, DYS439, DYS448, DYS456, DYS458, DYS635 and GATA H4, are recommended as the standard minimum set for the analysis of Y-STR polymorphism used in forensic genetic opinions.

The set of 16 markers can be determined using kits offered by a variety of manufacturers, so that an expert conducting the examination is not limited to one kit.
If the analysis of Y-STR polymorphism is based on the results of next generation sequencing, it is an acceptable procedure to prepare forensic genetic opinions on the basis of 13 Y-STR markers included in the AmpFlSTR Yfiler kit, without the markers DYS393, DYS456 and DYS458. These markers have not been incorporated into some of the kits used for the determination of Y-STR haplotypes based on the HTS method which are used in forensic genetic laboratories in Poland.
When comparing the derived Y-STR profiles with the YHRD, in order to improve the evidential value, the advised procedure is to conduct additional comparisons based on haplotypes consisting of a smaller number of markers, for which more Y chromosomes are available in the YHRD (Table I). The result with the highest evidential value is the one which – for a given population – gives the lowest frequency of identical haplotypes among the compared profiles. However, when comparing Y-STR profiles with the database with the omission of some markers, it is recommended that the statistical analysis excludes from the YHRD matching haplotypes that differ with respect to the markers that were omitted when searching the database [13].
Example: The haplotype of 16 Y-STR markers (Yfiler) determined in a man undergoing genetic tests occurs in the Polish population in the YHRD with the observed frequency of 0/4683 haplotypes. An additional comparison with the YHRD performed for 8 Y-STR markers (minimal haplotype) shows that an identical Y-STR profile occurs in the Polish population with the observed frequency of 1/7974 haplotypes. In this example, it is assumed that for a matching minimal haplotype from the YHRD, information is available about allele markers outside the minimal haplotype which are included in the Yfiler kit. Since the matching minimal haplotype is different from the haplotype determined in the man under study in the markers outside the range of the minimal haplotype, this haplotype is removed from statistical analysis by subtracting it from the number of observations in a given population. The resulting observed frequency is 0/7974, which demonstrates a higher evidential value than the observed frequency obtained for the entire Yfiler kit.
Since the YHRD currently does not provide insight into the other alleles of the Y-STR haplotypes, which in the evaluated range are consistent with the analysed DNA profile, when assessing the value of evidence obtained from genetic testing based on the YHRD, it suffices to estimate the frequency of the Y-STR haplotype in a particular population using the determined haplotype and haplotypes comprising fewer markers, and selecting the result with the highest evidential value for the preparation of a forensic opinion.
If there is a need to differentiate biological material obtained from males related in the male line by analysing Y chromosome polymorphism, it is advisable to extend the analysis to include rapidly mutating Y-STR markers (RM Y-STR) [14]. RM Y-STR markers have been incorporated into the latest Y-STR polymorphism analysis kits: PowerPlex Y23 contains two such markers (DYS570, DYS576), while AmpFlSTR Yfiler Plus has six such markers (DYS449, DYS518, DYS570, DYS576, DYS627, DYF387S1). Four rapidly mutating markers (DYS570, DYS576, DYS612, DYF387S1) have also been added to the ForenSeq kit based on the HTS technology. Despite a high mutation rate, the complete set of 13 RM Y-STR markers described to date offers 19.5% probability of identifying a difference between father and son; the level of probability increases in men with a lower degree of kinship, e.g. biological brothers. For comparison, the AmpFlSTR Yfiler kit (not containing any rapidly mutating markers) makes it possible to differentiate the Y-STR haplotypes of father and son in just 4.7% of cases [15].
If the genetic material is highly degraded, for example derived from bone remains, the analysis of Y-STR polymorphism may reveal a residual profile or even the absence of any amplification products. If this is the case, information about the Y chromosome of the biological material under study can be obtained by analysing single nucleotide polymorphism (SNP). As there are currently no ready-made commercial kits for analysing the Y chromosome SNP, in practice the determination of Y-SNP markers requires the application of in-house or published methods validated by the testing laboratory. Haplotypes of the Y chromosome defined by Y-SNP markers are referred to as haplogroups, and they come from a common ancestor. Haplogroups of the Y chromosome show a high degree of population specificity. This feature can be used, for example, for predicting the biogeographical origin of crime perpetrators. Two types of nomenclature are commonly used in scientific papers to describe the haplogroups of the Y chromosome: hierarchical, using alternating letters and numbers to determine the exact location in the phylogenetic tree of the human Y chromosome; and abbreviated, containing information about the main haplogroup (one of 21, denoted with the capital letters Y and A–T) and the terminal (phylogenetically the youngest) mutation defining a given haplogroup [16, 17]. Since the hierarchical nomenclature of haplogroups of the Y chromosome depends on the number of known Y-SNP polymorphisms, which constantly changes, it is used less and less frequently. For example, one of the more prevalent haplogroups in the Polish population was called E3b in 2002, and E1b1b1 in 2008, according to the hierarchical nomenclature, while it invariably has the same abbreviated name E-M35. If a study involves markers defining the sub-haplogroups of the analysed haplogroup in which no mutated alleles were detected, the abbreviated name is extended to include this information. For example, the name R-M17*(xM458) denotes the haplogroup R-M17 in which no mutant allele was detected in the marker M458 which, in turn, defines the haplogroup R-M458 (a sub-haplogroup of the haplogroup R-M17).

It is recommended that the outcome of Y-SNP analysis in forensic genetic tests is presented in the form of a list of examined Y-SNP polymorphisms and identified alleles, and a haplogroup designated according to the abbreviated nomenclature. If the frequency of the determined haplogroup in a given population is used for the statistical analysis of results, the source (e.g. a published scientific paper) from which data on the frequency is taken should be quoted.

Analysis of the Y-STR profile originating from one person

When analysing and interpreting the outcome of analysis of the Y-STR polymorphism originating from one person, especially in order to exclude a mixture, the following aspects must be taken into consideration:
1. Most Y-STR markers typically have one allele (the so-called single-copy markers). However, there is also a numerous group of markers where primers, as a rule, amplify more than one locus on the Y chromosome (the so-called multi-copy markers). One of these markers is DYS385, which is included in the most widely used kits for the analysis of Y-STR polymorphism, and which usually has two alleles. Another example is DYF387S1, an element of the AmpFlSTR Yfiler Plus and ForenSeq kits. DYF387S1 also typically has two alleles, though three or even four alleles are quite common in this marker as well [18].
The occurrence of just one allele DYS385 or DYF387S1 is frequently interpreted as the presence of two identical alleles, and this double notation (e.g. DYS385*11.11) is used in the YHRD database. Since the cause of occurrence of just one allele in multi-copy markers is often unknown (two identical alleles or lack of amplification of one locus, for example due to deletion), it is recommended that a notation with just one allele (e.g. DYS385*11) is applied in forensic expert opinions. Since the ISFG DNA Commission recommends that the nomenclature used for STR alleles evaluated by the HTS method is consistent with the nomenclature of alleles determined by capillary electrophoresis, the notation with a single allele should also be used if isometric alleles are found, and it should be additionally provided with information on their presence as well as differences identified in the sequence (in parentheses after the allele name in the table with the Y-STR haplotype or as a footnote under the table, referring to the marker in which the isometric alleles were detected), in cases where the presence of isometric alleles was used for the comparison of profiles, statistical analysis and preparation of a forensic opinion.
2. In some single-copy markers, duplications or even triplications are reported. Most duplications are alleles differing in one repeat unit (83% in the US database of Y-STR haplotypes) [13].
3. Some duplications may involve larger fragments of the Y chromosome, which manifests itself as duplications of single-copy markers located close together on the chromosome.
4. Deletion of a fragment of the Y chromosome results in the lack of amplification of a given marker, and it is referred to as the zero allele. A mutation at the primer attachment site may also lead to the zero allele. Such an allele should be confirmed by a second independent amplification. At the same time, it is necessary to rule out locus dropout due to insufficient amount of DNA used for the reaction, DNA degradation or the presence of inhibitors as a possible cause for the absence of amplification.
5. Some deletions may involve larger fragments of the Y chromosome, which is manifested as the lack of amplification of markers lying close together on the chromosome.
The stochastic threshold does not apply to single-copy Y-STR markers. Duplications are very rare, so failure to detect the second allele in the case of duplication does not significantly affect the outcome of statistical analysis [13]. For multi-copy Y-STR markers, a stochastic threshold should be determined identically as for heterozygotes in the case of autosomal markers.

Analysis of mixed Y-STR profiles

Individuals with a female phenotype may be found to have a complete or partial Y-STR profile, for example because of translocation, congenital sex development anomalies, or sex reassignment surgery. Forensic genetic examination of polymorphism in the length of the amelogenin gene fragment in healthy men with deletion of this gene on the Y chromosome yields a result indicating the female sex. In 37,454 men whose profiles are deposited in the national DNA database, deletion of the amelogenin gene on the Y chromosome appears 9 times, so it occurs in Polish men at the approximate frequency of 0.024%. For this reason, Y-STR polymorphism should be evaluated in reference material obtained from all individuals whose DNA may be present in the mixture in which Y-STR alleles were identified, regardless of the phenotypic or genetic sex of the examined individuals.
A DNA sample is considered to come from more than a single male if two or more alleles are observed for two or more single-copy markers [13]. This interpretation should take into account the possibility of duplication of a larger fragment of the Y chromosome, covering markers located close to each other on the chromosome. An additional factor suggesting a mixture is the presence of alleles with significantly different numbers of repeat units (most duplications present as alleles that differ in just one repeat unit).
The Y-STR haplotype derived from one person can be reconstructed in the analysis of a DNA mixture as a majority profile clearly distinguishable by the height of peaks (possibly also a minority profile) or – in intimate samples where a similar peak height was detected in the mixture – by excluding from the mixed profile the alleles originating from the selected person in situations when the presence of their DNA in the mixture is presumed (e.g. alleles of the victim). Such reconstructed Y-STR haplotypes originating from one source (from a single donor) can be used for comparative purposes.
Mixtures of Y-STR alleles in which individual profiles cannot be identified, can be employed directly to exclude the presence in the mixture of DNA of the person whose reference material is analysed, if that person’s alleles are not present in the mixture. Calculating the likelihood ratio (LR) for the presence of the Y chromosome of a specified individual in such a mixture is possible, for example, using the “Y-STR Mixture Calculation” tool which is available on the YHRD website.

Statistical analysis

If the full or partial Y-STR profile of a single person observed in the examined biological material as a profile without the characteristics of a mixture or a separable constituent of a mixture is consistent with the Y-STR profile of the reference material, the observed and expected frequency (probability of observing the Y-STR profile) must be determined in the population on the basis of data from an appropriate population base.
The observed frequency is expressed by the formula n/N, where n is the number of observations in a given population, and N is the number of examined haplotypes from a given population that are deposited in the YHRD. It follows that if an examined Y-STR haplotype is not observed even once in the database, the observed frequency assumes the value of 0.
Currently, the YHRD enables estimation of the expected frequency using three different methods:
• as augmented frequency, corresponding to the frequency observed after adding the observed haplotype to the database and expressed by the formula (n + 1)/(N + 1), where the number 1 represents the studied haplotype (by including the studied haplotype in the formula, augmented frequency never takes the value of 0),
• based on the kappa method, which takes into account the proportion of unique haplotypes (observed only once) in the population sample [19],
• based on the DL (discrete Laplace) method, which takes into account the distribution of alleles in the population.
The most important limitation in using augmented frequency for the preparation of expert opinions regarding results of Y-STR polymorphism analysis is the direct relationship between the value of evidence based on the Y chromosome examination and the size of the database. This problem can be bypassed by using the kappa and DL methods which analyse the database used and estimate the expected frequency of the Y-STR haplotype under study based on the occurrence of individual haplotypes or the distribution of alleles in the population. Although the DL method has recently been recommended for genetic and forensic studies in Germany [20, 21], it has several significant limitations that hinder its widespread practical application. In the YHRD, it is available only for two selected sets of Y-STR markers (minimal haplotype and AmpFlSTR Yfiler kit), exclusively at the metapopulation level. Furthermore, the method cannot be employed for partial DNA profiles that lack information for even a single marker, for Y-STR haplotypes determined using the ForenSeq kit, which does not contain three markers from the AmpFlSTR Yfiler kit including one marker from the minimal haplotype (DYS393). Also, the method provides no basis for directly estimating the frequency expected in the Polish population. Furthermore, the assumptions of the kappa method in estimating the probability of occurrence of the Y chromosome haplotype have been demonstrated as correct by the latest analyses [22].

For this reason, the Polish Speaking Working Group of the ISFG recommends using the kappa method in forensic genetic expert opinions to estimate the probability of observing the Y-STR profile in the population, and the corresponding likelihood ratio.

If there is a match between the Y-STR profile found in the evidence material and the Y-STR profile in the reference material, the likelihood ratio LR is calculated as the ratio of the probability of observing identical profiles on the assumption that they originate from a single source (taking the value of 1) to the probability that the profile observed in the evidence material comes from another person in a given population, unrelated to the man from whom the reference material was collected, and the match of the profiles is merely coincidental (equal to the expected frequency of the Y-STR haplotype). The LR value is, therefore, the inverse of expected frequency. If examinations yield a partial profile matching the profile from the reference material, statistical analysis should be performed exclusively for the profile including Y-STR markers with determined alleles. A single difference excludes the possibility that the Y-STR profiles originate from the same man.
When determining kinship in the male line in cases with identical Y-STR haplotypes, the likelihood ratio LR is calculated as the ratio of the probability of observing identical profiles on the assumption that, for example, the examined child is the son of the examined man (the value of 1 is assumed, which disregards the rare phenomenon of mutation), to the probability that, for example, the child’s Y chromosome comes from another unrelated male from a given population (equal to the expected frequency of the Y-STR haplotype). The procedure for calculating LR in such situations is hence identical to that adopted when there is a match in the Y-STR profiles between the evidence material and the reference material: the likelihood ratio LR is the inverse of expected frequency.
If differences between Y-STR haplotypes are observed in kinship analysis, the numerator (expressing the probability that, for example, the child’s haplotype comes from the examined man) should also include the mutation rate (μ) [23]. The Y-STR marker mutation rates calculated with data from multiple studies, are available online in the YHRD. In the simplest case of one single-step mutation observed in the alleged son, the numerator in the LR formula (i.e. the probability of passing the haplotype containing the observed mutation to the son) instead of the value of 1 assumes the form of μ · ½, where ½ corresponds to the proportion of shorter or longer STR alleles among the observed mutations (studies show that shortening and lengthening occur with the same frequency and account for half of the mutations observed in STR markers). When two single-step mutations occur, the numerator in the LR formula is modified accordingly, taking the form of μ1 · ½ · μ2 · ½, where μ1 and μ2 are mutation rates of mutated Y-STR markers.
In cases of more distant kinship in the male line, the probability of occurrence of a Y-STR marker mutation rises in proportion to the number of transmissions of the Y chromosome. If a genetic examination involves two alleged brothers or an alleged grandfather and an alleged grandson, the numerator in the LR formula should be multiplied by 2 (the distance between the examined men is equal to two transmissions of the Y chromosome) but, for example, in the case of an alleged uncle and an alleged nephew, the numerator should be multiplied by 3.
In view of the fact that multi-step mutations of STR alleles are observed far less frequently than single-step mutations, if a two-step mutation is detected, the numerator in the LR formula should be decreased in proportion to the frequency of multi-step mutations among all observed mutations. Studies on Y-STR mutation frequencies conducted to date have included relatively few father-son pairs to be able to assess reliably the frequency of multi-step mutation of the STR allele, which is a very rare phenomenon. On the other hand, the results of extensive studies investigating the mutation potential of the STR markers located on the autosomes are available. A study including a total of 1,587 mutations of autosomal microsatellites has shown that multi-step mutations occur 33 times less frequently than single-step mutations [24]. As there are no grounds to assume any differences in the mechanism underlying the mutation of STR markers of the autosomes and the Y chromosome, the observations made for autosomal markers can be directly extrapolated to the Y-STR markers by multiplying the numerator in the LR formula by ¹⁄33 if the results of the Y-STR polymorphism analysis suggest a two-step mutation.
Calculation of the likelihood ratio (LR) in determining kinship in the male line based on the Y-STR profiles is possible with the “Y-STR Kinship-Index Calculation” tool which can be accessed online via the YHRD. The application is suitable for calculating the LR value in kinship analyses based on the Y-STR haplotype frequencies in metapopulations, and it incorporates exclusively single-step mutations.
The profile frequencies and LR values for the Y-STR haplotype are multiplied by appropriate values obtained for the markers located on other chromosomes and for mitochondrial DNA, both in the analysis of biological traces seeking to establish whether the DNA contained in the biological material comes from the suspected person, and in kinship analyses [13].

The authors declare no conflict of interest.
1. Tilford CA, Kuroda-Kawaguchi T, Skaletsky H, et al. A physical map of the human Y chromosome. Nature 2001; 409: 943-945.
2. Jobling MA, Pandya A, Tyler-Smith C. The Y chromosome in forensic analysis and paternity testing. Int J Legal Med 1997; 110: 118-124.
3. Gill P, Brenner C, Brinkmann B, et al. DNA Commission of the International Society of Forensic Genetics: recommendations on forensic analysis using Y-chromosome STRs. Forensic Sci Int 2001; 124: 5-10.
4. Gusmão L, Butler JM, Carracedo A, et al. DNA Commission of the International Society of Forensic Genetics (ISFG): an update of the recommendations on the use of Y-STRs in forensic analysis. Forensic Sci Int 2006; 157: 187-197.
5. Mulero JJ, Budowle B, Butler JM, Gusmão L. Nomenclature and allele repeat structure update for the Y-STR locus GATA H4. J Forensic Sci 2006; 51: 694.
6. Parson W, Ballard D, Budowle B, et al. Massively parallel sequencing of forensic STRs: considerations of the DNA commission of the International Society for Forensic Genetics (ISFG) on minimal nomenclature requirements. Forensic Sci Int Genet 2016; 22: 54-63.
7. Willuweit S, Roewer L. Y chromosome haplotype reference database (YHRD): update. Forensic Sci Int Genet 2007; 1: 83-87.
8. Rębała K, Mikulich AI, Tsybovsky IS, Siváková D, Džupinková Z, Szczerkowska-Dobosz A, Szczerkowska Z. Y-STR variation among Slavs: evidence for the Slavic homeland in the middle Dnieper basin. J Hum Genet 2007; 52: 406-414.
9. Woźniak M, Malyarchuk B, Derenko M, Vanecek T, Lazur J, Gomolcak P, Grzybowski T. Similarities and distinctions in Y chromosome gene pool of Western Slavs. Am J Phys Anthropol 2010; 142: 540-548.
10. Rosser ZH, Zerjal T, Hurles ME, et al. Y-chromosomal diversity in Europe is clinal and influenced primarily by geography, rather than by language. Am J Hum Genet 2000; 67: 1526-1543.
11. Underhill PA, Myres NM, Rootsi S, et al. Separating the post-Glacial coancestry of European and Asian Y chromosomes within haplogroup R1a. Eur J Hum Genet 2010; 18: 479-484.
12. Płoski R, Woźniak M, Pawłowski R, et al. Homogeneity and distinctiveness of Polish paternal lineages revealed by Y chromosome microsatellite haplotype analysis. Hum Genet 2002; 110: 592-600.
13. Scientific Working Group on DNA Analysis Methods. SWGDAM interpretation guidelines for Y-chromosome STR typing by forensic DNA laboratories. https://www.swgdam.org/publications
14. Ballantyne KN, Keerl V, Wollstein A, et al. A new future of forensic Y-chromosome analysis: rapidly mutating Y-STRs for differentiating male relatives and paternal lineages. Forensic Sci Int Genet 2012; 6: 208-218.
15. Ballantyne KN, Goedbloed M, Fang R, et al. Mutability of Y-chromosomal microsatellites: rates, characteristics, molecular bases, and forensic implications. Am J Hum Genet 2010; 87: 341-353.
16. Y Chromosome Consortium. A nomenclature system for the tree of human Y-chromosomal binary haplogroups. Genome Res 2002; 12: 339-348.
17. Karafet TM, Mendez FL, Meilerman MB, Underhill PA, Zegura SL, Hammer MF. New binary polymorphisms reshape and increase resolution of the human Y chromosomal haplogroup tree. Genome Res 2008; 18: 830-838.
18. Spólnicka M, Dąbrowska J, Szabłowska-Gnap E, et al. Intra- and inter-population analysis of haplotype diversity in Yfiler Plus system using a wide set of representative data from Polish population. Forensic Sci Int Genet 2017; 28: e22-e25.
19. Brenner CH. Fundamental problem of forensic mathematics – the evidential value of a rare haplotype. Forensic Sci Int Genet 2010; 4: 281-291.
20. Willuweit S, Anslinger K, Bäßler G, et al. Gemeinsame Empfehlungen der Projektgruppe „Biostatistische DNA-Berechnungen” und der Spurenkommission zur biostatistischen Bewertung von Y-chromosomalen DNA-Befunden. Rechtsmedizin 2018; 28: 138-142.
21. Roewer L, Willuweit S. Y-chromosomale STR-Analyse in der forensischen Praxis. Rechtsmedizin 2018; 28: 149-164.
22. Brenner CH. Understanding Y haplotype matching probability. Forensic Sci Int Genet 2014; 8: 233-243.
23. Rolf B, Keil W, Brinkmann B, Roewer L, Fimmers R. Paternity testing using Y-STR haplotypes: assigning a probability for paternity in cases of mutations. Int J Legal Med 2001; 115: 12-15.
24. Sun H, Liu S, Zhang Y, Whittle MR. Comparison of southern Chinese Han and Brazilian Caucasian mutation rates at autosomal short tandem repeat loci used in human forensic genetics. Int J Legal Med 2014; 128: 1-9.
Copyright: © 2020 Polish Society of Forensic Medicine and Criminology (PTMSiK). This is an Open Access journal, all articles are distributed under the terms of the Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) License (http://creativecommons.org/licenses/by-nc-sa/4.0/), allowing third parties to copy and redistribute the material in any medium or format and to remix, transform, and build upon the material, provided the original work is properly cited and states its license.
© 2025 Termedia Sp. z o.o.
Developed by Bentus.