# Systematic identification and interpretation of repetitive variants underlying schizophrenia

> **NIH NIH DP5** · UNIVERSITY OF CALIFORNIA, SAN DIEGO · 2021 · $387,500

## Abstract

PROJECT SUMMARY 
 
 Schizophrenia  is  a  heritable  psychiatric  disease  affecting  approximately  1%  of  the  population.  The 
disease  is  associated  with  high  morbidity  and  mortality  and  is  a  leading  cause  of  disability.  Genome­wide 
association  studies  (GWAS)  have  identified  >100  genetic  loci  associated  with  schizophrenia.  However 
standard  GWAS  are  largely  limited  to  detecting  simple  point  mutations,  or  single  nucleotide  polymorphisms 
(SNPs), consisting of single base pair substitutions. Thus, GWAS is unable to capture complex variants such 
as copy number variants (CNVs) and tandem repeats (TRs) that are not well tagged by SNPs.  
Multiple lines of evidence support the hypothesis that TRs play a role in psychiatric disease. TRs are 
one  of  the  largest  sources  of  genetic  variation,  are  weakly  tagged  by  SNPs,  and  play  a  significant  role  in 
regulating gene expression and splicing. Intriguingly, >30 Mendelian disorders are caused by TR expansions. 
Nearly  all  repeat  disorders  involve  neurological  phenotypes,  many  have  psychiatric  components,  and  some 
implicated genes have also been identified in schizophrenia GWAS.  
 I  hypothesize  that  tandem  repeats  play  a  significant  role  in  schizophrenia  risk  and  drive  a  subset  of 
GWAS signals. I propose to develop an array of computational techniques to integrate TRs into psychiatric and 
other  GWAS.  In  Aim  1  we  will  develop  algorithms  to  accurately  genotype  long  TR  polymorphisms  in  large 
next­generation sequencing cohorts. In Aim 2 we will generate a high quality reference haplotype panel for a 
targeted set of TRs using traditional family­based phasing methods combined with long range phasing from 
novel single­molecule sequencing technologies. In Aim 3 we will deeply characterize medically relevant TRs in 
psychiatric disease by imputing TRs into large existing GWAS cohorts. Finally, in Aim 4 we will develop a novel 
haplotype test capturing genome­wide TR associations from existing GWAS datasets. Taken together, these 
innovations  will  provide  a  powerful  framework  for  interrogating  the  role  of  TRs  in  human  disease. 
Genome­wide  scans  for  association  (Aim  4)  can  be  combined  with  targeted  methods  of  Aims  1­3  for 
genotyping  or  imputing  TRs,  fine  mapping  against  other  variant  types,  and  performing  functional  follow  up. 
Technologies  for  high  throughput  TR  genotyping  and  imputation  will  revolutionize  our  ability  to  discover 
disease­associated  TRs  and  enable  unprecedented  study  of  TRs  in  broad  applications  including  GWAS, 
Mendelian genetics, and cancer.

## Key facts

- **NIH application ID:** 10239011
- **Project number:** 5DP5OD024577-05
- **Recipient organization:** UNIVERSITY OF CALIFORNIA, SAN DIEGO
- **Principal Investigator:** Melissa Gymrek
- **Activity code:** DP5 (R01, R21, SBIR, etc.)
- **Funding institute:** NIH
- **Fiscal year:** 2021
- **Award amount:** $387,500
- **Award type:** 5
- **Project period:** 2017-09-01 → 2023-08-31

## Primary source

NIH RePORTER: https://reporter.nih.gov/project-details/10239011

## Citation

> US National Institutes of Health, RePORTER application 10239011, Systematic identification and interpretation of repetitive variants underlying schizophrenia (5DP5OD024577-05). Retrieved via AI Analytics 2026-05-23 from https://api.ai-analytics.org/grant/nih/10239011. Licensed CC0.

---

*[NIH grants dataset](/datasets/nih-grants) · CC0 1.0*
