# Methods and Tools for Integrating Pathomics Data into Cancer Registries

> **NIH NIH UH3** · STATE UNIVERSITY NEW YORK STONY BROOK · 2020 · $643,291

## Abstract

The goal of this project is to enrich SEER registry data with high-quality population-based 
biospecimen data in the form of digital pathology, machine learning based classifications and 
quantitative pathomics feature sets.  We will create a well-curated repository of high-quality 
digitized pathology images for subjects whose data is being collected by the registries.  These 
images will be processed to extract computational features and establish deep linkages with 
registry data, thus enabling the creation of information-rich, population cohorts containing 
objective imaging and clinical attributes.  Specific examples of digital Pathology derived feature 
sets include quantification of tumor infiltrating lymphocytes and segmentation and 
characterization of cancer or stromal nuclei. Features will also include spectral and spatial 
signatures of the underlying pathology.  The scientific premise for this approach stems from 
increasing evidence that information extracted from digitized pathology images 
(pathomic features) are a quantitative surrogate of what is described in a pathology report. The 
important distinction being that these features are quantitative and reproducible, unlike human 
observations that are highly qualitative and subject to a high degree of inter- and intra-observer 
variability. This dataset will provide, a unique, population-wide tissue based view of cancer, 
and dramatically accelerate our understanding of the stages of disease progression, cancer 
outcomes, and predict and assess therapeutic effectiveness.  
This work will be carried out in collaboration with three SEER registries. We will partner 
with The New Jersey State Cancer Registry during the development phase of the project (UG3). 
During the validation phase of the project (UH3), the Georgia and Kentucky State Cancer 
Registries will join the project. The infrastructure will be developed in close collaboration with 
SEER registries to ensure consistency with registry processes, scalability and ability support 
creation of population cohorts that span multiple registries. We will deploy visual analytic tools 
to facilitate the creation of population cohorts for epidemiological studies, tools to support 
visualization of feature clusters and related whole-slide images while providing advanced 
algorithms for conducting content based image retrieval. The scientific validation of the 
proposed environment will be undertaken through three studies in Prostate Cancer, Lymphoma 
and NSCLC, led by investigators at the three sites.

## Key facts

- **NIH application ID:** 10216066
- **Project number:** 4UH3CA225021-03
- **Recipient organization:** STATE UNIVERSITY NEW YORK STONY BROOK
- **Principal Investigator:** Eric B. Durbin
- **Activity code:** UH3 (R01, R21, SBIR, etc.)
- **Funding institute:** NIH
- **Fiscal year:** 2020
- **Award amount:** $643,291
- **Award type:** 4N
- **Project period:** 2018-04-01 → 2023-03-31

## Primary source

NIH RePORTER: https://reporter.nih.gov/project-details/10216066

## Citation

> US National Institutes of Health, RePORTER application 10216066, Methods and Tools for Integrating Pathomics Data into Cancer Registries (4UH3CA225021-03). Retrieved via AI Analytics 2026-05-26 from https://api.ai-analytics.org/grant/nih/10216066. Licensed CC0.

---

*[NIH grants dataset](/datasets/nih-grants) · CC0 1.0*
