{ "cells": [ { "cell_type": "markdown", "metadata": {}, "source": [ "# Variant Effect Prediction with Decima" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Decima's Variant Effect Prediction (VEP) module allows you to predict the effects of genetic variants on gene expression. This tutorial demonstrates how to use the VEP functionality through both command-line interface (CLI) and Python API. The VEP module takes variant file as input (in TSV or VCF format) and predicts their effects on gene expression across different cell types and tissues if provided." ] }, { "cell_type": "code", "execution_count": 1, "metadata": {}, "outputs": [], "source": [ "import os\n", "import pandas as pd\n", "\n", "os.environ[\"CUDA_VISIBLE_DEVICES\"] = \"0\"" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "\n", "## CLI API" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "CLI API for variant effect prediction on gene expression." ] }, { "cell_type": "code", "execution_count": 2, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Usage: decima vep [OPTIONS]\n", "\n", " Predict variant effect and save to parquet\n", "\n", " Examples:\n", "\n", " >>> decima vep -v \"data/sample.vcf\" -o \"vep_results.parquet\"\n", "\n", " >>> decima vep -v \"data/sample.vcf\" -o \"vep_results.parquet\" --tasks\n", " \"cell_type == 'classical monocyte'\" # only predict for classical\n", " monocytes\n", "\n", " >>> decima vep -v \"data/sample.vcf\" -o \"vep_results.parquet\" --device 0\n", " # use device gpu device 0\n", "\n", " >>> decima vep -v \"data/sample.vcf\" -o \"vep_results.parquet\" --include-\n", " cols \"gene_name,gene_id\" # include gene_name and gene_id columns in the\n", " output\n", "\n", " >>> decima vep -v \"data/sample.vcf\" -o \"vep_results.parquet\" --gene-col\n", " \"gene_name\" # use gene_name column as gene names if these option passed\n", " genes and variants mapped based on these column not based on the genomic\n", " locus based on the annotaiton.\n", "\n", "Options:\n", " -v, --variants PATH Path to the variant file .vcf file\n", " -o, --output_pq PATH Path to the output parquet file.\n", " --tasks TEXT Tasks to predict. If not provided, all tasks will\n", " be predicted.\n", " --chunksize INTEGER Number of variants to process in each chunk.\n", " Loading variants in chunks is more memory\n", " efficient.This chuck of variants will be process\n", " and saved to output parquet file before contineus\n", " to next chunk. Default: 10_000.\n", " --model INTEGER Model to use for variant effect prediction either\n", " replicate number or path to the model.\n", " --device TEXT Device to use. Default: None which automatically\n", " selects the best device.\n", " --batch-size INTEGER Batch size for the model. Default: 1.\n", " --num-workers INTEGER Number of workers for the loader. Default: 1.\n", " --max-distance FLOAT Maximum distance from the TSS. Default: 524288.\n", " --max-distance-type TEXT Type of maximum distance. Default: tss.\n", " --include-cols TEXT Columns to include in the output in the original\n", " tsv file to include in the output parquet file.\n", " Default: None.\n", " --gene-col TEXT Column name for gene names. Default: None.\n", " --genome TEXT Genome build. Default: hg38.\n", " --help Show this message and exit.\n", "\u001b[0m" ] } ], "source": [ "! decima vep --help" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "The VEP module takes a VCF file as input, identifies variants near genes, and predicts their effects on gene expression in a cell type-specific manner. The results are saved as a parquet file containing the following columns:\n", "\n", "- chrom: Chromosome where the variant is located\n", "- pos: Genomic position of the variant\n", "- ref: Reference allele\n", "- alt: Alternative allele\n", "- gene: Gene name\n", "- start: Gene start position\n", "- end: Gene end position\n", "- strand: Gene strand\n", "- gene_mask_start: Start position of gene mask\n", "- gene_mask_end: End position of gene mask\n", "- rel_pos: Relative position within gene\n", "- ref_tx: Reference transcript\n", "- alt_tx: Alternative transcript\n", "- tss_dist: Distance to transcription start site\n", "- cell_0, cell_1, etc.: Predicted gene expression changes for each cell type" ] }, { "cell_type": "code", "execution_count": null, "metadata": {}, "outputs": [], "source": [ "! decima vep -v \"data/sample.vcf\" -o \"vep_vcf_results.parquet\"" ] }, { "cell_type": "code", "execution_count": 4, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "unknown: 0 / 48 \n", "allele_mismatch_with_reference_genome: 26 / 48 \n" ] } ], "source": [ "! cat vep_vcf_results.parquet.warnings.log" ] }, { "cell_type": "code", "execution_count": 5, "metadata": {}, "outputs": [ { "data": { "text/html": [ "
| \n", " | chrom | \n", "pos | \n", "ref | \n", "alt | \n", "gene | \n", "start | \n", "end | \n", "strand | \n", "gene_mask_start | \n", "gene_mask_end | \n", "... | \n", "agg_9528 | \n", "agg_9529 | \n", "agg_9530 | \n", "agg_9531 | \n", "agg_9532 | \n", "agg_9533 | \n", "agg_9535 | \n", "agg_9536 | \n", "agg_9537 | \n", "agg_9538 | \n", "
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | \n", "chr1 | \n", "1002308 | \n", "T | \n", "C | \n", "FAM41C | \n", "516455 | \n", "1040743 | \n", "- | \n", "163840 | \n", "172672 | \n", "... | \n", "-0.000053 | \n", "-0.000153 | \n", "-0.000089 | \n", "-0.000016 | \n", "-0.000013 | \n", "-0.000040 | \n", "-0.000070 | \n", "7.629395e-05 | \n", "-0.000026 | \n", "-0.000069 | \n", "
| 1 | \n", "chr1 | \n", "1002308 | \n", "T | \n", "C | \n", "NOC2L | \n", "598861 | \n", "1123149 | \n", "- | \n", "163840 | \n", "178946 | \n", "... | \n", "-0.000586 | \n", "-0.000891 | \n", "-0.000565 | \n", "-0.000311 | \n", "-0.000461 | \n", "-0.000252 | \n", "-0.000376 | \n", "-6.060898e-04 | \n", "-0.000454 | \n", "-0.000725 | \n", "
| 2 | \n", "chr1 | \n", "1002308 | \n", "T | \n", "C | \n", "PERM1 | \n", "621645 | \n", "1145933 | \n", "- | \n", "163840 | \n", "170729 | \n", "... | \n", "-0.000565 | \n", "-0.000787 | \n", "-0.000515 | \n", "-0.000279 | \n", "-0.000354 | \n", "-0.000202 | \n", "-0.000342 | \n", "-5.399883e-04 | \n", "-0.000423 | \n", "-0.000597 | \n", "
| 3 | \n", "chr1 | \n", "1002308 | \n", "T | \n", "C | \n", "HES4 | \n", "639724 | \n", "1164012 | \n", "- | \n", "163840 | \n", "165050 | \n", "... | \n", "-0.001453 | \n", "-0.001775 | \n", "-0.001403 | \n", "-0.000820 | \n", "-0.000896 | \n", "-0.000575 | \n", "-0.001113 | \n", "-1.119316e-03 | \n", "-0.001036 | \n", "-0.001202 | \n", "
| 4 | \n", "chr1 | \n", "1002308 | \n", "T | \n", "C | \n", "FAM87B | \n", "653531 | \n", "1177819 | \n", "+ | \n", "163840 | \n", "166306 | \n", "... | \n", "0.000045 | \n", "0.000105 | \n", "0.000060 | \n", "-0.000030 | \n", "-0.000049 | \n", "0.000029 | \n", "0.000135 | \n", "1.490116e-07 | \n", "0.000057 | \n", "0.000001 | \n", "
| 5 | \n", "chr1 | \n", "1002308 | \n", "T | \n", "C | \n", "RNF223 | \n", "713858 | \n", "1238146 | \n", "- | \n", "163840 | \n", "167179 | \n", "... | \n", "-0.000561 | \n", "-0.000826 | \n", "-0.000536 | \n", "-0.000299 | \n", "-0.000324 | \n", "-0.000196 | \n", "-0.000374 | \n", "-3.589988e-04 | \n", "-0.000342 | \n", "-0.000426 | \n", "
| 6 | \n", "chr1 | \n", "1002308 | \n", "T | \n", "C | \n", "C1orf159 | \n", "755913 | \n", "1280201 | \n", "- | \n", "163840 | \n", "198383 | \n", "... | \n", "-0.000399 | \n", "-0.000585 | \n", "-0.000374 | \n", "-0.000208 | \n", "-0.000212 | \n", "-0.000126 | \n", "-0.000265 | \n", "-2.926290e-04 | \n", "-0.000266 | \n", "-0.000376 | \n", "
| 7 | \n", "chr1 | \n", "1002308 | \n", "T | \n", "C | \n", "SAMD11 | \n", "760088 | \n", "1284376 | \n", "+ | \n", "163840 | \n", "184493 | \n", "... | \n", "0.001317 | \n", "0.001001 | \n", "0.000884 | \n", "0.001013 | \n", "0.000691 | \n", "0.001310 | \n", "0.001097 | \n", "5.598068e-04 | \n", "0.000501 | \n", "0.000827 | \n", "
| 8 | \n", "chr1 | \n", "1002308 | \n", "T | \n", "C | \n", "KLHL17 | \n", "796744 | \n", "1321032 | \n", "+ | \n", "163840 | \n", "168975 | \n", "... | \n", "-0.000244 | \n", "-0.000214 | \n", "-0.000310 | \n", "-0.000153 | \n", "-0.000324 | \n", "-0.000168 | \n", "-0.000147 | \n", "-4.823208e-04 | \n", "-0.000211 | \n", "-0.000401 | \n", "
| 9 | \n", "chr1 | \n", "1002308 | \n", "T | \n", "C | \n", "PLEKHN1 | \n", "802642 | \n", "1326930 | \n", "+ | \n", "163840 | \n", "173223 | \n", "... | \n", "0.000012 | \n", "-0.000113 | \n", "0.000002 | \n", "-0.000028 | \n", "-0.000248 | \n", "-0.000283 | \n", "-0.000314 | \n", "-1.890063e-04 | \n", "-0.000022 | \n", "-0.000029 | \n", "
| 10 | \n", "chr1 | \n", "1002308 | \n", "T | \n", "C | \n", "TTLL10-AS1 | \n", "819107 | \n", "1343395 | \n", "- | \n", "163840 | \n", "170339 | \n", "... | \n", "-0.000286 | \n", "-0.000486 | \n", "-0.000312 | \n", "-0.000150 | \n", "-0.000256 | \n", "-0.000124 | \n", "-0.000179 | \n", "-3.057718e-04 | \n", "-0.000183 | \n", "-0.000252 | \n", "
| 11 | \n", "chr1 | \n", "1002308 | \n", "T | \n", "C | \n", "ISG15 | \n", "837298 | \n", "1361586 | \n", "+ | \n", "163840 | \n", "177242 | \n", "... | \n", "0.007558 | \n", "0.004934 | \n", "0.007966 | \n", "0.007595 | \n", "-0.001943 | \n", "0.001598 | \n", "0.007838 | \n", "2.528191e-03 | \n", "0.007137 | \n", "0.009534 | \n", "
| 12 | \n", "chr1 | \n", "1002308 | \n", "T | \n", "C | \n", "TNFRSF18 | \n", "846144 | \n", "1370432 | \n", "- | \n", "163840 | \n", "166924 | \n", "... | \n", "-0.000190 | \n", "-0.000248 | \n", "-0.000215 | \n", "-0.000113 | \n", "-0.000070 | \n", "-0.000076 | \n", "-0.000159 | \n", "-5.897880e-05 | \n", "-0.000117 | \n", "-0.000182 | \n", "
| 13 | \n", "chr1 | \n", "1002308 | \n", "T | \n", "C | \n", "TNFRSF4 | \n", "853705 | \n", "1377993 | \n", "- | \n", "163840 | \n", "166653 | \n", "... | \n", "-0.000217 | \n", "-0.000332 | \n", "-0.000225 | \n", "-0.000132 | \n", "-0.000127 | \n", "-0.000102 | \n", "-0.000146 | \n", "-2.127588e-04 | \n", "-0.000168 | \n", "-0.000276 | \n", "
| 14 | \n", "chr1 | \n", "1002308 | \n", "T | \n", "C | \n", "AGRN | \n", "856280 | \n", "1380568 | \n", "+ | \n", "163840 | \n", "199838 | \n", "... | \n", "-0.000643 | \n", "-0.000886 | \n", "-0.000513 | \n", "-0.001688 | \n", "-0.000346 | \n", "-0.000528 | \n", "-0.000894 | \n", "-4.293919e-04 | \n", "-0.001309 | \n", "-0.000301 | \n", "
| 15 | \n", "chr1 | \n", "1002308 | \n", "T | \n", "C | \n", "SDF4 | \n", "871619 | \n", "1395907 | \n", "- | \n", "163840 | \n", "178999 | \n", "... | \n", "-0.000031 | \n", "-0.000034 | \n", "-0.000048 | \n", "-0.000017 | \n", "0.000019 | \n", "-0.000002 | \n", "-0.000036 | \n", "-1.719594e-05 | \n", "-0.000026 | \n", "-0.000037 | \n", "
| 16 | \n", "chr1 | \n", "1002308 | \n", "T | \n", "C | \n", "C1QTNF12 | \n", "886274 | \n", "1410562 | \n", "- | \n", "163840 | \n", "168116 | \n", "... | \n", "-0.000396 | \n", "-0.000607 | \n", "-0.000421 | \n", "-0.000306 | \n", "-0.000294 | \n", "-0.000207 | \n", "-0.000237 | \n", "-3.867447e-04 | \n", "-0.000289 | \n", "-0.000498 | \n", "
| 17 | \n", "chr1 | \n", "1002308 | \n", "T | \n", "C | \n", "UBE2J2 | \n", "913437 | \n", "1437725 | \n", "- | \n", "163840 | \n", "183816 | \n", "... | \n", "-0.000809 | \n", "-0.001129 | \n", "-0.000884 | \n", "-0.000664 | \n", "-0.000741 | \n", "-0.000528 | \n", "-0.000512 | \n", "-7.908940e-04 | \n", "-0.000607 | \n", "-0.000990 | \n", "
| 18 | \n", "chr1 | \n", "1002308 | \n", "T | \n", "C | \n", "ACAP3 | \n", "949161 | \n", "1473449 | \n", "- | \n", "163840 | \n", "181059 | \n", "... | \n", "-0.000826 | \n", "-0.001292 | \n", "-0.000932 | \n", "-0.000710 | \n", "-0.000789 | \n", "-0.000506 | \n", "-0.000457 | \n", "-9.316206e-04 | \n", "-0.000666 | \n", "-0.001122 | \n", "
| 19 | \n", "chr1 | \n", "1002308 | \n", "T | \n", "C | \n", "INTS11 | \n", "964243 | \n", "1488531 | \n", "- | \n", "163840 | \n", "176946 | \n", "... | \n", "-0.000033 | \n", "-0.000067 | \n", "-0.000013 | \n", "-0.000010 | \n", "0.000030 | \n", "0.000017 | \n", "-0.000020 | \n", "1.147389e-04 | \n", "-0.000005 | \n", "-0.000017 | \n", "
| 20 | \n", "chr1 | \n", "1002308 | \n", "T | \n", "C | \n", "DVL1 | \n", "988970 | \n", "1513258 | \n", "- | \n", "163840 | \n", "177982 | \n", "... | \n", "-0.000297 | \n", "-0.000456 | \n", "-0.000343 | \n", "-0.000253 | \n", "-0.000310 | \n", "-0.000204 | \n", "-0.000172 | \n", "-3.470182e-04 | \n", "-0.000220 | \n", "-0.000371 | \n", "
| 21 | \n", "chr1 | \n", "1002308 | \n", "T | \n", "C | \n", "MXRA8 | \n", "1001329 | \n", "1525617 | \n", "- | \n", "163840 | \n", "172928 | \n", "... | \n", "-0.000118 | \n", "-0.000153 | \n", "-0.000130 | \n", "-0.000090 | \n", "-0.000128 | \n", "-0.000076 | \n", "-0.000053 | \n", "-2.347827e-04 | \n", "-0.000090 | \n", "-0.000214 | \n", "
| 22 | \n", "chr1 | \n", "109727471 | \n", "A | \n", "C | \n", "GNAT2 | \n", "109259481 | \n", "109783769 | \n", "- | \n", "163840 | \n", "180515 | \n", "... | \n", "0.000099 | \n", "0.000077 | \n", "0.000057 | \n", "0.000040 | \n", "0.000018 | \n", "0.000047 | \n", "0.000075 | \n", "2.750456e-04 | \n", "0.000065 | \n", "0.000258 | \n", "
| 23 | \n", "chr1 | \n", "109728807 | \n", "TTT | \n", "G | \n", "GNAT2 | \n", "109259481 | \n", "109783769 | \n", "- | \n", "163840 | \n", "180515 | \n", "... | \n", "0.003284 | \n", "0.005105 | \n", "0.002662 | \n", "0.001423 | \n", "0.001525 | \n", "0.001257 | \n", "0.001919 | \n", "5.420089e-03 | \n", "0.002166 | \n", "0.005263 | \n", "
| 24 | \n", "chr1 | \n", "109727471 | \n", "A | \n", "C | \n", "SYPL2 | \n", "109302706 | \n", "109826994 | \n", "+ | \n", "163840 | \n", "179428 | \n", "... | \n", "0.002200 | \n", "0.001744 | \n", "0.001206 | \n", "0.001263 | \n", "0.001008 | \n", "-0.000117 | \n", "0.001218 | \n", "2.799034e-04 | \n", "0.001503 | \n", "0.001372 | \n", "
| 25 | \n", "chr1 | \n", "109728807 | \n", "TTT | \n", "G | \n", "SYPL2 | \n", "109302706 | \n", "109826994 | \n", "+ | \n", "163840 | \n", "179428 | \n", "... | \n", "-0.004052 | \n", "-0.003465 | \n", "-0.003092 | \n", "-0.003744 | \n", "-0.003384 | \n", "-0.003265 | \n", "-0.003253 | \n", "1.600981e-03 | \n", "-0.001915 | \n", "-0.002728 | \n", "
| 26 | \n", "chr1 | \n", "109727471 | \n", "A | \n", "C | \n", "ATXN7L2 | \n", "109319639 | \n", "109843927 | \n", "+ | \n", "163840 | \n", "173165 | \n", "... | \n", "0.000001 | \n", "0.000010 | \n", "0.000091 | \n", "-0.000079 | \n", "-0.000044 | \n", "-0.000061 | \n", "-0.000042 | \n", "-4.082918e-05 | \n", "-0.000022 | \n", "-0.000060 | \n", "
| 27 | \n", "chr1 | \n", "109728807 | \n", "TTT | \n", "G | \n", "ATXN7L2 | \n", "109319639 | \n", "109843927 | \n", "+ | \n", "163840 | \n", "173165 | \n", "... | \n", "0.000536 | \n", "-0.000179 | \n", "0.001585 | \n", "0.001431 | \n", "0.003103 | \n", "0.001631 | \n", "0.000257 | \n", "2.081454e-03 | \n", "0.000913 | \n", "0.001677 | \n", "
| 28 | \n", "chr1 | \n", "109727471 | \n", "A | \n", "C | \n", "CYB561D1 | \n", "109330212 | \n", "109854500 | \n", "+ | \n", "163840 | \n", "172720 | \n", "... | \n", "0.000584 | \n", "0.000577 | \n", "0.000674 | \n", "0.000536 | \n", "0.000167 | \n", "0.000397 | \n", "0.000507 | \n", "1.705885e-04 | \n", "0.000503 | \n", "0.000481 | \n", "
| 29 | \n", "chr1 | \n", "109728807 | \n", "TTT | \n", "G | \n", "CYB561D1 | \n", "109330212 | \n", "109854500 | \n", "+ | \n", "163840 | \n", "172720 | \n", "... | \n", "0.003762 | \n", "0.002849 | \n", "0.001487 | \n", "0.002733 | \n", "-0.000099 | \n", "0.000631 | \n", "0.001469 | \n", "4.820824e-04 | \n", "0.002098 | \n", "-0.000244 | \n", "
| 30 | \n", "chr1 | \n", "109727471 | \n", "A | \n", "C | \n", "GPR61 | \n", "109376032 | \n", "109900320 | \n", "+ | \n", "163840 | \n", "172374 | \n", "... | \n", "0.000155 | \n", "0.000251 | \n", "0.000114 | \n", "0.000134 | \n", "-0.000137 | \n", "-0.000068 | \n", "0.000125 | \n", "4.252791e-05 | \n", "0.000117 | \n", "0.000137 | \n", "
| 31 | \n", "chr1 | \n", "109728807 | \n", "TTT | \n", "G | \n", "GPR61 | \n", "109376032 | \n", "109900320 | \n", "+ | \n", "163840 | \n", "172374 | \n", "... | \n", "0.000258 | \n", "0.000810 | \n", "0.000308 | \n", "0.000489 | \n", "0.000618 | \n", "0.000236 | \n", "0.000523 | \n", "6.991625e-04 | \n", "0.000155 | \n", "0.000536 | \n", "
| 32 | \n", "chr1 | \n", "109727471 | \n", "A | \n", "C | \n", "GSTM3 | \n", "109380590 | \n", "109904878 | \n", "- | \n", "163840 | \n", "170946 | \n", "... | \n", "-0.000651 | \n", "-0.000626 | \n", "-0.000446 | \n", "-0.000290 | \n", "-0.000174 | \n", "-0.000026 | \n", "-0.000154 | \n", "-3.945976e-04 | \n", "-0.000396 | \n", "-0.000499 | \n", "
| 33 | \n", "chr1 | \n", "109728807 | \n", "TTT | \n", "G | \n", "GSTM3 | \n", "109380590 | \n", "109904878 | \n", "- | \n", "163840 | \n", "170946 | \n", "... | \n", "0.014822 | \n", "0.029157 | \n", "0.015316 | \n", "0.007980 | \n", "0.015211 | \n", "0.007929 | \n", "0.010251 | \n", "2.181430e-02 | \n", "0.009214 | \n", "0.024373 | \n", "
| 34 | \n", "chr1 | \n", "109727471 | \n", "A | \n", "C | \n", "GNAI3 | \n", "109384775 | \n", "109909063 | \n", "+ | \n", "163840 | \n", "233549 | \n", "... | \n", "0.002052 | \n", "0.002637 | \n", "0.003581 | \n", "0.001084 | \n", "-0.001867 | \n", "-0.003804 | \n", "0.003472 | \n", "-1.005411e-03 | \n", "0.003400 | \n", "0.001397 | \n", "
| 35 | \n", "chr1 | \n", "109728807 | \n", "TTT | \n", "G | \n", "GNAI3 | \n", "109384775 | \n", "109909063 | \n", "+ | \n", "163840 | \n", "233549 | \n", "... | \n", "-0.002514 | \n", "-0.002176 | \n", "0.001273 | \n", "0.007376 | \n", "0.011271 | \n", "0.019305 | \n", "-0.002886 | \n", "2.035785e-02 | \n", "-0.001660 | \n", "0.006990 | \n", "
| 36 | \n", "chr1 | \n", "109727471 | \n", "A | \n", "C | \n", "AMPD2 | \n", "109452264 | \n", "109976552 | \n", "+ | \n", "163840 | \n", "179789 | \n", "... | \n", "0.000870 | \n", "0.001771 | \n", "0.002003 | \n", "0.000641 | \n", "-0.002239 | \n", "-0.000491 | \n", "0.001610 | \n", "-6.132126e-04 | \n", "0.002603 | \n", "0.000714 | \n", "
| 37 | \n", "chr1 | \n", "109728807 | \n", "TTT | \n", "G | \n", "AMPD2 | \n", "109452264 | \n", "109976552 | \n", "+ | \n", "163840 | \n", "179789 | \n", "... | \n", "0.015270 | \n", "0.004848 | \n", "0.011452 | \n", "0.028524 | \n", "0.009958 | \n", "0.013799 | \n", "0.007597 | \n", "2.641273e-02 | \n", "0.009691 | \n", "0.026180 | \n", "
| 38 | \n", "chr1 | \n", "109727471 | \n", "A | \n", "C | \n", "GSTM4 | \n", "109492259 | \n", "110016547 | \n", "+ | \n", "163840 | \n", "182577 | \n", "... | \n", "-0.000336 | \n", "0.001399 | \n", "0.000511 | \n", "0.000450 | \n", "-0.000501 | \n", "-0.000243 | \n", "-0.001328 | \n", "4.479885e-04 | \n", "0.000544 | \n", "0.002848 | \n", "
| 39 | \n", "chr1 | \n", "109728807 | \n", "TTT | \n", "G | \n", "GSTM4 | \n", "109492259 | \n", "110016547 | \n", "+ | \n", "163840 | \n", "182577 | \n", "... | \n", "-0.032543 | \n", "-0.033684 | \n", "-0.029430 | \n", "-0.050647 | \n", "-0.030112 | \n", "-0.021851 | \n", "-0.012187 | \n", "-2.968431e-02 | \n", "-0.037312 | \n", "-0.067244 | \n", "
| 40 | \n", "chr1 | \n", "109727471 | \n", "A | \n", "C | \n", "GSTM2 | \n", "109504182 | \n", "110028470 | \n", "+ | \n", "163840 | \n", "205369 | \n", "... | \n", "-0.001145 | \n", "-0.001371 | \n", "0.000107 | \n", "-0.000453 | \n", "-0.001597 | \n", "-0.000798 | \n", "-0.001882 | \n", "1.063347e-04 | \n", "0.000106 | \n", "0.000086 | \n", "
| 41 | \n", "chr1 | \n", "109728807 | \n", "TTT | \n", "G | \n", "GSTM2 | \n", "109504182 | \n", "110028470 | \n", "+ | \n", "163840 | \n", "205369 | \n", "... | \n", "0.006410 | \n", "0.010421 | \n", "0.008430 | \n", "0.010849 | \n", "-0.004994 | \n", "0.003090 | \n", "-0.004843 | \n", "-9.270430e-03 | \n", "0.008755 | \n", "0.011827 | \n", "
| 42 | \n", "chr1 | \n", "109727471 | \n", "A | \n", "C | \n", "GSTM1 | \n", "109523974 | \n", "110048262 | \n", "+ | \n", "163840 | \n", "185065 | \n", "... | \n", "0.000849 | \n", "0.001993 | \n", "0.001033 | \n", "-0.000050 | \n", "-0.000534 | \n", "0.000095 | \n", "0.000409 | \n", "-3.244877e-04 | \n", "0.000842 | \n", "0.000388 | \n", "
| 43 | \n", "chr1 | \n", "109728807 | \n", "TTT | \n", "G | \n", "GSTM1 | \n", "109523974 | \n", "110048262 | \n", "+ | \n", "163840 | \n", "185065 | \n", "... | \n", "0.009973 | \n", "0.012482 | \n", "0.003073 | \n", "0.019083 | \n", "0.010606 | \n", "0.000387 | \n", "0.003512 | \n", "7.757962e-03 | \n", "0.011860 | \n", "0.019928 | \n", "
| 44 | \n", "chr1 | \n", "109727471 | \n", "A | \n", "C | \n", "GSTM5 | \n", "109547940 | \n", "110072228 | \n", "+ | \n", "163840 | \n", "227488 | \n", "... | \n", "0.002434 | \n", "0.001946 | \n", "0.001824 | \n", "0.000374 | \n", "-0.000416 | \n", "-0.000871 | \n", "0.003142 | \n", "-1.690984e-03 | \n", "0.001557 | \n", "0.002596 | \n", "
| 45 | \n", "chr1 | \n", "109728807 | \n", "TTT | \n", "G | \n", "GSTM5 | \n", "109547940 | \n", "110072228 | \n", "+ | \n", "163840 | \n", "227488 | \n", "... | \n", "-0.005434 | \n", "0.003420 | \n", "-0.019319 | \n", "-0.000747 | \n", "0.041849 | \n", "0.022034 | \n", "-0.024061 | \n", "4.308212e-02 | \n", "0.005673 | \n", "-0.007195 | \n", "
| 46 | \n", "chr1 | \n", "109727471 | \n", "A | \n", "C | \n", "ALX3 | \n", "109710224 | \n", "110234512 | \n", "- | \n", "163840 | \n", "174642 | \n", "... | \n", "0.000210 | \n", "0.000521 | \n", "0.000256 | \n", "0.000118 | \n", "0.000335 | \n", "0.000174 | \n", "0.000136 | \n", "8.502305e-04 | \n", "0.000165 | \n", "0.000544 | \n", "
| 47 | \n", "chr1 | \n", "109728807 | \n", "TTT | \n", "G | \n", "ALX3 | \n", "109710224 | \n", "110234512 | \n", "- | \n", "163840 | \n", "174642 | \n", "... | \n", "-0.000382 | \n", "-0.000466 | \n", "-0.000408 | \n", "-0.000091 | \n", "-0.000512 | \n", "-0.000240 | \n", "-0.000283 | \n", "-1.361221e-04 | \n", "-0.000274 | \n", "-0.000745 | \n", "
48 rows × 8870 columns
\n", "| \n", " | chrom | \n", "pos | \n", "ref | \n", "alt | \n", "gene | \n", "start | \n", "end | \n", "strand | \n", "gene_mask_start | \n", "gene_mask_end | \n", "... | \n", "agg_9528 | \n", "agg_9529 | \n", "agg_9530 | \n", "agg_9531 | \n", "agg_9532 | \n", "agg_9533 | \n", "agg_9535 | \n", "agg_9536 | \n", "agg_9537 | \n", "agg_9538 | \n", "
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | \n", "chr1 | \n", "1000018 | \n", "G | \n", "A | \n", "ISG15 | \n", "837298 | \n", "1361586 | \n", "+ | \n", "163840 | \n", "177242 | \n", "... | \n", "-0.000746 | \n", "0.002301 | \n", "0.005067 | \n", "0.000135 | \n", "-0.000559 | \n", "-0.003155 | \n", "0.006503 | \n", "-0.001059 | \n", "-0.000566 | \n", "0.000964 | \n", "
| 1 | \n", "chr1 | \n", "1002308 | \n", "T | \n", "C | \n", "ISG15 | \n", "837298 | \n", "1361586 | \n", "+ | \n", "163840 | \n", "177242 | \n", "... | \n", "0.007558 | \n", "0.004934 | \n", "0.007966 | \n", "0.007595 | \n", "-0.001943 | \n", "0.001598 | \n", "0.007838 | \n", "0.002528 | \n", "0.007137 | \n", "0.009534 | \n", "
2 rows × 8870 columns
\n", "| \n", " | chrom | \n", "pos | \n", "ref | \n", "alt | \n", "
|---|---|---|---|---|
| 0 | \n", "chr1 | \n", "1000018 | \n", "G | \n", "A | \n", "
| 1 | \n", "chr1 | \n", "1002308 | \n", "T | \n", "C | \n", "
| 2 | \n", "chr1 | \n", "109727471 | \n", "A | \n", "C | \n", "
| 3 | \n", "chr1 | \n", "109728286 | \n", "TTT | \n", "G | \n", "
| 4 | \n", "chr1 | \n", "109728807 | \n", "T | \n", "GG | \n", "
| \n", " | chrom | \n", "pos | \n", "ref | \n", "alt | \n", "gene | \n", "start | \n", "end | \n", "strand | \n", "gene_mask_start | \n", "gene_mask_end | \n", "... | \n", "agg_9528 | \n", "agg_9529 | \n", "agg_9530 | \n", "agg_9531 | \n", "agg_9532 | \n", "agg_9533 | \n", "agg_9535 | \n", "agg_9536 | \n", "agg_9537 | \n", "agg_9538 | \n", "
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | \n", "chr1 | \n", "1000018 | \n", "G | \n", "A | \n", "FAM41C | \n", "516455 | \n", "1040743 | \n", "- | \n", "163840 | \n", "172672 | \n", "... | \n", "-0.003487 | \n", "-0.006149 | \n", "-0.003175 | \n", "-0.002726 | \n", "-0.003147 | \n", "-0.001746 | \n", "-0.002291 | \n", "-0.005283 | \n", "-0.003393 | \n", "-0.006694 | \n", "
| 1 | \n", "chr1 | \n", "1002308 | \n", "T | \n", "C | \n", "FAM41C | \n", "516455 | \n", "1040743 | \n", "- | \n", "163840 | \n", "172672 | \n", "... | \n", "-0.000096 | \n", "-0.000190 | \n", "-0.000135 | \n", "-0.000043 | \n", "-0.000076 | \n", "-0.000072 | \n", "-0.000106 | \n", "0.000029 | \n", "-0.000055 | \n", "-0.000119 | \n", "
| 2 | \n", "chr1 | \n", "1000018 | \n", "G | \n", "A | \n", "NOC2L | \n", "598861 | \n", "1123149 | \n", "- | \n", "163840 | \n", "178946 | \n", "... | \n", "-0.002595 | \n", "-0.004256 | \n", "-0.002759 | \n", "-0.001601 | \n", "-0.002601 | \n", "-0.001238 | \n", "-0.001756 | \n", "-0.002918 | \n", "-0.001914 | \n", "-0.003244 | \n", "
| 3 | \n", "chr1 | \n", "1002308 | \n", "T | \n", "C | \n", "NOC2L | \n", "598861 | \n", "1123149 | \n", "- | \n", "163840 | \n", "178946 | \n", "... | \n", "-0.000587 | \n", "-0.000894 | \n", "-0.000563 | \n", "-0.000324 | \n", "-0.000471 | \n", "-0.000258 | \n", "-0.000382 | \n", "-0.000683 | \n", "-0.000459 | \n", "-0.000757 | \n", "
| 4 | \n", "chr1 | \n", "1000018 | \n", "G | \n", "A | \n", "PERM1 | \n", "621645 | \n", "1145933 | \n", "- | \n", "163840 | \n", "170729 | \n", "... | \n", "-0.002933 | \n", "-0.004738 | \n", "-0.003541 | \n", "-0.001943 | \n", "-0.002958 | \n", "-0.001370 | \n", "-0.002272 | \n", "-0.003326 | \n", "-0.002195 | \n", "-0.003648 | \n", "
| ... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
| 77 | \n", "chr1 | \n", "109728286 | \n", "TTT | \n", "G | \n", "GSTM5 | \n", "109547940 | \n", "110072228 | \n", "+ | \n", "163840 | \n", "227488 | \n", "... | \n", "-0.004391 | \n", "0.004506 | \n", "-0.017141 | \n", "0.000025 | \n", "0.042810 | \n", "0.024843 | \n", "-0.022073 | \n", "0.043973 | \n", "0.005934 | \n", "-0.006544 | \n", "
| 78 | \n", "chr1 | \n", "109728807 | \n", "T | \n", "GG | \n", "GSTM5 | \n", "109547940 | \n", "110072228 | \n", "+ | \n", "163840 | \n", "227488 | \n", "... | \n", "-0.129386 | \n", "-0.144098 | \n", "-0.077484 | \n", "-0.091391 | \n", "-0.104009 | \n", "-0.034113 | \n", "-0.096020 | \n", "-0.063028 | \n", "-0.079460 | \n", "-0.102111 | \n", "
| 79 | \n", "chr1 | \n", "109727471 | \n", "A | \n", "C | \n", "ALX3 | \n", "109710224 | \n", "110234512 | \n", "- | \n", "163840 | \n", "174642 | \n", "... | \n", "0.000218 | \n", "0.000532 | \n", "0.000263 | \n", "0.000122 | \n", "0.000352 | \n", "0.000184 | \n", "0.000139 | \n", "0.000887 | \n", "0.000173 | \n", "0.000558 | \n", "
| 80 | \n", "chr1 | \n", "109728286 | \n", "TTT | \n", "G | \n", "ALX3 | \n", "109710224 | \n", "110234512 | \n", "- | \n", "163840 | \n", "174642 | \n", "... | \n", "-0.000218 | \n", "-0.000109 | \n", "-0.000204 | \n", "0.000009 | \n", "-0.000265 | \n", "-0.000104 | \n", "-0.000189 | \n", "0.000523 | \n", "-0.000149 | \n", "-0.000385 | \n", "
| 81 | \n", "chr1 | \n", "109728807 | \n", "T | \n", "GG | \n", "ALX3 | \n", "109710224 | \n", "110234512 | \n", "- | \n", "163840 | \n", "174642 | \n", "... | \n", "-0.001127 | \n", "-0.002115 | \n", "-0.001278 | \n", "-0.000581 | \n", "-0.001344 | \n", "-0.000724 | \n", "-0.000569 | \n", "-0.003553 | \n", "-0.000857 | \n", "-0.002281 | \n", "
82 rows × 8870 columns
\n", "| \n", " | chrom | \n", "pos | \n", "ref | \n", "alt | \n", "gene | \n", "start | \n", "end | \n", "strand | \n", "gene_mask_start | \n", "gene_mask_end | \n", "... | \n", "agg_9528 | \n", "agg_9529 | \n", "agg_9530 | \n", "agg_9531 | \n", "agg_9532 | \n", "agg_9533 | \n", "agg_9535 | \n", "agg_9536 | \n", "agg_9537 | \n", "agg_9538 | \n", "
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | \n", "chr1 | \n", "1000018 | \n", "G | \n", "A | \n", "FAM41C | \n", "516455 | \n", "1040743 | \n", "- | \n", "163840 | \n", "172672 | \n", "... | \n", "-0.003487 | \n", "-0.006149 | \n", "-0.003175 | \n", "-0.002726 | \n", "-0.003147 | \n", "-0.001746 | \n", "-0.002291 | \n", "-0.005283 | \n", "-0.003393 | \n", "-0.006694 | \n", "
| 1 | \n", "chr1 | \n", "1002308 | \n", "T | \n", "C | \n", "FAM41C | \n", "516455 | \n", "1040743 | \n", "- | \n", "163840 | \n", "172672 | \n", "... | \n", "-0.000096 | \n", "-0.000190 | \n", "-0.000135 | \n", "-0.000043 | \n", "-0.000076 | \n", "-0.000072 | \n", "-0.000106 | \n", "0.000029 | \n", "-0.000055 | \n", "-0.000119 | \n", "
| 2 | \n", "chr1 | \n", "1000018 | \n", "G | \n", "A | \n", "NOC2L | \n", "598861 | \n", "1123149 | \n", "- | \n", "163840 | \n", "178946 | \n", "... | \n", "-0.002595 | \n", "-0.004256 | \n", "-0.002759 | \n", "-0.001601 | \n", "-0.002601 | \n", "-0.001238 | \n", "-0.001756 | \n", "-0.002918 | \n", "-0.001914 | \n", "-0.003244 | \n", "
| 3 | \n", "chr1 | \n", "1002308 | \n", "T | \n", "C | \n", "NOC2L | \n", "598861 | \n", "1123149 | \n", "- | \n", "163840 | \n", "178946 | \n", "... | \n", "-0.000587 | \n", "-0.000894 | \n", "-0.000563 | \n", "-0.000324 | \n", "-0.000471 | \n", "-0.000258 | \n", "-0.000382 | \n", "-0.000683 | \n", "-0.000459 | \n", "-0.000757 | \n", "
| 4 | \n", "chr1 | \n", "1000018 | \n", "G | \n", "A | \n", "PERM1 | \n", "621645 | \n", "1145933 | \n", "- | \n", "163840 | \n", "170729 | \n", "... | \n", "-0.002933 | \n", "-0.004738 | \n", "-0.003541 | \n", "-0.001943 | \n", "-0.002958 | \n", "-0.001370 | \n", "-0.002272 | \n", "-0.003326 | \n", "-0.002195 | \n", "-0.003648 | \n", "
| ... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
| 77 | \n", "chr1 | \n", "109728286 | \n", "TTT | \n", "G | \n", "GSTM5 | \n", "109547940 | \n", "110072228 | \n", "+ | \n", "163840 | \n", "227488 | \n", "... | \n", "-0.004391 | \n", "0.004506 | \n", "-0.017141 | \n", "0.000025 | \n", "0.042810 | \n", "0.024843 | \n", "-0.022073 | \n", "0.043973 | \n", "0.005934 | \n", "-0.006544 | \n", "
| 78 | \n", "chr1 | \n", "109728807 | \n", "T | \n", "GG | \n", "GSTM5 | \n", "109547940 | \n", "110072228 | \n", "+ | \n", "163840 | \n", "227488 | \n", "... | \n", "-0.129386 | \n", "-0.144098 | \n", "-0.077484 | \n", "-0.091391 | \n", "-0.104009 | \n", "-0.034113 | \n", "-0.096020 | \n", "-0.063028 | \n", "-0.079460 | \n", "-0.102111 | \n", "
| 79 | \n", "chr1 | \n", "109727471 | \n", "A | \n", "C | \n", "ALX3 | \n", "109710224 | \n", "110234512 | \n", "- | \n", "163840 | \n", "174642 | \n", "... | \n", "0.000218 | \n", "0.000532 | \n", "0.000263 | \n", "0.000122 | \n", "0.000352 | \n", "0.000184 | \n", "0.000139 | \n", "0.000887 | \n", "0.000173 | \n", "0.000558 | \n", "
| 80 | \n", "chr1 | \n", "109728286 | \n", "TTT | \n", "G | \n", "ALX3 | \n", "109710224 | \n", "110234512 | \n", "- | \n", "163840 | \n", "174642 | \n", "... | \n", "-0.000218 | \n", "-0.000109 | \n", "-0.000204 | \n", "0.000009 | \n", "-0.000265 | \n", "-0.000104 | \n", "-0.000189 | \n", "0.000523 | \n", "-0.000149 | \n", "-0.000385 | \n", "
| 81 | \n", "chr1 | \n", "109728807 | \n", "T | \n", "GG | \n", "ALX3 | \n", "109710224 | \n", "110234512 | \n", "- | \n", "163840 | \n", "174642 | \n", "... | \n", "-0.001127 | \n", "-0.002115 | \n", "-0.001278 | \n", "-0.000581 | \n", "-0.001344 | \n", "-0.000724 | \n", "-0.000569 | \n", "-0.003553 | \n", "-0.000857 | \n", "-0.002281 | \n", "
82 rows × 8870 columns
\n", "| \n", " | chrom | \n", "pos | \n", "ref | \n", "alt | \n", "gene | \n", "start | \n", "end | \n", "strand | \n", "gene_mask_start | \n", "gene_mask_end | \n", "... | \n", "agg_9528 | \n", "agg_9529 | \n", "agg_9530 | \n", "agg_9531 | \n", "agg_9532 | \n", "agg_9533 | \n", "agg_9535 | \n", "agg_9536 | \n", "agg_9537 | \n", "agg_9538 | \n", "
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | \n", "chr1 | \n", "1002308 | \n", "T | \n", "C | \n", "FAM41C | \n", "516455 | \n", "1040743 | \n", "- | \n", "163840 | \n", "172672 | \n", "... | \n", "-0.000096 | \n", "-0.000190 | \n", "-0.000135 | \n", "-0.000043 | \n", "-0.000076 | \n", "-0.000072 | \n", "-0.000106 | \n", "0.000029 | \n", "-0.000055 | \n", "-0.000119 | \n", "
| 1 | \n", "chr1 | \n", "1002308 | \n", "T | \n", "C | \n", "NOC2L | \n", "598861 | \n", "1123149 | \n", "- | \n", "163840 | \n", "178946 | \n", "... | \n", "-0.000587 | \n", "-0.000894 | \n", "-0.000563 | \n", "-0.000324 | \n", "-0.000471 | \n", "-0.000258 | \n", "-0.000382 | \n", "-0.000683 | \n", "-0.000459 | \n", "-0.000757 | \n", "
| 2 | \n", "chr1 | \n", "1002308 | \n", "T | \n", "C | \n", "PERM1 | \n", "621645 | \n", "1145933 | \n", "- | \n", "163840 | \n", "170729 | \n", "... | \n", "-0.000845 | \n", "-0.001181 | \n", "-0.000784 | \n", "-0.000442 | \n", "-0.000589 | \n", "-0.000313 | \n", "-0.000526 | \n", "-0.000856 | \n", "-0.000637 | \n", "-0.000881 | \n", "
| 3 | \n", "chr1 | \n", "1002308 | \n", "T | \n", "C | \n", "HES4 | \n", "639724 | \n", "1164012 | \n", "- | \n", "163840 | \n", "165050 | \n", "... | \n", "-0.001767 | \n", "-0.002189 | \n", "-0.001705 | \n", "-0.001091 | \n", "-0.001184 | \n", "-0.000717 | \n", "-0.001306 | \n", "-0.001550 | \n", "-0.001349 | \n", "-0.001550 | \n", "
| 4 | \n", "chr1 | \n", "1002308 | \n", "T | \n", "C | \n", "FAM87B | \n", "653531 | \n", "1177819 | \n", "+ | \n", "163840 | \n", "166306 | \n", "... | \n", "-0.000098 | \n", "0.000052 | \n", "-0.000040 | \n", "-0.000051 | \n", "0.000037 | \n", "0.000028 | \n", "-0.000024 | \n", "0.000093 | \n", "-0.000080 | \n", "-0.000203 | \n", "
| 5 | \n", "chr1 | \n", "1002308 | \n", "T | \n", "C | \n", "RNF223 | \n", "713858 | \n", "1238146 | \n", "- | \n", "163840 | \n", "167179 | \n", "... | \n", "-0.000603 | \n", "-0.000860 | \n", "-0.000584 | \n", "-0.000328 | \n", "-0.000361 | \n", "-0.000211 | \n", "-0.000395 | \n", "-0.000428 | \n", "-0.000371 | \n", "-0.000468 | \n", "
| 6 | \n", "chr1 | \n", "1002308 | \n", "T | \n", "C | \n", "C1orf159 | \n", "755913 | \n", "1280201 | \n", "- | \n", "163840 | \n", "198383 | \n", "... | \n", "-0.000358 | \n", "-0.000528 | \n", "-0.000338 | \n", "-0.000193 | \n", "-0.000205 | \n", "-0.000113 | \n", "-0.000245 | \n", "-0.000265 | \n", "-0.000241 | \n", "-0.000347 | \n", "
| 7 | \n", "chr1 | \n", "1002308 | \n", "T | \n", "C | \n", "SAMD11 | \n", "760088 | \n", "1284376 | \n", "+ | \n", "163840 | \n", "184493 | \n", "... | \n", "0.001338 | \n", "0.000849 | \n", "0.000867 | \n", "0.000903 | \n", "0.001198 | \n", "0.001515 | \n", "0.001150 | \n", "0.001019 | \n", "0.000498 | \n", "0.001034 | \n", "
| 8 | \n", "chr1 | \n", "1002308 | \n", "T | \n", "C | \n", "KLHL17 | \n", "796744 | \n", "1321032 | \n", "+ | \n", "163840 | \n", "168975 | \n", "... | \n", "-0.000518 | \n", "-0.000364 | \n", "-0.000522 | \n", "-0.000307 | \n", "-0.000214 | \n", "-0.000158 | \n", "-0.000330 | \n", "-0.000363 | \n", "-0.000348 | \n", "-0.000509 | \n", "
| 9 | \n", "chr1 | \n", "1002308 | \n", "T | \n", "C | \n", "PLEKHN1 | \n", "802642 | \n", "1326930 | \n", "+ | \n", "163840 | \n", "173223 | \n", "... | \n", "0.000109 | \n", "0.000011 | \n", "0.000054 | \n", "0.000009 | \n", "-0.000056 | \n", "-0.000199 | \n", "-0.000207 | \n", "-0.000112 | \n", "0.000043 | \n", "0.000051 | \n", "
| 10 | \n", "chr1 | \n", "1002308 | \n", "T | \n", "C | \n", "TTLL10-AS1 | \n", "819107 | \n", "1343395 | \n", "- | \n", "163840 | \n", "170339 | \n", "... | \n", "-0.000278 | \n", "-0.000460 | \n", "-0.000305 | \n", "-0.000142 | \n", "-0.000220 | \n", "-0.000106 | \n", "-0.000170 | \n", "-0.000272 | \n", "-0.000170 | \n", "-0.000231 | \n", "
| 11 | \n", "chr1 | \n", "1002308 | \n", "T | \n", "C | \n", "ISG15 | \n", "837298 | \n", "1361586 | \n", "+ | \n", "163840 | \n", "177242 | \n", "... | \n", "0.007892 | \n", "0.005266 | \n", "0.008324 | \n", "0.007764 | \n", "-0.001580 | \n", "0.002468 | \n", "0.008656 | \n", "0.002925 | \n", "0.007485 | \n", "0.010022 | \n", "
| 12 | \n", "chr1 | \n", "1002308 | \n", "T | \n", "C | \n", "TNFRSF18 | \n", "846144 | \n", "1370432 | \n", "- | \n", "163840 | \n", "166924 | \n", "... | \n", "-0.000308 | \n", "-0.000433 | \n", "-0.000336 | \n", "-0.000197 | \n", "-0.000195 | \n", "-0.000144 | \n", "-0.000220 | \n", "-0.000190 | \n", "-0.000199 | \n", "-0.000302 | \n", "
| 13 | \n", "chr1 | \n", "1002308 | \n", "T | \n", "C | \n", "TNFRSF4 | \n", "853705 | \n", "1377993 | \n", "- | \n", "163840 | \n", "166653 | \n", "... | \n", "-0.000255 | \n", "-0.000385 | \n", "-0.000261 | \n", "-0.000158 | \n", "-0.000164 | \n", "-0.000123 | \n", "-0.000158 | \n", "-0.000281 | \n", "-0.000191 | \n", "-0.000319 | \n", "
| 14 | \n", "chr1 | \n", "1002308 | \n", "T | \n", "C | \n", "AGRN | \n", "856280 | \n", "1380568 | \n", "+ | \n", "163840 | \n", "199838 | \n", "... | \n", "-0.000901 | \n", "-0.001054 | \n", "-0.000771 | \n", "-0.001977 | \n", "-0.000437 | \n", "-0.000555 | \n", "-0.001084 | \n", "-0.000583 | \n", "-0.001613 | \n", "-0.000536 | \n", "
| 15 | \n", "chr1 | \n", "1002308 | \n", "T | \n", "C | \n", "SDF4 | \n", "871619 | \n", "1395907 | \n", "- | \n", "163840 | \n", "178999 | \n", "... | \n", "-0.000146 | \n", "-0.000230 | \n", "-0.000180 | \n", "-0.000099 | \n", "-0.000132 | \n", "-0.000082 | \n", "-0.000092 | \n", "-0.000189 | \n", "-0.000112 | \n", "-0.000195 | \n", "
| 16 | \n", "chr1 | \n", "1002308 | \n", "T | \n", "C | \n", "C1QTNF12 | \n", "886274 | \n", "1410562 | \n", "- | \n", "163840 | \n", "168116 | \n", "... | \n", "-0.000458 | \n", "-0.000697 | \n", "-0.000491 | \n", "-0.000359 | \n", "-0.000367 | \n", "-0.000241 | \n", "-0.000268 | \n", "-0.000487 | \n", "-0.000344 | \n", "-0.000595 | \n", "
| 17 | \n", "chr1 | \n", "1002308 | \n", "T | \n", "C | \n", "UBE2J2 | \n", "913437 | \n", "1437725 | \n", "- | \n", "163840 | \n", "183816 | \n", "... | \n", "-0.000815 | \n", "-0.001141 | \n", "-0.000897 | \n", "-0.000674 | \n", "-0.000717 | \n", "-0.000515 | \n", "-0.000520 | \n", "-0.000780 | \n", "-0.000614 | \n", "-0.001010 | \n", "
| 18 | \n", "chr1 | \n", "1002308 | \n", "T | \n", "C | \n", "ACAP3 | \n", "949161 | \n", "1473449 | \n", "- | \n", "163840 | \n", "181059 | \n", "... | \n", "-0.000748 | \n", "-0.001163 | \n", "-0.000843 | \n", "-0.000615 | \n", "-0.000704 | \n", "-0.000456 | \n", "-0.000404 | \n", "-0.000761 | \n", "-0.000572 | \n", "-0.000986 | \n", "
| 19 | \n", "chr1 | \n", "1002308 | \n", "T | \n", "C | \n", "INTS11 | \n", "964243 | \n", "1488531 | \n", "- | \n", "163840 | \n", "176946 | \n", "... | \n", "0.000021 | \n", "0.000008 | \n", "0.000037 | \n", "0.000035 | \n", "0.000096 | \n", "0.000057 | \n", "0.000009 | \n", "0.000184 | \n", "0.000039 | \n", "0.000044 | \n", "
| 20 | \n", "chr1 | \n", "1002308 | \n", "T | \n", "C | \n", "DVL1 | \n", "988970 | \n", "1513258 | \n", "- | \n", "163840 | \n", "177982 | \n", "... | \n", "-0.000325 | \n", "-0.000491 | \n", "-0.000359 | \n", "-0.000260 | \n", "-0.000322 | \n", "-0.000207 | \n", "-0.000179 | \n", "-0.000336 | \n", "-0.000235 | \n", "-0.000382 | \n", "
| 21 | \n", "chr1 | \n", "1002308 | \n", "T | \n", "C | \n", "MXRA8 | \n", "1001329 | \n", "1525617 | \n", "- | \n", "163840 | \n", "172928 | \n", "... | \n", "-0.000077 | \n", "-0.000098 | \n", "-0.000090 | \n", "-0.000067 | \n", "-0.000092 | \n", "-0.000057 | \n", "-0.000034 | \n", "-0.000212 | \n", "-0.000063 | \n", "-0.000159 | \n", "
| 22 | \n", "chr1 | \n", "109727471 | \n", "A | \n", "C | \n", "GNAT2 | \n", "109259481 | \n", "109783769 | \n", "- | \n", "163840 | \n", "180515 | \n", "... | \n", "0.000103 | \n", "0.000070 | \n", "0.000060 | \n", "0.000038 | \n", "0.000027 | \n", "0.000055 | \n", "0.000078 | \n", "0.000277 | \n", "0.000062 | \n", "0.000245 | \n", "
| 23 | \n", "chr1 | \n", "109728807 | \n", "TTT | \n", "G | \n", "GNAT2 | \n", "109259481 | \n", "109783769 | \n", "- | \n", "163840 | \n", "180515 | \n", "... | \n", "0.003317 | \n", "0.005164 | \n", "0.002698 | \n", "0.001438 | \n", "0.001558 | \n", "0.001273 | \n", "0.001937 | \n", "0.005484 | \n", "0.002190 | \n", "0.005321 | \n", "
| 24 | \n", "chr1 | \n", "109727471 | \n", "A | \n", "C | \n", "SYPL2 | \n", "109302706 | \n", "109826994 | \n", "+ | \n", "163840 | \n", "179428 | \n", "... | \n", "0.002225 | \n", "0.001688 | \n", "0.001366 | \n", "0.001251 | \n", "0.001342 | \n", "0.000177 | \n", "0.001402 | \n", "0.000480 | \n", "0.001663 | \n", "0.001764 | \n", "
| 25 | \n", "chr1 | \n", "109728807 | \n", "TTT | \n", "G | \n", "SYPL2 | \n", "109302706 | \n", "109826994 | \n", "+ | \n", "163840 | \n", "179428 | \n", "... | \n", "-0.004184 | \n", "-0.003700 | \n", "-0.003180 | \n", "-0.004169 | \n", "-0.003774 | \n", "-0.003399 | \n", "-0.003382 | \n", "0.000949 | \n", "-0.002237 | \n", "-0.002981 | \n", "
| 26 | \n", "chr1 | \n", "109727471 | \n", "A | \n", "C | \n", "ATXN7L2 | \n", "109319639 | \n", "109843927 | \n", "+ | \n", "163840 | \n", "173165 | \n", "... | \n", "-0.000055 | \n", "-0.000036 | \n", "0.000088 | \n", "-0.000085 | \n", "0.000037 | \n", "-0.000040 | \n", "-0.000056 | \n", "-0.000044 | \n", "-0.000046 | \n", "-0.000027 | \n", "
| 27 | \n", "chr1 | \n", "109728807 | \n", "TTT | \n", "G | \n", "ATXN7L2 | \n", "109319639 | \n", "109843927 | \n", "+ | \n", "163840 | \n", "173165 | \n", "... | \n", "0.000644 | \n", "-0.000063 | \n", "0.001706 | \n", "0.001486 | \n", "0.003162 | \n", "0.001671 | \n", "0.000299 | \n", "0.002102 | \n", "0.001007 | \n", "0.001831 | \n", "
| 28 | \n", "chr1 | \n", "109727471 | \n", "A | \n", "C | \n", "CYB561D1 | \n", "109330212 | \n", "109854500 | \n", "+ | \n", "163840 | \n", "172720 | \n", "... | \n", "0.000533 | \n", "0.000539 | \n", "0.000585 | \n", "0.000474 | \n", "0.000076 | \n", "0.000280 | \n", "0.000422 | \n", "-0.000033 | \n", "0.000436 | \n", "0.000369 | \n", "
| 29 | \n", "chr1 | \n", "109728807 | \n", "TTT | \n", "G | \n", "CYB561D1 | \n", "109330212 | \n", "109854500 | \n", "+ | \n", "163840 | \n", "172720 | \n", "... | \n", "0.003902 | \n", "0.002963 | \n", "0.001609 | \n", "0.002841 | \n", "0.000024 | \n", "0.000726 | \n", "0.001582 | \n", "0.000497 | \n", "0.002237 | \n", "-0.000092 | \n", "
| 30 | \n", "chr1 | \n", "109727471 | \n", "A | \n", "C | \n", "GPR61 | \n", "109376032 | \n", "109900320 | \n", "+ | \n", "163840 | \n", "172374 | \n", "... | \n", "0.000144 | \n", "0.000244 | \n", "0.000101 | \n", "0.000130 | \n", "-0.000119 | \n", "-0.000066 | \n", "0.000112 | \n", "0.000059 | \n", "0.000113 | \n", "0.000135 | \n", "
| 31 | \n", "chr1 | \n", "109728807 | \n", "TTT | \n", "G | \n", "GPR61 | \n", "109376032 | \n", "109900320 | \n", "+ | \n", "163840 | \n", "172374 | \n", "... | \n", "0.000287 | \n", "0.000869 | \n", "0.000338 | \n", "0.000516 | \n", "0.000702 | \n", "0.000260 | \n", "0.000547 | \n", "0.000815 | \n", "0.000190 | \n", "0.000561 | \n", "
| 32 | \n", "chr1 | \n", "109727471 | \n", "A | \n", "C | \n", "GSTM3 | \n", "109380590 | \n", "109904878 | \n", "- | \n", "163840 | \n", "170946 | \n", "... | \n", "-0.000685 | \n", "-0.000671 | \n", "-0.000490 | \n", "-0.000305 | \n", "-0.000203 | \n", "-0.000045 | \n", "-0.000183 | \n", "-0.000423 | \n", "-0.000412 | \n", "-0.000544 | \n", "
| 33 | \n", "chr1 | \n", "109728807 | \n", "TTT | \n", "G | \n", "GSTM3 | \n", "109380590 | \n", "109904878 | \n", "- | \n", "163840 | \n", "170946 | \n", "... | \n", "0.014859 | \n", "0.029183 | \n", "0.015364 | \n", "0.007996 | \n", "0.015255 | \n", "0.007950 | \n", "0.010278 | \n", "0.021851 | \n", "0.009230 | \n", "0.024402 | \n", "
| 34 | \n", "chr1 | \n", "109727471 | \n", "A | \n", "C | \n", "GNAI3 | \n", "109384775 | \n", "109909063 | \n", "+ | \n", "163840 | \n", "233549 | \n", "... | \n", "0.002294 | \n", "0.002954 | \n", "0.003762 | \n", "0.001515 | \n", "-0.001879 | \n", "-0.003638 | \n", "0.004167 | \n", "-0.000977 | \n", "0.003568 | \n", "0.001709 | \n", "
| 35 | \n", "chr1 | \n", "109728807 | \n", "TTT | \n", "G | \n", "GNAI3 | \n", "109384775 | \n", "109909063 | \n", "+ | \n", "163840 | \n", "233549 | \n", "... | \n", "-0.002409 | \n", "-0.002181 | \n", "0.001515 | \n", "0.007504 | \n", "0.011276 | \n", "0.019385 | \n", "-0.002945 | \n", "0.020405 | \n", "-0.001569 | \n", "0.007003 | \n", "
| 36 | \n", "chr1 | \n", "109727471 | \n", "A | \n", "C | \n", "AMPD2 | \n", "109452264 | \n", "109976552 | \n", "+ | \n", "163840 | \n", "179789 | \n", "... | \n", "0.000565 | \n", "0.001265 | \n", "0.001679 | \n", "-0.000034 | \n", "-0.002686 | \n", "-0.000878 | \n", "0.001329 | \n", "-0.001112 | \n", "0.002059 | \n", "0.000288 | \n", "
| 37 | \n", "chr1 | \n", "109728807 | \n", "TTT | \n", "G | \n", "AMPD2 | \n", "109452264 | \n", "109976552 | \n", "+ | \n", "163840 | \n", "179789 | \n", "... | \n", "0.015521 | \n", "0.005221 | \n", "0.011660 | \n", "0.028807 | \n", "0.010368 | \n", "0.014050 | \n", "0.007810 | \n", "0.026553 | \n", "0.009914 | \n", "0.026500 | \n", "
| 38 | \n", "chr1 | \n", "109727471 | \n", "A | \n", "C | \n", "GSTM4 | \n", "109492259 | \n", "110016547 | \n", "+ | \n", "163840 | \n", "182577 | \n", "... | \n", "-0.000140 | \n", "0.001370 | \n", "0.000755 | \n", "0.000528 | \n", "-0.000446 | \n", "-0.000184 | \n", "-0.001062 | \n", "0.000593 | \n", "0.000575 | \n", "0.002940 | \n", "
| 39 | \n", "chr1 | \n", "109728807 | \n", "TTT | \n", "G | \n", "GSTM4 | \n", "109492259 | \n", "110016547 | \n", "+ | \n", "163840 | \n", "182577 | \n", "... | \n", "-0.032480 | \n", "-0.033616 | \n", "-0.029502 | \n", "-0.050562 | \n", "-0.030190 | \n", "-0.021981 | \n", "-0.012192 | \n", "-0.029633 | \n", "-0.037296 | \n", "-0.067220 | \n", "
| 40 | \n", "chr1 | \n", "109727471 | \n", "A | \n", "C | \n", "GSTM2 | \n", "109504182 | \n", "110028470 | \n", "+ | \n", "163840 | \n", "205369 | \n", "... | \n", "-0.001281 | \n", "-0.001583 | \n", "-0.000117 | \n", "-0.000501 | \n", "-0.001837 | \n", "-0.001011 | \n", "-0.002222 | \n", "0.000031 | \n", "0.000068 | \n", "0.000062 | \n", "
| 41 | \n", "chr1 | \n", "109728807 | \n", "TTT | \n", "G | \n", "GSTM2 | \n", "109504182 | \n", "110028470 | \n", "+ | \n", "163840 | \n", "205369 | \n", "... | \n", "0.006389 | \n", "0.010391 | \n", "0.008292 | \n", "0.010647 | \n", "-0.005511 | \n", "0.002638 | \n", "-0.004853 | \n", "-0.009829 | \n", "0.008542 | \n", "0.011590 | \n", "
| 42 | \n", "chr1 | \n", "109727471 | \n", "A | \n", "C | \n", "GSTM1 | \n", "109523974 | \n", "110048262 | \n", "+ | \n", "163840 | \n", "185065 | \n", "... | \n", "0.001077 | \n", "0.002305 | \n", "0.001138 | \n", "-0.000056 | \n", "-0.000738 | \n", "0.000059 | \n", "0.000456 | \n", "-0.000396 | \n", "0.000904 | \n", "0.000512 | \n", "
| 43 | \n", "chr1 | \n", "109728807 | \n", "TTT | \n", "G | \n", "GSTM1 | \n", "109523974 | \n", "110048262 | \n", "+ | \n", "163840 | \n", "185065 | \n", "... | \n", "0.009587 | \n", "0.012155 | \n", "0.002769 | \n", "0.018908 | \n", "0.010602 | \n", "0.000302 | \n", "0.003231 | \n", "0.007630 | \n", "0.011715 | \n", "0.019595 | \n", "
| 44 | \n", "chr1 | \n", "109727471 | \n", "A | \n", "C | \n", "GSTM5 | \n", "109547940 | \n", "110072228 | \n", "+ | \n", "163840 | \n", "227488 | \n", "... | \n", "0.001978 | \n", "0.001395 | \n", "0.001501 | \n", "0.000012 | \n", "-0.000538 | \n", "-0.000914 | \n", "0.002817 | \n", "-0.001998 | \n", "0.001149 | \n", "0.002069 | \n", "
| 45 | \n", "chr1 | \n", "109728807 | \n", "TTT | \n", "G | \n", "GSTM5 | \n", "109547940 | \n", "110072228 | \n", "+ | \n", "163840 | \n", "227488 | \n", "... | \n", "-0.004803 | \n", "0.004060 | \n", "-0.018828 | \n", "-0.000383 | \n", "0.042374 | \n", "0.022364 | \n", "-0.023450 | \n", "0.043353 | \n", "0.006033 | \n", "-0.006614 | \n", "
| 46 | \n", "chr1 | \n", "109727471 | \n", "A | \n", "C | \n", "ALX3 | \n", "109710224 | \n", "110234512 | \n", "- | \n", "163840 | \n", "174642 | \n", "... | \n", "0.000218 | \n", "0.000532 | \n", "0.000263 | \n", "0.000122 | \n", "0.000352 | \n", "0.000184 | \n", "0.000139 | \n", "0.000887 | \n", "0.000173 | \n", "0.000558 | \n", "
| 47 | \n", "chr1 | \n", "109728807 | \n", "TTT | \n", "G | \n", "ALX3 | \n", "109710224 | \n", "110234512 | \n", "- | \n", "163840 | \n", "174642 | \n", "... | \n", "-0.000386 | \n", "-0.000480 | \n", "-0.000415 | \n", "-0.000092 | \n", "-0.000513 | \n", "-0.000241 | \n", "-0.000285 | \n", "-0.000141 | \n", "-0.000277 | \n", "-0.000758 | \n", "
48 rows × 8870 columns
\n", "| \n", " | chrom | \n", "pos | \n", "ref | \n", "alt | \n", "gene | \n", "start | \n", "end | \n", "strand | \n", "gene_mask_start | \n", "gene_mask_end | \n", "rel_pos | \n", "ref_tx | \n", "alt_tx | \n", "tss_dist | \n", "
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | \n", "chr1 | \n", "1000018 | \n", "G | \n", "A | \n", "FAM41C | \n", "516455 | \n", "1040743 | \n", "- | \n", "163840 | \n", "172672 | \n", "40725 | \n", "C | \n", "T | \n", "-123115 | \n", "
| 1 | \n", "chr1 | \n", "1002308 | \n", "T | \n", "C | \n", "FAM41C | \n", "516455 | \n", "1040743 | \n", "- | \n", "163840 | \n", "172672 | \n", "38435 | \n", "A | \n", "G | \n", "-125405 | \n", "
| 2 | \n", "chr1 | \n", "1000018 | \n", "G | \n", "A | \n", "NOC2L | \n", "598861 | \n", "1123149 | \n", "- | \n", "163840 | \n", "178946 | \n", "123131 | \n", "C | \n", "T | \n", "-40709 | \n", "
| 3 | \n", "chr1 | \n", "1002308 | \n", "T | \n", "C | \n", "NOC2L | \n", "598861 | \n", "1123149 | \n", "- | \n", "163840 | \n", "178946 | \n", "120841 | \n", "A | \n", "G | \n", "-42999 | \n", "
| 4 | \n", "chr1 | \n", "1000018 | \n", "G | \n", "A | \n", "PERM1 | \n", "621645 | \n", "1145933 | \n", "- | \n", "163840 | \n", "170729 | \n", "145915 | \n", "C | \n", "T | \n", "-17925 | \n", "
| ... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
| 77 | \n", "chr1 | \n", "109728286 | \n", "TTT | \n", "G | \n", "GSTM5 | \n", "109547940 | \n", "110072228 | \n", "+ | \n", "163840 | \n", "227488 | \n", "180346 | \n", "TTT | \n", "G | \n", "16506 | \n", "
| 78 | \n", "chr1 | \n", "109728807 | \n", "T | \n", "GG | \n", "GSTM5 | \n", "109547940 | \n", "110072228 | \n", "+ | \n", "163840 | \n", "227488 | \n", "180867 | \n", "T | \n", "GG | \n", "17027 | \n", "
| 79 | \n", "chr1 | \n", "109727471 | \n", "A | \n", "C | \n", "ALX3 | \n", "109710224 | \n", "110234512 | \n", "- | \n", "163840 | \n", "174642 | \n", "507041 | \n", "T | \n", "G | \n", "343201 | \n", "
| 80 | \n", "chr1 | \n", "109728286 | \n", "TTT | \n", "G | \n", "ALX3 | \n", "109710224 | \n", "110234512 | \n", "- | \n", "163840 | \n", "174642 | \n", "506226 | \n", "AAA | \n", "C | \n", "342386 | \n", "
| 81 | \n", "chr1 | \n", "109728807 | \n", "T | \n", "GG | \n", "ALX3 | \n", "109710224 | \n", "110234512 | \n", "- | \n", "163840 | \n", "174642 | \n", "505705 | \n", "A | \n", "CC | \n", "341865 | \n", "
82 rows × 14 columns
\n", "