MAF - adding allele frequency to VCF files

Goals

Individual-level MAF: Assign minimal allele frequency (MAF) information to a VCF file generated using the nf-core/sarek pipeline
Population-level MAF: Add population-based MAF to annotated variants using public databases such as Mafdb.gnomAD and dbSNP

VCF files generated by the nextflow nf-core/sarek pipeline

In the sarek pipeline, for example, VCF files generated by HaplotypeCaller can be found at:

results/VariantCalling/sampleID/HaplotypeCaller/HaplotypeCaller_sampleID.vcf

Annotated VCF files using Variant Effect Predictor (VEP) can be found at:

results/Annotation/sampleID/VEP/HaplotypeCaller_sampleID_VEP.ann.vcf

Alternatively if annotated using snpEff

results/Annotation/sampleID/snpEff/HaplotypeCaller_sampleID_snpEff.ann.vcf

Example of VCF file annotated using snpEff. Note the metadata header information is not shown.

#CHROM  POS     ID      REF     ALT     QUAL    FILTER  INFO    FORMAT  FBS1-LNCAP-RNA
chr1    14542   rs1045833       A       G       71.84   .       AC=2;AF=1.00;AN=2;DB;DP=3;ExcessHet=3.0103;FS=0.000;MLEAC=1;MLEAF=0.500;MQ=23.70;QD=23.95;SOR=2.833;ANN=G|downstream_gene_variant|MODIFIER|DDX11L1|ENSG00000223972|transcript|ENST00000456328.2|processed_transcript||n.*133A>G|||||133|,G|downstream_gene_variant|MODIFIER|MIR6859-1|ENSG00000278267|transcript|ENST00000619216.1|miRNA||n.*2827T>C|||||2827|,G|intron_variant|MODIFIER|WASH7P|ENSG00000227232|transcript|ENST00000488147.1|unprocessed_pseudogene|10/10|n.1254-41T>C||||||     GT:AD:DP:GQ:PL  1/1:0,3:3:9:85,9,0
chr1    14574   rs28503599      A       G       121.05  .       AC=2;AF=1.00;AN=2;DB;DP=10;ExcessHet=3.0103;FS=0.000;MLEAC=2;MLEAF=1.00;MQ=22.52;QD=12.10;SOR=4.804;ANN=G|downstream_gene_variant|MODIFIER|DDX11L1|ENSG00000223972|transcript|ENST00000456328.2|processed_transcript||n.*165A>G|||||165|,G|downstream_gene_variant|MODIFIER|MIR6859-1|ENSG00000278267|transcript|ENST00000619216.1|miRNA||n.*2795T>C|||||2795|,G|intron_variant|MODIFIER|WASH7P|ENSG00000227232|transcript|ENST00000488147.1|unprocessed_pseudogene|10/10|n.1254-73T>C||||||     GT:AD:DP:GQ:PL  1/1:0,10:10:27:135,27,0
chr1    14599   rs531646671     T       A       301.02  .       AC=2;AF=1.00;AN=2;DB;DP=7;ExcessHet=3.0103;FS=0.000;MLEAC=2;MLEAF=1.00;MQ=22.00;QD=25.36;SOR=4.174;ANN=A|downstream_gene_variant|MODIFIER|DDX11L1|ENSG00000223972|transcript|ENST00000456328.2|processed_transcript||n.*190T>A|||||190|,A|downstream_gene_variant|MODIFIER|MIR6859-1|ENSG00000278267|transcript|ENST00000619216.1|miRNA||n.*2770A>T|||||2770|,A|intron_variant|MODIFIER|WASH7P|ENSG00000227232|transcript|ENST00000488147.1|unprocessed_pseudogene|10/10|n.1254-98A>T||||||      GT:AD:DP:GQ:PGT:PID:PL:PS       1|1:0,7:7:21:1|1:14599_T_A:315,21,0:14599
chr1    14604   rs541940975     A       G       356.05  .       AC=2;AF=1.00;AN=2;DB;DP=9;ExcessHet=3.0103;FS=0.000;MLEAC=2;MLEAF=1.00;MQ=22.23;QD=28.73;SOR=3.056;ANN=G|downstream_gene_variant|MODIFIER|DDX11L1|ENSG00000223972|transcript|ENST00000456328.2|processed_transcript||n.*195A>G|||||195|,G|downstream_gene_variant|MODIFIER|MIR6859-1|ENSG00000278267|transcript|ENST00000619216.1|miRNA||n.*2765T>C|||||2765|,G|intron_variant|MODIFIER|WASH7P|ENSG00000227232|transcript|ENST00000488147.1|unprocessed_pseudogene|10/10|n.1254-103T>C||||||     GT:AD:DP:GQ:PGT:PID:PL:PS       1|1:0,9:9:27:1|1:14599_T_A:370,27,0:14599
chr1    14610   .       T       C       356.05  .       AC=2;AF=1.00;AN=2;DP=9;ExcessHet=3.0103;FS=0.000;MLEAC=2;MLEAF=1.00;MQ=22.23;QD=30.97;SOR=3.056;ANN=C|downstream_gene_variant|MODIFIER|DDX11L1|ENSG00000223972|transcript|ENST00000456328.2|processed_transcript||n.*201T>C|||||201|,C|downstream_gene_variant|MODIFIER|MIR6859-1|ENSG00000278267|transcript|ENST00000619216.1|miRNA||n.*2759A>G|||||2759|,C|intron_variant|MODIFIER|WASH7P|ENSG00000227232|transcript|ENST00000488147.1|unprocessed_pseudogene|10/10|n.1254-109A>G||||||        GT:AD:DP:GQ:PGT:PID:PL:PS       1|1:0,9:9:27:1|1:14599_T_A:370,27,0:14599
chr1    14653   rs62635297      C       T       1816.06 .       AC=2;AF=1.00;AN=2;DB;DP=67;ExcessHet=3.0103;FS=0.000;MLEAC=2;MLEAF=1.00;MQ=34.03;QD=27.94;SOR=2.412;ANN=T|downstream_gene_variant|MODIFIER|DDX11L1|ENSG00000223972|transcript|ENST00000456328.2|processed_transcript||n.*244C>T|||||244|,T|downstream_gene_variant|MODIFIER|MIR6859-1|ENSG00000278267|transcript|ENST00000619216.1|miRNA||n.*2716G>A|||||2716|,T|intron_variant|MODIFIER|WASH7P|ENSG00000227232|transcript|ENST00000488147.1|unprocessed_pseudogene|10/10|n.1254-152G>A||||||    GT:AD:DP:GQ:PL  1/1:0,65:65:99:1830,195,0
chr1    14677   rs201327123     G       A       926.64  .       AC=1;AF=0.500;AN=2;BaseQRankSum=2.83;DB;DP=113;ExcessHet=3.0103;FS=1.545;MLEAC=1;MLEAF=0.500;MQ=37.82;MQRankSum=-1.398e+00;QD=8.35;ReadPosRankSum=0.962;SOR=0.852;ANN=A|downstream_gene_variant|MODIFIER|DDX11L1|ENSG00000223972|transcript|ENST00000456328.2|processed_transcript||n.*268G>A|||||268|,A|downstream_gene_variant|MODIFIER|MIR6859-1|ENSG00000278267|transcript|ENST00000619216.1|miRNA||n.*2692C>T|||||2692|,A|intron_variant|MODIFIER|WASH7P|ENSG00000227232|transcript|ENST00000488147.1|unprocessed_pseudogene|10/10|n.1254-176C>T||||||      GT:AD:DP:GQ:PL  0/1:63,48:111:99:934,0,1266
chr1    16257   rs11489794      G       C       49.64   .       AC=1;AF=0.500;AN=2;BaseQRankSum=-1.136e+00;DB;DP=23;ExcessHet=3.0103;FS=0.000;MLEAC=1;MLEAF=0.500;MQ=34.10;MQRankSum=0.381;QD=2.16;ReadPosRankSum=0.00;SOR=1.022;ANN=C|downstream_gene_variant|MODIFIER|DDX11L1|ENSG00000223972|transcript|ENST00000456328.2|processed_transcript||n.*1848G>C|||||1848|,C|downstream_gene_variant|MODIFIER|MIR6859-1|ENSG00000278267|transcript|ENST00000619216.1|miRNA||n.*1112C>G|||||1112|,C|intron_variant|MODIFIER|WASH7P|ENSG00000227232|transcript|ENST00000488147.1|unprocessed_pseudogene|8/10|n.1068-310C>G||||||      GT:AD:DP:GQ:PL  0/1:18,5:23:57:57,0,384
chr1    16288   rs113141985     C       G       48.64   .       AC=1;AF=0.500;AN=2;BaseQRankSum=-1.150e+00;DB;DP=9;ExcessHet=3.0103;FS=0.000;MLEAC=1;MLEAF=0.500;MQ=32.24;MQRankSum=-1.350e-01;QD=6.08;ReadPosRankSum=-1.029e+00;SOR=0.307;ANN=G|downstream_gene_variant|MODIFIER|DDX11L1|ENSG00000223972|transcript|ENST00000456328.2|processed_transcript||n.*1879C>G|||||1879|,G|downstream_gene_variant|MODIFIER|MIR6859-1|ENSG00000278267|transcript|ENST00000619216.1|miRNA||n.*1081G>C|||||1081|,G|intron_variant|MODIFIER|WASH7P|ENSG00000227232|transcript|ENST00000488147.1|unprocessed_pseudogene|8/10|n.1067+319G>C||||||    GT:AD:DP:GQ:PL  0/1:5,3:8:56:56,0,107
chr1    16298   rs62636498      C       T       112.14  .       AC=2;AF=1.00;AN=2;DB;DP=4;ExcessHet=3.0103;FS=0.000;MLEAC=2;MLEAF=1.00;MQ=22.25;QD=28.04;SOR=3.258;ANN=T|downstream_gene_variant|MODIFIER|DDX11L1|ENSG00000223972|transcript|ENST00000456328.2|processed_transcript||n.*1889C>T|||||1889|,T|downstream_gene_variant|MODIFIER|MIR6859-1|ENSG00000278267|transcript|ENST00000619216.1|miRNA||n.*1071G>A|||||1071|,T|intron_variant|MODIFIER|WASH7P|ENSG00000227232|transcript|ENST00000488147.1|unprocessed_pseudogene|8/10|n.1067+309G>A||||||    GT:AD:DP:GQ:PL  1/1:0,4:4:12:126,12,0
chr1    136048  rs371677125     C       T       125.14  .       AC=2;AF=1.00;AN=2;DB;DP=4;ExcessHet=3.0103;FS=0.000;MLEAC=2;MLEAF=1.00;MQ=40.00;QD=31.29;SOR=0.693;ANN=T|upstream_gene_variant|MODIFIER|RP11-34P13.15|ENSG00000268903|transcript|ENST00000494149.2|processed_pseudogene||n.-153G>A|||||153|,T|downstream_gene_variant|MODIFIER|RP11-34P13.14|ENSG00000239906|transcript|ENST00000493797.1|antisense||n.*3742G>A|||||3742|,T|downstream_gene_variant|MODIFIER|CICP27|ENSG00000233750|transcript|ENST00000442987.3|processed_pseudogene||n.*1212C>T|||||1212|,T|downstream_gene_variant|MODIFIER|RP11-34P13.16|ENSG00000269981|transcript|ENST00000595919.1|processed_pseudogene||n.*1634G>A|||||1634|,T|intergenic_region|MODIFIER|RP11-34P13.15-RP11-34P13.16|ENSG00000268903-ENSG00000269981|intergenic_region|ENSG00000268903-ENSG00000269981|||n.136048C>T||||||       GT:AD:DP:GQ:PGT:PID:PL:PS       1|1:0,4:4:12:1|1:136048_C_T:139,12,0:136048
chr1    136573  .       T       C       113.97  .       AC=2;AF=1.00;AN=2;DP=7;ExcessHet=3.0103;FS=0.000;MLEAC=2;MLEAF=1.00;MQ=49.62;QD=19.00;SOR=1.329;ANN=C|TF_binding_site_variant|LOW|||Egr1|MA0162.2|||n.136573A>G||||||,C|upstream_gene_variant|MODIFIER|RP11-34P13.15|ENSG00000268903|transcript|ENST00000494149.2|processed_pseudogene||n.-678A>G|||||678|,C|downstream_gene_variant|MODIFIER|RP11-34P13.14|ENSG00000239906|transcript|ENST00000493797.1|antisense||n.*3217A>G|||||3217|,C|downstream_gene_variant|MODIFIER|RP11-34P13.13|ENSG00000241860|transcript|ENST00000484859.1|antisense||n.*4901A>G|||||4901|,C|downstream_gene_variant|MODIFIER|CICP27|ENSG00000233750|transcript|ENST00000442987.3|processed_pseudogene||n.*1737T>C|||||1737|,C|downstream_gene_variant|MODIFIER|RP11-34P13.16|ENSG00000269981|transcript|ENST00000595919.1|processed_pseudogene||n.*1109A>G|||||1109|,C|intergenic_region|MODIFIER|RP11-34P13.15-RP11-34P13.16|ENSG00000268903-ENSG00000269981|intergenic_region|ENSG00000268903-ENSG00000269981|||n.136573T>C||||||   GT:AD:DP:GQ:PL  1/1:0,6:6:18:128,18,0
chr1    136962  rs373582709     C       T       118.68  .       AC=1;AF=0.500;AN=2;BaseQRankSum=-8.870e-01;DB;DP=8;ExcessHet=3.0103;FS=0.000;MLEAC=1;MLEAF=0.500;MQ=50.36;MQRankSum=0.489;QD=16.95;ReadPosRankSum=0.489;SOR=0.330;ANN=T|TF_binding_site_variant|MODIFIER|||Egr1|MA0162.2|||n.136962G>A||||||,T|upstream_gene_variant|MODIFIER|RP11-34P13.15|ENSG00000268903|transcript|ENST00000494149.2|processed_pseudogene||n.-1067G>A|||||1067|,T|downstream_gene_variant|MODIFIER|RP11-34P13.14|ENSG00000239906|transcript|ENST00000493797.1|antisense||n.*2828G>A|||||2828|,T|downstream_gene_variant|MODIFIER|RP11-34P13.13|ENSG00000241860|transcript|ENST00000484859.1|antisense||n.*4512G>A|||||4512|,T|downstream_gene_variant|MODIFIER|CICP27|ENSG00000233750|transcript|ENST00000442987.3|processed_pseudogene||n.*2126C>T|||||2126|,T|downstream_gene_variant|MODIFIER|RP11-34P13.16|ENSG00000269981|transcript|ENST00000595919.1|processed_pseudogene||n.*720G>A|||||720|,T|intergenic_region|MODIFIER|RP11-34P13.15-RP11-34P13.16|ENSG00000268903-ENSG00000269981|intergenic_region|ENSG00000268903-ENSG00000269981|||n.136962C>T||||||    GT:AD:DP:GQ:PL  0/1:1,6:8:10:126,0,10
chr1    137622  rs376555721     G       A       54.66   .       AC=1;AF=0.500;AN=2;BaseQRankSum=0.674;DB;DP=4;ExcessHet=3.0103;FS=6.021;MLEAC=1;MLEAF=0.500;MQ=20.00;MQRankSum=0.00;QD=13.67;ReadPosRankSum=-3.190e-01;SOR=2.788;ANN=A|upstream_gene_variant|MODIFIER|RP11-34P13.15|ENSG00000268903|transcript|ENST00000494149.2|processed_pseudogene||n.-1727C>T|||||1727|,A|downstream_gene_variant|MODIFIER|RP11-34P13.14|ENSG00000239906|transcript|ENST00000493797.1|antisense||n.*2168C>T|||||2168|,A|downstream_gene_variant|MODIFIER|RP11-34P13.13|ENSG00000241860|transcript|ENST00000484859.1|antisense||n.*3852C>T|||||3852|,A|downstream_gene_variant|MODIFIER|CICP27|ENSG00000233750|transcript|ENST00000442987.3|processed_pseudogene||n.*2786G>A|||||2786|,A|downstream_gene_variant|MODIFIER|RP11-34P13.16|ENSG00000269981|transcript|ENST00000595919.1|processed_pseudogene||n.*60C>T|||||60|,A|intergenic_region|MODIFIER|RP11-34P13.15-RP11-34P13.16|ENSG00000268903-ENSG00000269981|intergenic_region|ENSG00000268903-ENSG00000269981|||n.137622G>A||||||      GT:AD:DP:GQ:PL  0/1:1,3:4:13:62,0,13
chr1    137825  rs147252685     G       A       622.06  .       AC=2;AF=1.00;AN=2;DB;DP=26;ExcessHet=3.0103;FS=0.000;MLEAC=2;MLEAF=1.00;MQ=36.46;QD=24.88;SOR=0.770;ANN=A|upstream_gene_variant|MODIFIER|RP11-34P13.15|ENSG00000268903|transcript|ENST00000494149.2|processed_pseudogene||n.-1930C>T|||||1930|,A|downstream_gene_variant|MODIFIER|RP11-34P13.14|ENSG00000239906|transcript|ENST00000493797.1|antisense||n.*1965C>T|||||1965|,A|downstream_gene_variant|MODIFIER|RP11-34P13.13|ENSG00000241860|transcript|ENST00000484859.1|antisense||n.*3649C>T|||||3649|,A|downstream_gene_variant|MODIFIER|CICP27|ENSG00000233750|transcript|ENST00000442987.3|processed_pseudogene||n.*2989G>A|||||2989|,A|non_coding_transcript_exon_variant|MODIFIER|RP11-34P13.16|ENSG00000269981|transcript|ENST00000595919.1|processed_pseudogene|1/1|n.141C>T||||||     GT:AD:DP:GQ:PL  1/1:0,25:25:75:636,75,0
chr1    138156  rs370691115     G       T       197.04  .       AC=2;AF=1.00;AN=2;DB;DP=8;ExcessHet=3.0103;FS=0.000;MLEAC=2;MLEAF=1.00;MQ=22.00;QD=24.63;SOR=0.693;ANN=T|upstream_gene_variant|MODIFIER|RP11-34P13.15|ENSG00000268903|transcript|ENST00000494149.2|processed_pseudogene||n.-2261C>A|||||2261|,T|upstream_gene_variant|MODIFIER|RP11-34P13.16|ENSG00000269981|transcript|ENST00000595919.1|processed_pseudogene||n.-191C>A|||||191|,T|downstream_gene_variant|MODIFIER|RP11-34P13.14|ENSG00000239906|transcript|ENST00000493797.1|antisense||n.*1634C>A|||||1634|,T|downstream_gene_variant|MODIFIER|RP11-34P13.13|ENSG00000241860|transcript|ENST00000484859.1|antisense||n.*3318C>A|||||3318|,T|downstream_gene_variant|MODIFIER|CICP27|ENSG00000233750|transcript|ENST00000442987.3|processed_pseudogene||n.*3320G>T|||||3320|,T|intergenic_region|MODIFIER|RP11-34P13.16-RP11-34P13.14|ENSG00000269981-ENSG00000239906|intergenic_region|ENSG00000269981-ENSG00000239906|||n.138156G>T||||||   GT:AD:DP:GQ:PL  1/1:0,8:8:24:211,24,0
chr1    138817  rs556938922     T       C       945.06  .       AC=2;AF=1.00;AN=2;DB;DP=45;ExcessHet=3.0103;FS=0.000;MLEAC=2;MLEAF=1.00;MQ=35.16;QD=21.98;SOR=0.739;ANN=C|upstream_gene_variant|MODIFIER|RP11-34P13.15|ENSG00000268903|transcript|ENST00000494149.2|processed_pseudogene||n.-2922A>G|||||2922|,C|upstream_gene_variant|MODIFIER|RP11-34P13.16|ENSG00000269981|transcript|ENST00000595919.1|processed_pseudogene||n.-852A>G|||||852|,C|downstream_gene_variant|MODIFIER|RP11-34P13.14|ENSG00000239906|transcript|ENST00000493797.1|antisense||n.*973A>G|||||973|,C|downstream_gene_variant|MODIFIER|RP11-34P13.13|ENSG00000241860|transcript|ENST00000484859.1|antisense||n.*2657A>G|||||2657|,C|downstream_gene_variant|MODIFIER|CICP27|ENSG00000233750|transcript|ENST00000442987.3|processed_pseudogene||n.*3981T>C|||||3981|,C|intergenic_region|MODIFIER|RP11-34P13.16-RP11-34P13.14|ENSG00000269981-ENSG00000239906|intergenic_region|ENSG00000269981-ENSG00000239906|||n.138817T>C||||||    GT:AD:DP:GQ:PL  1/1:0,43:43:99:959,126,0
chr1    184246  .       T       C       52.84   .       AC=2;AF=1.00;AN=2;DP=4;ExcessHet=3.0103;FS=0.000;MLEAC=1;MLEAF=0.500;MQ=41.80;QD=17.61;SOR=1.179;ANN=C|downstream_gene_variant|MODIFIER|FO538757.2|ENSG00000279928|transcript|ENST00000624431.1|protein_coding||c.*88T>C|||||88|,C|downstream_gene_variant|MODIFIER|FO538757.1|ENSG00000279457|transcript|ENST00000623083.3|protein_coding||c.*971A>G|||||679|,C|downstream_gene_variant|MODIFIER|MIR6859-2|ENSG00000273874|transcript|ENST00000612080.1|miRNA||n.*3645A>G|||||3645|,C|intergenic_region|MODIFIER|FO538757.2-FO538757.1|ENSG00000279928-ENSG00000279457|intergenic_region|ENSG00000279928-ENSG00000279457|||n.184246T>C||||||     GT:AD:DP:GQ:PL  1/1:0,3:3:9:66,9,0
chr1    185194  .       G       C       91.64   .       AC=1;AF=0.500;AN=2;BaseQRankSum=-1.345e+00;DP=10;ExcessHet=3.0103;FS=4.260;MLEAC=1;MLEAF=0.500;MQ=24.41;MQRankSum=-1.150e+00;QD=11.45;ReadPosRankSum=0.00;SOR=2.833;ANN=C|3_prime_UTR_variant|MODIFIER|FO538757.1|ENSG00000279457|transcript|ENST00000623083.3|protein_coding|11/11|c.*23C>G|||||23|,C|downstream_gene_variant|MODIFIER|FO538757.2|ENSG00000279928|transcript|ENST00000624431.1|protein_coding||c.*1036G>C|||||1036|,C|downstream_gene_variant|MODIFIER|MIR6859-2|ENSG00000273874|transcript|ENST00000612080.1|miRNA||n.*2697C>G|||||2697|       GT:AD:DP:GQ:PL  0/1:3,5:8:65:99,0,65

Individual-level MAF: adding MAF information using bcftools

At the individual-level expected allelic frequencies for alternative alleles (minor alleles) can be either 1.0 (homozygous), 0.5 (heterozygous) or 0.0 (absent) if it is absent in the patient when screening againts a reference set of genetic variants.

The following command line adds MAF information to either annotated or non-annotated VCF files.

#non-annotated file:
bcftools +fill-tags HaplotypeCaller_sampleID.vcf > HaplotypeCaller_sampleID_tags.vcf

#VEP annotated file:
bcftools +fill-tags HaplotypeCaller_sampleID_VEP.ann.vcf > HaplotypeCaller_sampleID_VEP_tags.ann.vcf

#snpEff annotated file:
bcftools +fill-tags HaplotypeCaller_sampleID_snpEff.ann.vcf > HaplotypeCaller_sampleID_snpEff_tags.ann.vcf

For the example shown above, find the added MAF information to the VCF annotated using snpEff.

#CHROM  POS     ID      REF     ALT     QUAL    FILTER  INFO    FORMAT  FBS1-LNCAP-RNA
chr1    14542   rs1045833       A       G       71.84   .       AC=2;AF=1;AN=2;DB;DP=3;ExcessHet=3.0103;FS=0;MLEAC=1;MLEAF=0.5;MQ=23.7;QD=23.95;SOR=2.833;ANN=G|downstream_gene_variant|MODIFIER|DDX11L1|ENSG00000223972|transcript|ENST00000456328.2|processed_transcript||n.*133A>G|||||133|,G|downstream_gene_variant|MODIFIER|MIR6859-1|ENSG00000278267|transcript|ENST00000619216.1|miRNA||n.*2827T>C|||||2827|,G|intron_variant|MODIFIER|WASH7P|ENSG00000227232|transcript|ENST00000488147.1|unprocessed_pseudogene|10/10|n.1254-41T>C||||||;NS=1;MAF=0;AC_Het=0;AC_Hom=2;AC_Hemi=0;HWE=1;ExcHet=1 GT:AD:DP:GQ:PL  1/1:0,3:3:9:85,9,0
chr1    14574   rs28503599      A       G       121.05  .       AC=2;AF=1;AN=2;DB;DP=10;ExcessHet=3.0103;FS=0;MLEAC=2;MLEAF=1;MQ=22.52;QD=12.1;SOR=4.804;ANN=G|downstream_gene_variant|MODIFIER|DDX11L1|ENSG00000223972|transcript|ENST00000456328.2|processed_transcript||n.*165A>G|||||165|,G|downstream_gene_variant|MODIFIER|MIR6859-1|ENSG00000278267|transcript|ENST00000619216.1|miRNA||n.*2795T>C|||||2795|,G|intron_variant|MODIFIER|WASH7P|ENSG00000227232|transcript|ENST00000488147.1|unprocessed_pseudogene|10/10|n.1254-73T>C||||||;NS=1;MAF=0;AC_Het=0;AC_Hom=2;AC_Hemi=0;HWE=1;ExcHet=1  GT:AD:DP:GQ:PL  1/1:0,10:10:27:135,27,0
chr1    14599   rs531646671     T       A       301.02  .       AC=2;AF=1;AN=2;DB;DP=7;ExcessHet=3.0103;FS=0;MLEAC=2;MLEAF=1;MQ=22;QD=25.36;SOR=4.174;ANN=A|downstream_gene_variant|MODIFIER|DDX11L1|ENSG00000223972|transcript|ENST00000456328.2|processed_transcript||n.*190T>A|||||190|,A|downstream_gene_variant|MODIFIER|MIR6859-1|ENSG00000278267|transcript|ENST00000619216.1|miRNA||n.*2770A>T|||||2770|,A|intron_variant|MODIFIER|WASH7P|ENSG00000227232|transcript|ENST00000488147.1|unprocessed_pseudogene|10/10|n.1254-98A>T||||||;NS=1;MAF=0;AC_Het=0;AC_Hom=2;AC_Hemi=0;HWE=1;ExcHet=1     GT:AD:DP:GQ:PGT:PID:PL:PS       1|1:0,7:7:21:1|1:14599_T_A:315,21,0:14599
chr1    14604   rs541940975     A       G       356.05  .       AC=2;AF=1;AN=2;DB;DP=9;ExcessHet=3.0103;FS=0;MLEAC=2;MLEAF=1;MQ=22.23;QD=28.73;SOR=3.056;ANN=G|downstream_gene_variant|MODIFIER|DDX11L1|ENSG00000223972|transcript|ENST00000456328.2|processed_transcript||n.*195A>G|||||195|,G|downstream_gene_variant|MODIFIER|MIR6859-1|ENSG00000278267|transcript|ENST00000619216.1|miRNA||n.*2765T>C|||||2765|,G|intron_variant|MODIFIER|WASH7P|ENSG00000227232|transcript|ENST00000488147.1|unprocessed_pseudogene|10/10|n.1254-103T>C||||||;NS=1;MAF=0;AC_Het=0;AC_Hom=2;AC_Hemi=0;HWE=1;ExcHet=1 GT:AD:DP:GQ:PGT:PID:PL:PS       1|1:0,9:9:27:1|1:14599_T_A:370,27,0:14599
chr1    14610   .       T       C       356.05  .       AC=2;AF=1;AN=2;DP=9;ExcessHet=3.0103;FS=0;MLEAC=2;MLEAF=1;MQ=22.23;QD=30.97;SOR=3.056;ANN=C|downstream_gene_variant|MODIFIER|DDX11L1|ENSG00000223972|transcript|ENST00000456328.2|processed_transcript||n.*201T>C|||||201|,C|downstream_gene_variant|MODIFIER|MIR6859-1|ENSG00000278267|transcript|ENST00000619216.1|miRNA||n.*2759A>G|||||2759|,C|intron_variant|MODIFIER|WASH7P|ENSG00000227232|transcript|ENST00000488147.1|unprocessed_pseudogene|10/10|n.1254-109A>G||||||;NS=1;MAF=0;AC_Het=0;AC_Hom=2;AC_Hemi=0;HWE=1;ExcHet=1    GT:AD:DP:GQ:PGT:PID:PL:PS       1|1:0,9:9:27:1|1:14599_T_A:370,27,0:14599
chr1    14653   rs62635297      C       T       1816.06 .       AC=2;AF=1;AN=2;DB;DP=67;ExcessHet=3.0103;FS=0;MLEAC=2;MLEAF=1;MQ=34.03;QD=27.94;SOR=2.412;ANN=T|downstream_gene_variant|MODIFIER|DDX11L1|ENSG00000223972|transcript|ENST00000456328.2|processed_transcript||n.*244C>T|||||244|,T|downstream_gene_variant|MODIFIER|MIR6859-1|ENSG00000278267|transcript|ENST00000619216.1|miRNA||n.*2716G>A|||||2716|,T|intron_variant|MODIFIER|WASH7P|ENSG00000227232|transcript|ENST00000488147.1|unprocessed_pseudogene|10/10|n.1254-152G>A||||||;NS=1;MAF=0;AC_Het=0;AC_Hom=2;AC_Hemi=0;HWE=1;ExcHet=1        GT:AD:DP:GQ:PL  1/1:0,65:65:99:1830,195,0
chr1    14677   rs201327123     G       A       926.64  .       AC=1;AF=0.5;AN=2;BaseQRankSum=2.83;DB;DP=113;ExcessHet=3.0103;FS=1.545;MLEAC=1;MLEAF=0.5;MQ=37.82;MQRankSum=-1.398;QD=8.35;ReadPosRankSum=0.962;SOR=0.852;ANN=A|downstream_gene_variant|MODIFIER|DDX11L1|ENSG00000223972|transcript|ENST00000456328.2|processed_transcript||n.*268G>A|||||268|,A|downstream_gene_variant|MODIFIER|MIR6859-1|ENSG00000278267|transcript|ENST00000619216.1|miRNA||n.*2692C>T|||||2692|,A|intron_variant|MODIFIER|WASH7P|ENSG00000227232|transcript|ENST00000488147.1|unprocessed_pseudogene|10/10|n.1254-176C>T||||||;NS=1;MAF=0.5;AC_Het=1;AC_Hom=0;AC_Hemi=0;HWE=1;ExcHet=1      GT:AD:DP:GQ:PL  0/1:63,48:111:99:934,0,1266
chr1    16257   rs11489794      G       C       49.64   .       AC=1;AF=0.5;AN=2;BaseQRankSum=-1.136;DB;DP=23;ExcessHet=3.0103;FS=0;MLEAC=1;MLEAF=0.5;MQ=34.1;MQRankSum=0.381;QD=2.16;ReadPosRankSum=0;SOR=1.022;ANN=C|downstream_gene_variant|MODIFIER|DDX11L1|ENSG00000223972|transcript|ENST00000456328.2|processed_transcript||n.*1848G>C|||||1848|,C|downstream_gene_variant|MODIFIER|MIR6859-1|ENSG00000278267|transcript|ENST00000619216.1|miRNA||n.*1112C>G|||||1112|,C|intron_variant|MODIFIER|WASH7P|ENSG00000227232|transcript|ENST00000488147.1|unprocessed_pseudogene|8/10|n.1068-310C>G||||||;NS=1;MAF=0.5;AC_Het=1;AC_Hom=0;AC_Hemi=0;HWE=1;ExcHet=1      GT:AD:DP:GQ:PL  0/1:18,5:23:57:57,0,384
chr1    16288   rs113141985     C       G       48.64   .       AC=1;AF=0.5;AN=2;BaseQRankSum=-1.15;DB;DP=9;ExcessHet=3.0103;FS=0;MLEAC=1;MLEAF=0.5;MQ=32.24;MQRankSum=-0.135;QD=6.08;ReadPosRankSum=-1.029;SOR=0.307;ANN=G|downstream_gene_variant|MODIFIER|DDX11L1|ENSG00000223972|transcript|ENST00000456328.2|processed_transcript||n.*1879C>G|||||1879|,G|downstream_gene_variant|MODIFIER|MIR6859-1|ENSG00000278267|transcript|ENST00000619216.1|miRNA||n.*1081G>C|||||1081|,G|intron_variant|MODIFIER|WASH7P|ENSG00000227232|transcript|ENST00000488147.1|unprocessed_pseudogene|8/10|n.1067+319G>C||||||;NS=1;MAF=0.5;AC_Het=1;AC_Hom=0;AC_Hemi=0;HWE=1;ExcHet=1 GT:AD:DP:GQ:PL  0/1:5,3:8:56:56,0,107
chr1    16298   rs62636498      C       T       112.14  .       AC=2;AF=1;AN=2;DB;DP=4;ExcessHet=3.0103;FS=0;MLEAC=2;MLEAF=1;MQ=22.25;QD=28.04;SOR=3.258;ANN=T|downstream_gene_variant|MODIFIER|DDX11L1|ENSG00000223972|transcript|ENST00000456328.2|processed_transcript||n.*1889C>T|||||1889|,T|downstream_gene_variant|MODIFIER|MIR6859-1|ENSG00000278267|transcript|ENST00000619216.1|miRNA||n.*1071G>A|||||1071|,T|intron_variant|MODIFIER|WASH7P|ENSG00000227232|transcript|ENST00000488147.1|unprocessed_pseudogene|8/10|n.1067+309G>A||||||;NS=1;MAF=0;AC_Het=0;AC_Hom=2;AC_Hemi=0;HWE=1;ExcHet=1        GT:AD:DP:GQ:PL  1/1:0,4:4:12:126,12,0
chr1    136048  rs371677125     C       T       125.14  .       AC=2;AF=1;AN=2;DB;DP=4;ExcessHet=3.0103;FS=0;MLEAC=2;MLEAF=1;MQ=40;QD=31.29;SOR=0.693;ANN=T|upstream_gene_variant|MODIFIER|RP11-34P13.15|ENSG00000268903|transcript|ENST00000494149.2|processed_pseudogene||n.-153G>A|||||153|,T|downstream_gene_variant|MODIFIER|RP11-34P13.14|ENSG00000239906|transcript|ENST00000493797.1|antisense||n.*3742G>A|||||3742|,T|downstream_gene_variant|MODIFIER|CICP27|ENSG00000233750|transcript|ENST00000442987.3|processed_pseudogene||n.*1212C>T|||||1212|,T|downstream_gene_variant|MODIFIER|RP11-34P13.16|ENSG00000269981|transcript|ENST00000595919.1|processed_pseudogene||n.*1634G>A|||||1634|,T|intergenic_region|MODIFIER|RP11-34P13.15-RP11-34P13.16|ENSG00000268903-ENSG00000269981|intergenic_region|ENSG00000268903-ENSG00000269981|||n.136048C>T||||||;NS=1;MAF=0;AC_Het=0;AC_Hom=2;AC_Hemi=0;HWE=1;ExcHet=1      GT:AD:DP:GQ:PGT:PID:PL:PS       1|1:0,4:4:12:1|1:136048_C_T:139,12,0:136048
chr1    136573  .       T       C       113.97  .       AC=2;AF=1;AN=2;DP=7;ExcessHet=3.0103;FS=0;MLEAC=2;MLEAF=1;MQ=49.62;QD=19;SOR=1.329;ANN=C|TF_binding_site_variant|LOW|||Egr1|MA0162.2|||n.136573A>G||||||,C|upstream_gene_variant|MODIFIER|RP11-34P13.15|ENSG00000268903|transcript|ENST00000494149.2|processed_pseudogene||n.-678A>G|||||678|,C|downstream_gene_variant|MODIFIER|RP11-34P13.14|ENSG00000239906|transcript|ENST00000493797.1|antisense||n.*3217A>G|||||3217|,C|downstream_gene_variant|MODIFIER|RP11-34P13.13|ENSG00000241860|transcript|ENST00000484859.1|antisense||n.*4901A>G|||||4901|,C|downstream_gene_variant|MODIFIER|CICP27|ENSG00000233750|transcript|ENST00000442987.3|processed_pseudogene||n.*1737T>C|||||1737|,C|downstream_gene_variant|MODIFIER|RP11-34P13.16|ENSG00000269981|transcript|ENST00000595919.1|processed_pseudogene||n.*1109A>G|||||1109|,C|intergenic_region|MODIFIER|RP11-34P13.15-RP11-34P13.16|ENSG00000268903-ENSG00000269981|intergenic_region|ENSG00000268903-ENSG00000269981|||n.136573T>C||||||;NS=1;MAF=0;AC_Het=0;AC_Hom=2;AC_Hemi=0;HWE=1;ExcHet=1  GT:AD:DP:GQ:PL  1/1:0,6:6:18:128,18,0
chr1    136962  rs373582709     C       T       118.68  .       AC=1;AF=0.5;AN=2;BaseQRankSum=-0.887;DB;DP=8;ExcessHet=3.0103;FS=0;MLEAC=1;MLEAF=0.5;MQ=50.36;MQRankSum=0.489;QD=16.95;ReadPosRankSum=0.489;SOR=0.33;ANN=T|TF_binding_site_variant|MODIFIER|||Egr1|MA0162.2|||n.136962G>A||||||,T|upstream_gene_variant|MODIFIER|RP11-34P13.15|ENSG00000268903|transcript|ENST00000494149.2|processed_pseudogene||n.-1067G>A|||||1067|,T|downstream_gene_variant|MODIFIER|RP11-34P13.14|ENSG00000239906|transcript|ENST00000493797.1|antisense||n.*2828G>A|||||2828|,T|downstream_gene_variant|MODIFIER|RP11-34P13.13|ENSG00000241860|transcript|ENST00000484859.1|antisense||n.*4512G>A|||||4512|,T|downstream_gene_variant|MODIFIER|CICP27|ENSG00000233750|transcript|ENST00000442987.3|processed_pseudogene||n.*2126C>T|||||2126|,T|downstream_gene_variant|MODIFIER|RP11-34P13.16|ENSG00000269981|transcript|ENST00000595919.1|processed_pseudogene||n.*720G>A|||||720|,T|intergenic_region|MODIFIER|RP11-34P13.15-RP11-34P13.16|ENSG00000268903-ENSG00000269981|intergenic_region|ENSG00000268903-ENSG00000269981|||n.136962C>T||||||;NS=1;MAF=0.5;AC_Het=1;AC_Hom=0;AC_Hemi=0;HWE=1;ExcHet=1 GT:AD:DP:GQ:PL  0/1:1,6:8:10:126,0,10
chr1    137622  rs376555721     G       A       54.66   .       AC=1;AF=0.5;AN=2;BaseQRankSum=0.674;DB;DP=4;ExcessHet=3.0103;FS=6.021;MLEAC=1;MLEAF=0.5;MQ=20;MQRankSum=0;QD=13.67;ReadPosRankSum=-0.319;SOR=2.788;ANN=A|upstream_gene_variant|MODIFIER|RP11-34P13.15|ENSG00000268903|transcript|ENST00000494149.2|processed_pseudogene||n.-1727C>T|||||1727|,A|downstream_gene_variant|MODIFIER|RP11-34P13.14|ENSG00000239906|transcript|ENST00000493797.1|antisense||n.*2168C>T|||||2168|,A|downstream_gene_variant|MODIFIER|RP11-34P13.13|ENSG00000241860|transcript|ENST00000484859.1|antisense||n.*3852C>T|||||3852|,A|downstream_gene_variant|MODIFIER|CICP27|ENSG00000233750|transcript|ENST00000442987.3|processed_pseudogene||n.*2786G>A|||||2786|,A|downstream_gene_variant|MODIFIER|RP11-34P13.16|ENSG00000269981|transcript|ENST00000595919.1|processed_pseudogene||n.*60C>T|||||60|,A|intergenic_region|MODIFIER|RP11-34P13.15-RP11-34P13.16|ENSG00000268903-ENSG00000269981|intergenic_region|ENSG00000268903-ENSG00000269981|||n.137622G>A||||||;NS=1;MAF=0.5;AC_Het=1;AC_Hom=0;AC_Hemi=0;HWE=1;ExcHet=1    GT:AD:DP:GQ:PL  0/1:1,3:4:13:62,0,13
chr1    137825  rs147252685     G       A       622.06  .       AC=2;AF=1;AN=2;DB;DP=26;ExcessHet=3.0103;FS=0;MLEAC=2;MLEAF=1;MQ=36.46;QD=24.88;SOR=0.77;ANN=A|upstream_gene_variant|MODIFIER|RP11-34P13.15|ENSG00000268903|transcript|ENST00000494149.2|processed_pseudogene||n.-1930C>T|||||1930|,A|downstream_gene_variant|MODIFIER|RP11-34P13.14|ENSG00000239906|transcript|ENST00000493797.1|antisense||n.*1965C>T|||||1965|,A|downstream_gene_variant|MODIFIER|RP11-34P13.13|ENSG00000241860|transcript|ENST00000484859.1|antisense||n.*3649C>T|||||3649|,A|downstream_gene_variant|MODIFIER|CICP27|ENSG00000233750|transcript|ENST00000442987.3|processed_pseudogene||n.*2989G>A|||||2989|,A|non_coding_transcript_exon_variant|MODIFIER|RP11-34P13.16|ENSG00000269981|transcript|ENST00000595919.1|processed_pseudogene|1/1|n.141C>T||||||;NS=1;MAF=0;AC_Het=0;AC_Hom=2;AC_Hemi=0;HWE=1;ExcHet=1  GT:AD:DP:GQ:PL  1/1:0,25:25:75:636,75,0
chr1    138156  rs370691115     G       T       197.04  .       AC=2;AF=1;AN=2;DB;DP=8;ExcessHet=3.0103;FS=0;MLEAC=2;MLEAF=1;MQ=22;QD=24.63;SOR=0.693;ANN=T|upstream_gene_variant|MODIFIER|RP11-34P13.15|ENSG00000268903|transcript|ENST00000494149.2|processed_pseudogene||n.-2261C>A|||||2261|,T|upstream_gene_variant|MODIFIER|RP11-34P13.16|ENSG00000269981|transcript|ENST00000595919.1|processed_pseudogene||n.-191C>A|||||191|,T|downstream_gene_variant|MODIFIER|RP11-34P13.14|ENSG00000239906|transcript|ENST00000493797.1|antisense||n.*1634C>A|||||1634|,T|downstream_gene_variant|MODIFIER|RP11-34P13.13|ENSG00000241860|transcript|ENST00000484859.1|antisense||n.*3318C>A|||||3318|,T|downstream_gene_variant|MODIFIER|CICP27|ENSG00000233750|transcript|ENST00000442987.3|processed_pseudogene||n.*3320G>T|||||3320|,T|intergenic_region|MODIFIER|RP11-34P13.16-RP11-34P13.14|ENSG00000269981-ENSG00000239906|intergenic_region|ENSG00000269981-ENSG00000239906|||n.138156G>T||||||;NS=1;MAF=0;AC_Het=0;AC_Hom=2;AC_Hemi=0;HWE=1;ExcHet=1   GT:AD:DP:GQ:PL  1/1:0,8:8:24:211,24,0
chr1    138817  rs556938922     T       C       945.06  .       AC=2;AF=1;AN=2;DB;DP=45;ExcessHet=3.0103;FS=0;MLEAC=2;MLEAF=1;MQ=35.16;QD=21.98;SOR=0.739;ANN=C|upstream_gene_variant|MODIFIER|RP11-34P13.15|ENSG00000268903|transcript|ENST00000494149.2|processed_pseudogene||n.-2922A>G|||||2922|,C|upstream_gene_variant|MODIFIER|RP11-34P13.16|ENSG00000269981|transcript|ENST00000595919.1|processed_pseudogene||n.-852A>G|||||852|,C|downstream_gene_variant|MODIFIER|RP11-34P13.14|ENSG00000239906|transcript|ENST00000493797.1|antisense||n.*973A>G|||||973|,C|downstream_gene_variant|MODIFIER|RP11-34P13.13|ENSG00000241860|transcript|ENST00000484859.1|antisense||n.*2657A>G|||||2657|,C|downstream_gene_variant|MODIFIER|CICP27|ENSG00000233750|transcript|ENST00000442987.3|processed_pseudogene||n.*3981T>C|||||3981|,C|intergenic_region|MODIFIER|RP11-34P13.16-RP11-34P13.14|ENSG00000269981-ENSG00000239906|intergenic_region|ENSG00000269981-ENSG00000239906|||n.138817T>C||||||;NS=1;MAF=0;AC_Het=0;AC_Hom=2;AC_Hemi=0;HWE=1;ExcHet=1 GT:AD:DP:GQ:PL  1/1:0,43:43:99:959,126,0
chr1    184246  .       T       C       52.84   .       AC=2;AF=1;AN=2;DP=4;ExcessHet=3.0103;FS=0;MLEAC=1;MLEAF=0.5;MQ=41.8;QD=17.61;SOR=1.179;ANN=C|downstream_gene_variant|MODIFIER|FO538757.2|ENSG00000279928|transcript|ENST00000624431.1|protein_coding||c.*88T>C|||||88|,C|downstream_gene_variant|MODIFIER|FO538757.1|ENSG00000279457|transcript|ENST00000623083.3|protein_coding||c.*971A>G|||||679|,C|downstream_gene_variant|MODIFIER|MIR6859-2|ENSG00000273874|transcript|ENST00000612080.1|miRNA||n.*3645A>G|||||3645|,C|intergenic_region|MODIFIER|FO538757.2-FO538757.1|ENSG00000279928-ENSG00000279457|intergenic_region|ENSG00000279928-ENSG00000279457|||n.184246T>C||||||;NS=1;MAF=0;AC_Het=0;AC_Hom=2;AC_Hemi=0;HWE=1;ExcHet=1 GT:AD:DP:GQ:PL  1/1:0,3:3:9:66,9,0
chr1    185194  .       G       C       91.64   .       AC=1;AF=0.5;AN=2;BaseQRankSum=-1.345;DP=10;ExcessHet=3.0103;FS=4.26;MLEAC=1;MLEAF=0.5;MQ=24.41;MQRankSum=-1.15;QD=11.45;ReadPosRankSum=0;SOR=2.833;ANN=C|3_prime_UTR_variant|MODIFIER|FO538757.1|ENSG00000279457|transcript|ENST00000623083.3|protein_coding|11/11|c.*23C>G|||||23|,C|downstream_gene_variant|MODIFIER|FO538757.2|ENSG00000279928|transcript|ENST00000624431.1|protein_coding||c.*1036G>C|||||1036|,C|downstream_gene_variant|MODIFIER|MIR6859-2|ENSG00000273874|transcript|ENST00000612080.1|miRNA||n.*2697C>G|||||2697|;NS=1;MAF=0.5;AC_Het=1;AC_Hom=0;AC_Hemi=0;HWE=1;ExcHet=1        GT:AD:DP:GQ:PL  0/1:3,5:8:65:99,0,65

Adding population-level MAF

We will be exploring two methods to achive this, one is an R-based approach (see below) and another will use the vcf2maf tool (GitHub - mskcc/vcf2maf: Convert a VCF into a MAF, where each variant is annotated to only one of all possible gene isoforms) to assign allelic frequencies using reference population-level MAF such as Maf.gnomAD or Maf.ExAC when screened againts of set of know variants in dbSNP.

Method 1: using R to collect population-level MAF information

Requirements:

Install Rstudio https://www.rstudio.com/products/rstudio/download/
R version 4.1 (Mac: Downloading and Installing R 4.1 for macOS [Outdated] ; Windows: Downloading and Installing R 4.1.0 for Windows [Outdated] )

Open an Rstudio session and let’s initially install bioconductor:

#STEP1: install bioconductor
if (!require("BiocManager", quietly = TRUE))
  install.packages("BiocManager")
BiocManager::install(version = "3.14")

Then install the MafDb.gnomAD package for the human GRCh38 genome assembly:

#STEP2: install MafDB.gnomAD
if (!requireNamespace("BiocManager", quietly = TRUE))
  install.packages("BiocManager")
  
BiocManager::install("MafDb.gnomAD.r2.1.GRCh38")

#load the library
library(MafDb.gnomAD.r2.1.GRCh38)

Next install the SNPlocs.Hsapiens.dbSNP150.GRCh38 package. Note the latest version 151 is approx. 3.8GB in size and can take a while to download. For the execise use verion 150 (total size 2GB).

#STEP3: load SNP information from dbSNP150 release
if (!requireNamespace("BiocManager", quietly = TRUE))
  install.packages("BiocManager")

BiocManager::install("SNPlocs.Hsapiens.dbSNP150.GRCh38")

#load the library
library(SNPlocs.Hsapiens.dbSNP150.GRCh38)

Create a mafdb by loading the installed MafDb.gnomAD package:

#STEP4: load MadDb information
mafdb <- MafDb.gnomAD.r2.1.GRCh38
mafdb
citation(mafdb)
populations(mafdb)

Looking for the MAF information for a known variant of interest, for example: rs1129038

#STEP5: look for a population level MAF information for a known SNP identifier
rng <- snpsById(snpdb, ids = "rs1129038")
rng
gscores(mafdb, rng)

To look for the populion MAF information for several variants of interest create a R vector, for example:

snpvec = c("rs10875231",
           "rs6678176",
           "rs78286437",
           "rs144406489")

then re-run STEP5 above as follows:

rng <- snpsById(snpdb, ids=snpvec)
gscores(mafdb, rng)

export MAF information to a data frame, modify the header “AF” (Allelic Frequency) to MAF and save into a file:

#STEP 6: exporting into a dataframe
info = gscores(mafdb, rng)
info

str(info)
infoDF = data.frame(info)
head(infoDF)

colnames(infoDF)
colnames(infoDF) [6] = "MAF"
colnames(infoDF)
head(infoDF)

write.table(infoDF, file = "demo_MAF.txt", append = FALSE, sep = "\t",
            row.names = TRUE, col.names = TRUE)