Herramientas y base de datos

Navegadores genómicos

IGV

Navegador en línea

Fuentes de anotaciones

UCSC

Base de Datos

OMIM

ClinVar

Varsome

Clingen

Herramientas bioinformáticas

Areas de codificación

SIFT  

Predice si las sustituciones de una amino ácido afectan la función de la proteína. Unitliza la comparación con otras proteínas relacionadas y sus estructuras para inferir el efecto.

POLYPHEN2   

Infiere el impacto del cambio de aminoácidos basados en la estructura física y comparativa que causa el cambio.

MUT TASTER  

Utiliza un método Bayesiano para predecir un cambio al nivel de nucleotido o amino ácidos. Esto incluye evaluación de los bordes de los intrones, sustituciones sinónimas.

MUT ASSESSOR      

Evalua el impacto de un cambio de aminoacidos en cáncer utilizando información de los sitios conservados en otras moleculas homólogas.

FATHMM      

Evalua el efecto de las mutaciones con sentido erroneo utilizando un modelo de conservación de Markov en alineamientos de proteinas conservadas, y valora su peso de patogenicidad.

INTRONES

dbscSNV RF y Ada

Ambas herramientas evaluan las regiones de cortes intrónicas (-3 a +8 y -12 a +2) para determinar el impacto del cambio de nucleotidos en el splicing. La versión Ada utiliza valores ensemble para calcular la probabilidad de impacto.

CONSERVACION

GERP  

Identifica elementos de conservación por la presión a mantenerse sin cambio.

Functional Whole Genome 

GenoCanyon  

Método de anotación no supervisada con auto-aprendizaje que infiere el impacto funcional de cada base en el genoma.

fitCons     

Integra ensayos funcionales para calcular un valor de conservación de un patrón genómico.

Otras colecciones de base de datos (recursos in-silico)

Nombre de la tablaExplicaciónFecha
1000g2015aug (6 conjuntos de datos)El equipo 1000G corrigió un error en el cálculo de la frecuencia chrX. Basado en la colección 201508 v5b (basada en el alineamiento 201305)20150824
abraom2,3 millones de variantes genómicas brasileñas20181204
avsnp150dbSNP150 con división alélica y normalización a la izquierda20170929
cadd13CADD versión 1.320170123
cadd13gt10CADD versión 1.3 puntuación>1020170123
cadd13gt20CADD versión 1.3 puntuación>2020170123
cg46frecuencia alélica alternativa en 46 sujetos humanos no emparentados secuenciados por Complete Genomics20120222
cg69frecuencia alélica en 69 sujetos humanos secuenciados por Complete Genomics20120222
clinvar_20221231Clinvar versión 20221231 con columnas separadas (CLNALLELEID CLNDN CLNDISDB CLNREVSTAT CLNSIG)20230105
cosmic68wgsbase de datos COSMIC versión 68 sobre datos WGS20140224
dbnsfp42areformateada para incluir más columnas que dbnsfp41a20210710
dbscsnv11dbscSNV versión 1.1 para la predicción de sitios de empalme mediante AdaBoost y Random Forest20151218
eigenpuntuaciones Eigen de todo el genoma, véase ref20160330
ensGeneSecuencias FASTA para todos los transcritos anotados en la colección Gencode v43 Basic levantada hasta hg19 (la última actualización fue el 2023-02-15 en UCSC)20230315
esp6500siv2_allfrecuencia alélica alternativa en Todos los sujetos del proyecto NHLBI-ESP con 6500 exomas, incluidas las llamadas indel y las llamadas chrY. Esto se levantó sobre de hg19 por mí mismo.20141222
exac03ExAC 65000 datos de frecuencia alélica del exoma para ALL, AFR (africano), AMR (americano mezclado), EAS (asiático del este), FIN (finlandés), NFE (europeo no finlandés), OTH (otro), SAS (asiático del sur)). versión 0.3. Normalización izquierda realizada. Normalización izquierda realizada.20151129
exac03nonpsychExAC en muestras de enfermedades no psiquiátricas (cabecera actualizada)20160423
exac03nontcgaExAC en muestras no TCGA (encabezado actualizado)20160423
fathmmpuntuaciones FATHMM_coding y FATHMM_noncoding del genoma completo (las puntuaciones noncoding y coding de la versión de 2015 se invirtieron)20160315
gene4denovo201907base de datos de gene4denovo20191101
gene4denovo201907base de datos gen4denovo20191101
gerp++elemregiones genómicas conservadas por GERP++20140223
puntuaciones GERP++ de todo el genoma superiores a 2 (el umbral de puntuación RS de 2 proporciona una alta sensibilidad a la vez que enriquece fuertemente los sitios realmente restringidos. )20120621
gmeFrecuencia alélica del Gran Oriente Medio, incluyendo NWA (noroeste de África), NEA (noreste de África), AP (península arábiga), Israel, SD (desierto sirio), TP (península turca) y CA (Asia central)20161024
gnomad211_exomecolección de exomas degnomAD (v2.1. 1), con «AF AF_popmax AF_male AF_female AF_raw AF_afr AF_sas AF_amr AF_eas AF_nfe AF_fin AF_asj AF_oth non_topmed_AF_popmax non_neuro_AF_popmax non_cancer_AF_popmax controls_AF_popmax» header20190318
gnomad312_genomeversión 3.1.2 whole-genome data20221228
gwavawhole genome GWAVA_region_score y GWAVA_tss_score (GWAVA_unmatched_score tiene un error en el archivo), véase ref.20150623
hrcr140 millones de variantes de 32K muestras en el consorcio de referencia de haplotipos20151203
icgc28Consorcio Internacional del Genoma del Cáncer versión 2820210122
intervar_20180118InterVar: interpretación clínica de variantes missense (indels not supported)20180325
kaviar_20150923170 millones de VARiants conocidos de 13K genomas y 64K exomas en 34 proyectos20151203
GeneConocidoSecuencias FASTA para todos los transcritos anotados en UCSC Gene Conocido (la última actualización fue 2009-05-10 en UCSC)20211019
ljb26_allPuntuaciones SIFT del exoma completo, PolyPhen2 HDIV, PolyPhen2 HVAR, LRT, MutationTaster, MutationAssessor, FATHMM, MetaSVM, MetaLR, VEST, CADD, GERP++, PhyloP y SiPhy de la versión 2.6 de dbNSFP20140925
mcap13[puntuaciones M-CAP v1.3]20181203
mitimpact2predicciones de patogenicidad de variantes mitocondriales humanas sin sentido (ver aquí20150520
nci60Datos de frecuencia alélica de secuenciación del exoma del panel de líneas celulares tumorales humanas NCI-6020130724
popfreq_all_20150413Una base de datos que contiene todas las frecuencias alélicas de 1000G, ESP6500, ExAC y CG4620150413
popfreq_max_20150413Una base de datos que contiene la frecuencia alélica máxima de 1000G, ESP6500, ExAC y CG4620150413
refGeneSecuencias FASTA para todos los transcritos anotados en RefSeq Gene (la última actualización fue 2020-08-22 en UCSC)20211019
refGeneWithVerSecuencias FASTA para todos los transcritos anotados en RefSeq Gene con número de versión (la última actualización fue 2020-08-22 en UCSC)20211019
regsnpintronvidaSuperior a la anterior20180922
regsnpintronpriorizar la probabilidad causante de enfermedad de SNVs intrónicos20180920
revelPuntuaciones REVEL para variantes no sinónimas20161205
snp138Levanté sobre SNP138 a hg1820140910