International Chemical Identifier (InChI key)

¿Que es el InChI?

El identificador internacional químico “International Chemical IdentifierInChI fué creado en 2007 por la IUPAC para facilitar la búsqueda en internet (Google) de compuestos químicos de una manera mas eficiente.

Inconvenientes de la nomenclatura IUPAC

El principal problema que surge en las busquedas de internet con los nombres sistemáticos de la IUPAC en compuestos orgánicos es que a veces una molécula presenta muchos sinónimos. Por tanto, si se busca por un sinónimo en concreto se omiten en los resultados otros documentos que vengan descritos con otros nombres.

Por otro lado, los nombres sistemáticos que contienen números y símbolos como guiones, paréntesis, corchetes, comillas, letras griegas, etc. no son efectivos en los buscadores de internet. Además, muchas de las estructuras químicas en internet se muestran sólo con ficheros de imagen PNG, GIF, JPG, etc. donde no son efectivos los buscadores.

Finalmente, surge el inconveniente de formular correctamente con nombre sistemático moléculas de gran tamaño debido a que el nombre que se genera es demasiado largo.

Por todo esto, y a fin de facilitar la nomenclatura y formulación de compuestos químicos y la búsqueda de información en internet de dichos compuestos surgen los identificadores InChI key.

Ventajas del identificador InChI Key

Estos identificadores presentan las siguientes ventajas:

  • Este identificador es único para cada compuesto químico.
  • Son de libre uso y sin propiedad, a diferencia por ejemplo de los números CAS.
  • Pueden ser calculados (por cualquier usuario) a partir de la información estructural y no asignados por una organización.
  • La mayor parte de la información en un InChI es legible.

Estructura del identificador

El algoritmo InChI convierte la información estructural de entrada en un identificador único InChI en un proceso de tres pasos: normalización, canónicos, y la serialización.

normalización, canónicos, y la serialización en el codigo InChI

El InChI key es una representación digital condensada de longitud fija (27 caracteres) del código InChI que no es humana-comprensible. Estrictamente hablando, la cadena InChIKey de un compuesto no es única aunque las repeticiones se pueden calcular al ser muy poco frecuentes que sucedan es considerada como única.

Ejemplos en moléculas orgánicas

Veamos un ejemplos de cadena InChI para moléculas orgánicas. La estructura de la molécula de la morfina es la siguiente:

Estructura de la morfina BQJCRHHNABKAKU-KBQPJGBKSA-N

Su código InChI es el siguiente:

InChI=1S/C16H16NO3/c18-11-3-1-8-7-10-9-2-4-12(19)15- 16(9,5-6-17-10)13(8)14(11)20-15/h1-4,9-10,12,15,18-19H,5-7H2/t9- ,10+,12-,15-,16-/m0/s1

Cada InChI comienza con la cadena “InChI =” seguido por el número de versión, en la actualidad 1. Esto es seguido por la letra S para InChI estándar.

El resto de información se estructura como una secuencia de capas y subcapas, con cada capa que proporciona un tipo específico de información (los átomos y su conectividad de enlaces, información tautomérica, información de isótopos, estereoquímica y la información de carga electrónica).

Las capas y subcapas están separadas por el delimitador “/” y comienzan con una letra prefijo característico.

A partir de la cadena InChI se obtiene el código InChI key estándar (2009 v 1.02 del software InChI) es la versión de la cadena InChI del compuesto que lo forman 27 caracteres alfanuméricos. En el caso de la morfina corresponde a:

InChI Key: BQJCRHHNABKAKU-KBQPJGBKSA-N

Esta cadena alfanumérica de 27 caracteres es la que se puede utilizar con los buscadores web para encontrar de forma sencilla informaciónde dicho compuesto, independientemente del idioma y sinónimos que presente la molécula.

 

Para finalizar, simplemente comentar que la información acerca de las coordenadas 3D de los átomos no está representado en InChI.