Quimiometría

format_list_bulleted Contenido keyboard_arrow_down
ImprimirCitar
Ciencia de la extracción de información de sistemas químicos por medios basados en datos

Quimiometría es la ciencia de extraer información de los sistemas químicos por medios basados en datos. La quimiometría es intrínsecamente interdisciplinaria y utiliza métodos que se emplean con frecuencia en disciplinas básicas de análisis de datos, como estadísticas multivariadas, matemáticas aplicadas e informática, para abordar problemas en química, bioquímica, medicina, biología e ingeniería química. De esta manera, refleja otros campos interdisciplinarios, como la psicometría y la econometría.

Antecedentes

La quimiometría se aplica para resolver problemas tanto descriptivos como predictivos en ciencias naturales experimentales, especialmente en química. En aplicaciones descriptivas, las propiedades de los sistemas químicos se modelan con la intención de aprender las relaciones subyacentes y la estructura del sistema (es decir, comprensión e identificación del modelo). En las aplicaciones predictivas, las propiedades de los sistemas químicos se modelan con la intención de predecir nuevas propiedades o comportamientos de interés. En ambos casos, los conjuntos de datos pueden ser pequeños, pero a menudo son grandes y complejos, e involucran de cientos a miles de variables y cientos de miles de casos u observaciones.

Las técnicas quimiométricas se utilizan particularmente en la química analítica y la metabolómica, y el desarrollo de métodos de análisis quimiométricos mejorados también continúa avanzando en el estado del arte en instrumentación y metodología analíticas. Es una disciplina impulsada por la aplicación y, por lo tanto, si bien las metodologías quimiométricas estándar se utilizan ampliamente en la industria, los grupos académicos se dedican al desarrollo continuo de la teoría, el método y el desarrollo de aplicaciones quimiométricas.

Orígenes

Aunque se podría argumentar que incluso los primeros experimentos analíticos en química involucraron una forma de quimiometría, en general se reconoce que el campo surgió en la década de 1970 cuando las computadoras comenzaron a explotarse cada vez más para la investigación científica. El término 'quimiometría' fue acuñado por Svante Wold en una solicitud de subvención de 1971, y la Sociedad Internacional de Quimiometría fue formada poco después por Svante Wold y Bruce Kowalski, dos pioneros en el campo. Wold fue profesor de química orgánica en la Universidad de Umeå, Suecia, y Kowalski fue profesor de química analítica en la Universidad de Washington, Seattle.

Muchas de las primeras aplicaciones involucraron la clasificación multivariante, seguidas de numerosas aplicaciones predictivas cuantitativas y, a fines de la década de 1970 y principios de la de 1980, se estaba produciendo una amplia variedad de análisis químicos controlados por datos y por computadora.

El análisis multivariante fue una faceta crítica incluso en las primeras aplicaciones de la quimiometría. Los datos de la espectroscopia infrarroja y UV/visible a menudo se cuentan en miles de mediciones por muestra. Los experimentos de espectrometría de masas, resonancia magnética nuclear, emisión/absorción atómica y cromatografía también son, por naturaleza, altamente multivariados. Se encontró que la estructura de estos datos es propicia para el uso de técnicas como el análisis de componentes principales (PCA), mínimos cuadrados parciales (PLS), mínimos cuadrados parciales ortogonales (OPLS) y mínimos cuadrados parciales ortogonales bidireccionales (O2PLS). Esto se debe principalmente a que, si bien los conjuntos de datos pueden ser altamente multivariados, existe una estructura sólida y, a menudo, lineal de bajo rango presente. A lo largo del tiempo, PCA y PLS han demostrado ser muy efectivos para modelar empíricamente la estructura de bajo rango más interesante desde el punto de vista químico, explotando las interrelaciones o 'variables latentes' en los datos, y proporciona sistemas de coordenadas compactos alternativos para análisis numéricos adicionales, como regresión, agrupación y reconocimiento de patrones. Los mínimos cuadrados parciales en particular se usaron mucho en aplicaciones quimiométricas durante muchos años antes de que comenzaran a encontrar un uso regular en otros campos.

Durante la década de 1980, aparecieron tres revistas especializadas en este campo: Journal of Chemometrics, Chemometrics and Intelligent Laboratory Systems y Journal of Chemical Information and Modeling. Estas revistas continúan cubriendo tanto la investigación fundamental como la metodológica en quimiometría. En la actualidad, la mayoría de las aplicaciones de rutina de los métodos quimiométricos existentes se publican comúnmente en revistas orientadas a la aplicación (por ejemplo, Applied Spectroscopia, Analytical Chemistry, Analytica Chimica Acta, Talanta). Varios libros/monografías importantes sobre quimiometría también se publicaron por primera vez en la década de 1980, incluida la primera edición de Factor Analysis in Chemistry de Malinowski, Sharaf, Illman y Kowalski de Chemometrics , Massart et al. Quimiometría: un libro de texto y Calibración multivariante de Martens y Naes.

Algunas grandes áreas de aplicación de la quimiometría han pasado a representar nuevos dominios, como el modelado molecular y QSAR, la quimioinformática, la '-ómica' campos de genómica, proteómica, metabonómica y metabolómica, modelado de procesos y tecnología analítica de procesos.

Geladi y Esbensen publicaron un relato de la historia temprana de la quimiometría como una serie de entrevistas.

Técnicas

Calibración multivariante

Muchos problemas químicos y aplicaciones de la quimiometría implican la calibración. El objetivo es desarrollar modelos que puedan usarse para predecir propiedades de interés en función de las propiedades medidas del sistema químico, como presión, flujo, temperatura, infrarrojo, Raman, espectros de RMN y espectros de masas. Los ejemplos incluyen el desarrollo de modelos multivariantes que relacionan 1) la respuesta espectral de múltiples longitudes de onda con la concentración del analito, 2) los descriptores moleculares con la actividad biológica, 3) las condiciones/estados del proceso multivariante con los atributos del producto final. El proceso requiere un conjunto de datos de calibración o entrenamiento, que incluye valores de referencia para las propiedades de interés para la predicción y los atributos medidos que se cree que corresponden a estas propiedades. Para el caso 1), por ejemplo, se pueden recopilar datos de varias muestras, incluidas las concentraciones de un analito de interés para cada muestra (la referencia) y el espectro infrarrojo correspondiente de esa muestra. Las técnicas de calibración multivariante, como la regresión de mínimos cuadrados parciales o la regresión de componentes principales (y muchos otros métodos) se utilizan luego para construir un modelo matemático que relaciona la respuesta multivariante (espectro) con la concentración del analito de interés, y tal El modelo se puede utilizar para predecir de manera eficiente las concentraciones de nuevas muestras.

Las técnicas de calibración multivariante suelen clasificarse en términos generales como métodos clásicos o inversos. La principal diferencia entre estos enfoques es que en la calibración clásica, los modelos se resuelven de manera que sean óptimos para describir las respuestas analíticas medidas (por ejemplo, espectros) y, por lo tanto, pueden considerarse descriptores óptimos, mientras que en los métodos inversos los modelos se resuelven para que sean óptimos. en la predicción de las propiedades de interés (por ejemplo, concentraciones, predictores óptimos). Los métodos inversos generalmente requieren menos conocimiento físico del sistema químico y, al menos en teoría, brindan predicciones superiores en el sentido del error cuadrático medio y, por lo tanto, los enfoques inversos tienden a aplicarse con mayor frecuencia en la calibración multivariante contemporánea.

La principal ventaja del uso de técnicas de calibración multivariante es que se pueden usar mediciones analíticas rápidas, económicas o no destructivas (como la espectroscopia óptica) para estimar las propiedades de la muestra que, de lo contrario, requerirían pruebas costosas, destructivas o que llevarían mucho tiempo. (como LC-MS). Igualmente importante es que la calibración multivariada permite un análisis cuantitativo preciso en presencia de una gran interferencia de otros analitos. La selectividad del método analítico la proporciona tanto la calibración matemática, como las modalidades analíticas de medida. Por ejemplo, los espectros de infrarrojo cercano, que son extremadamente amplios y no selectivos en comparación con otras técnicas analíticas (como los espectros de infrarrojos o Raman), a menudo se pueden utilizar con éxito junto con métodos de calibración multivariante cuidadosamente desarrollados para predecir concentraciones de analitos en muy matrices complejas.

Clasificación, reconocimiento de patrones, agrupamiento

Las técnicas de clasificación multivariante supervisada están estrechamente relacionadas con las técnicas de calibración multivariante en el sentido de que se utiliza un conjunto de calibración o entrenamiento para desarrollar un modelo matemático capaz de clasificar muestras futuras. Las técnicas empleadas en quimiometría son similares a las utilizadas en otros campos: análisis discriminante multivariante, regresión logística, redes neuronales, árboles de regresión/clasificación. El uso de técnicas de reducción de rango junto con estos métodos de clasificación convencionales es rutinario en quimiometría, por ejemplo, análisis discriminante en componentes principales o puntajes de mínimos cuadrados parciales.

Una familia de técnicas, denominadas modelos de clase o clasificadores de una clase, pueden construir modelos para una clase de interés individual. Dichos métodos son particularmente útiles en el caso del control de calidad y la verificación de la autenticidad de los productos.

La clasificación no supervisada (también denominada análisis de conglomerados) también se usa comúnmente para descubrir patrones en conjuntos de datos complejos y, nuevamente, muchas de las técnicas principales que se usan en la quimiometría son comunes a otros campos, como el aprendizaje automático y el aprendizaje estadístico.

Resolución de curva multivariante

En el lenguaje quimiométrico, la resolución de curvas multivariadas busca deconstruir conjuntos de datos con información de referencia y conocimiento del sistema limitados o ausentes. Lawton y Sylvestre realizaron algunos de los primeros trabajos sobre estas técnicas a principios de la década de 1970. Estos enfoques también se denominan análisis de mezcla de automodelado, separación ciega de fuente/señal y desmezcla espectral. Por ejemplo, a partir de un conjunto de datos que comprende espectros de fluorescencia de una serie de muestras, cada una de las cuales contiene múltiples fluoróforos, se pueden usar métodos de resolución de curvas multivariantes para extraer los espectros de fluorescencia de los fluoróforos individuales, junto con sus concentraciones relativas en cada una de las muestras, esencialmente sin mezclar el espectro de fluorescencia total en las contribuciones de los componentes individuales. El problema generalmente está mal determinado debido a la ambigüedad rotacional (muchas soluciones posibles pueden representar de manera equivalente los datos medidos), por lo que la aplicación de restricciones adicionales es común, como la no negatividad, la unimodalidad o las interrelaciones conocidas entre los componentes individuales (por ejemplo, restricciones cinéticas o de balance de masa).

Otras técnicas

El diseño experimental sigue siendo un área central de estudio en quimiometría y varias monografías están dedicadas específicamente al diseño experimental en aplicaciones químicas. Los principios sólidos del diseño experimental han sido ampliamente adoptados dentro de la comunidad de quimiometría, aunque muchos experimentos complejos son puramente observacionales y puede haber poco control sobre las propiedades e interrelaciones de las muestras y las propiedades de las muestras.

El procesamiento de señales también es un componente fundamental de casi todas las aplicaciones quimiométricas, en particular el uso de pretratamientos de señales para acondicionar los datos antes de la calibración o la clasificación. Las técnicas empleadas comúnmente en quimiometría a menudo están estrechamente relacionadas con las que se usan en campos relacionados. El preprocesamiento de señales puede afectar la forma en que se pueden interpretar los resultados del procesamiento final de datos.

Caracterización del rendimiento y cifras de mérito Como la mayoría de los campos de las ciencias físicas, la quimiometría está orientada cuantitativamente, por lo que se pone un énfasis considerable en la caracterización del rendimiento, la selección del modelo, la verificación y la evaluación. validación y figuras de mérito. El rendimiento de los modelos cuantitativos generalmente se especifica mediante el error cuadrático medio al predecir el atributo de interés, y el rendimiento de los clasificadores como pares de tasa de verdadero positivo/tasa de falso positivo (o una curva ROC completa). Un informe reciente de Olivieri et al. proporciona una descripción general completa de las cifras de estimación de mérito e incertidumbre en la calibración multivariante, incluidas las definiciones multivariantes de selectividad, sensibilidad, SNR y estimación del intervalo de predicción. La selección del modelo quimiométrico generalmente implica el uso de herramientas como el remuestreo (incluido el arranque, la permutación y la validación cruzada).

El control de procesos estadísticos multivariados (MSPC), el modelado y la optimización representan una parte sustancial del desarrollo quimiométrico histórico. La espectroscopia se ha utilizado con éxito para el control en línea de los procesos de fabricación durante 30 o 40 años, y estos datos de proceso son muy aptos para el modelado quimiométrico. Específicamente en términos de MSPC, el modelado multivía de procesos por lotes y continuos es cada vez más común en la industria y sigue siendo un área activa de investigación en quimiometría e ingeniería química. La química analítica de procesos, como se la denominó originalmente, o el término más nuevo, tecnología analítica de procesos, sigue basándose en gran medida en los métodos quimiométricos y MSPC.

Los

métodos multivía se utilizan mucho en aplicaciones quimiométricas. Estas son extensiones de orden superior de métodos más utilizados. Por ejemplo, mientras que el análisis de una tabla (matriz o arreglo de segundo orden) de datos es rutinario en varios campos, los métodos multidireccionales se aplican a conjuntos de datos que involucran órdenes 3, 4 o superiores. Los datos de este tipo son muy comunes en química, por ejemplo, un sistema de cromatografía líquida/espectrometría de masas (LC-MS) genera una gran matriz de datos (tiempo de elución versus m/z) para cada muestra analizada. Los datos a través de múltiples muestras forman así un cubo de datos. El modelado de procesos por lotes involucra conjuntos de datos que tienen tiempo frente a variables de proceso frente a número de lote. Los métodos matemáticos de múltiples vías aplicados a este tipo de problemas incluyen PARAFAC, descomposición trilineal y PLS y PCA de múltiples vías.

Contenido relacionado

Regresión

Regresión o regresiones pueden referirse...

Quiralidad (desambiguación)

Quiralidad es una propiedad de la...

Teoría de la complejidad

Teoría de la complejidad puede referirse...
Más resultados...
Tamaño del texto:
undoredo
format_boldformat_italicformat_underlinedstrikethrough_ssuperscriptsubscriptlink
save