EL METABOLOMA DE LA SEMILLA DE AVENA

Novedades

Resúmenes amplios

EL METABOLOMA DE LA SEMILLA DE AVENA

Ithaca, EE.UU.: El presente estudio proporciona una base necesaria para caracterizar el metaboloma de la semilla de avena y desarrollar nuevos recursos genómicos para que los cultivadores de avena mejoren las cualidades de la semilla.

Genetics 217(3):1-14

Autores:
Jannink JL, Hu H, Campbell MT

Institución/es participante/s en la investigación:
Cornell University

Título original:
Translating Insights from the Seed Metabolome Into Improved Prediction for Lipid-composition Traits in Cat (Avena sativa L.)

Título en castellano:
Traducir los Conocimientos del Metaboloma de la Semilla en una Mejor Predicción de los Rasgos de Composición de Lípidos en la Avena (Avena sativa L.)

Extensión del Resumen-SIIC en castellano:
2.93 páginas impresas en papel A4

ReSIIC editado en:

Genética Humana
Nutrición

Endocrinología y Metabolismo
Salud Pública

Introducción

La avena (Avena sativa L.) es considerada un alimento saludable, y se ha demostrado que mejora la salud cardiovascular y ayuda a controlar los niveles de glucosa en sangre. La avena es una fuente de proteínas, aceite, fibra, vitaminas y minerales. En la actualidad, este alimento se utiliza para hacer productos de yogur y leche no lácteos. La avena coloidal también se utiliza como medicamento tópico para tratar la dermatitis cutánea y reducir la inflamación. Por lo tanto, tiene efectos multifacéticos sobre la salud humana. Los avances tecnológicos permiten analizar y mejorar la calidad de los alimentos mediante la genética. Para mejorar las propiedades bioquímicas específicas de la avena, los fitomejoradores deben contar con un conjunto de herramientas que permitan cuantificar con precisión los compuestos de la semilla de avena a bajo costo y con recursos genómicos que mejoren la selección para calidades específicas de semillas. La metabolómica no dirigida permite evaluar y cuantificar numerosos metabolitos en una muestra. Además, proporciona información para mejorar la predicción de rasgos complejos. No obstante, analizar estos datos para comprender la biología del metaboloma de las semillas puede ser un desafío. Los enfoques no supervisados y basados en datos brindan una alternativa atractiva que utiliza los datos de manera más completa. Esto permite descomponer la matriz de metabolitos en una combinación lineal de dimensiones inferiores de cargas factoriales, que describen cómo cada factor latente contribuye a cada compuesto. La mejora de los compuestos promotores de la salud o relacionados con la calidad requiere descomponer la variación fenotípica dentro del metaboloma en componentes genéticos y no genéticos, y utilizar estos resultados para informar las decisiones de selección de fenotipos relacionados con la calidad. Si se sabe qué metabolitos están relacionados con los rasgos de calidad y se han identificado variantes asociadas con estos metabolitos, los marcadores genómicos se pueden dividir para definir conjuntos de marcadores informados biológicamente que deberían enriquecerse para los loci causales y mejorar la predicción de valores genómicos.

El objetivo del presente estudio fue caracterizar los metabolomas de semillas de 375 líneas de avena diversas y buscar identificar loci que potencialmente influyen en la (co) variación entre diversos metabolitos.

Métodos

El panel de diversidad de avena consta de 375 entradas derivadas de programas de mejoramiento en América del Norte y Europa. Se utilizaron 335 líneas con datos genotípicos para análisis genéticos posteriores sobre factores latentes. El análisis de factores latentes se realizó utilizando las mejores predicciones lineales insesgadas eliminadas para 367 entradas y 1668 metabolitos. Se utilizaron las jerarquías taxonómicas de ClassyFire para 562 metabolitos para probar el enriquecimiento funcional de cada factor latente. Para identificar los loci asociados con factores latentes, se utilizó un modelo lineal mixto ajustado a los puntajes de los factores para cada factor latente. El estudio de asociación de genoma completo (GWAS, genome-wide association study) se realizó utilizando 62 049 marcadores de polimorfismo de nucleótido único (SNP, single nucleotide polymorphism), con una frecuencia de alelos menores > 0.05 y 335 individuos con datos de marcadores y puntuaciones de factores. Para estimar la poligenicidad de cada factor, se aplicó un enfoque de regresión bayesiana de genoma completo. Se utilizaron dos estudios para determinar si las asociaciones de GWAS basadas en puntajes de factores podrían mejorar la precisión de la predicción genómica. Los efectos genéticos aditivos se predijeron utilizando dos núcleos. La precisión de la predicción se evaluó mediante una validación cruzada de cinco veces con 50 ciclos de remuestreo, y se calculó utilizando la correlación de Pearson entre los fenotipos observados y los valores genómicos predichos para las entradas en el conjunto de pruebas. Los valores genómicos para el enfoque de múltiples núcleos se calcularon como la suma de los valores genéticos de cada efecto genético aleatorio. Los coeficientes de correlación se promediaron entre pliegues.

Resultados

El panel de diversidad constaba de 367 entradas que podrían dividirse en 6 grupos genéticos distintos utilizando un enfoque de agrupamiento. El grado de estratificación dentro de la población fue menor. En total, se cuantificaron 1668 metabolitos en las 367 entradas. El análisis de componentes principales de todo el conjunto de datos del metaboloma no reveló ningún agrupamiento aparente entre las entradas, y las pruebas de estratificación entre los grupos genéticamente definidos no fueron visualmente aparentes. El análisis de varianza de una vía para cada uno de los 1668 metabolitos reveló que, a pesar de que no hubo una fuerte diferenciación del metaboloma entre los 6 grupos, casi el 41% de los 1668 metabolitos demostraron diferencias significativas entre una o más de las subpoblaciones. Además, se observó que la mayoría de los compuestos que difieren entre los grupos divergen debido a la deriva o la selección débil. Solo cuatro de estos compuestos tienen anotaciones y se describieron como glucósidos esteroides putativos, glucósidos terpénicos, triterpenoides y 1-benzopirano. Estos resultados sugieren que los metabolitos divergentes se deben, en gran medida, a la deriva más que a la selección. El modelo de factores latentes reveló que la covarianza común en el metaboloma de la semilla de avena podría capturarse utilizando 100 factores latentes que explicaron, colectivamente, el 58.8% de la varianza total en los datos de los metabolitos. De los 100 factores identificados, 37 demostraron un enriquecimiento significativo en una o más categorías en el nivel de superclase, mientras que 40 y 36 factores demostraron un enriquecimiento significativo en el nivel de clase y los niveles de subclase, respectivamente. Las clases funcionales asociadas con los lípidos se enriquecieron con mayor frecuencia, lo que indica que numerosos factores pueden estar capturando componentes del metabolismo de los lípidos. Además de los lípidos, cuatro factores demostraron un enriquecimiento significativo de carbohidratos y conjugados de carbohidratos, así como de aminoácidos. Estos resultados sugieren que numerosos factores latentes están capturando procesos biológicos significativos que dan forma al metaboloma de la semilla, y pueden ayudar a arrojar luz sobre el significado de los metabolitos no anotados. La alta frecuencia de enriquecimiento de las clases funcionales de metabolitos, así como la cantidad relativamente pequeña de variación que se atribuyó a las subpoblaciones, sugiere que estas construcciones pueden proporcionar información bioquímicamente significativa sobre el metaboloma de la semilla. Las estimaciones de heredabilidad en sentido estricto variaron de 0.01 a 0.80, lo que indica que la variación de numerosos de los factores latentes podría atribuirse a efectos genéticos aditivos. Además, esta variación genética se manifiesta en una amplia gama de arquitecturas. La distribución de los valores de carga para cada factor latente varió. Los factores que capturan (co) varianza entre numerosos metabolitos tienden a ser controlados por diversos loci con efectos pequeños. Sin embargo, se observaron varias excepciones a esta relación. Los resultados de los modelos de predicción indicaron que la señal genética capturada por factores latentes se puede aprovechar para mejorar la selección de las características de composición de las semillas en la avena.

Discusión

Los avances en la elaboración de perfiles metabólicos durante los últimos 20 años han proporcionado un conjunto de herramientas para evaluar exhaustivamente los compuestos bioquímicos de la avena y dilucidar su regulación genética. Esto serviría para producir avena con perfiles nutricionales beneficiosos para el consumidor. Sin embargo, esto no es tan sencillo. A pesar de poder detectar de manera confiable la abundancia de 1668 compuestos en el presente estudio, se anotaron menos de un tercio de estos compuestos. El enriquecimiento proporciona un enfoque basado en datos para generar hipótesis para estos metabolitos no anotados. Un patrón general observado en los factores latentes es el enriquecimiento de compuestos relacionados con el metabolismo de los lípidos. En el nivel de superclase, el 21% de los factores se enriquecieron significativamente en “moléculas lipídicas y similares a lípidos”, y estos patrones fueron congruentes en niveles más especializados de metabolismo lipídico. La avena es única entre los cereales, tanto en la abundancia como en la distribución de lípidos dentro de la semilla. Los compuestos involucrados en la misma vía estarían correlacionados, y dado que los factores latentes se definen por estas correlaciones, en cierto sentido deberían ser una abstracción de estas vías. Aunque puede parecer razonable sugerir que la covarianza observada entre los metabolitos se debe a una causa biológica que se manifiesta en el metaboloma, hacer inferencias causales a partir de datos de observación no es trivial debido a la presencia de factores de confusión, y parte de esta covarianza se pueda atribuir a la estructura de la población, que puede influir en la construcción de variables latentes si no se tiene en cuenta. Las mayores mejoras en la precisión de la predicción entre todos los rasgos para el modelo de predicción biológicamente informado se obtuvo cuando el núcleo se construyó utilizando asociaciones para factores enriquecidos con lípidos. Aunque es difícil conectar loci vinculados con factores latentes con cambios en metabolitos específicos, los resultados del presente análisis de poligenicidad sugieren que estos loci pueden afectar a numerosos metabolitos. La relación positiva observada entre la magnitud de la poligenicidad y las densidades de carga indica que es probable que los factores latentes que influyen en numerosos metabolitos tengan una arquitectura genética compleja. Si estos factores latentes densos son representativos de un componente central de los metabolomas, las perturbaciones en estos procesos probablemente resultarían en cambios a gran escala en el metaboloma y podrían afectar la aptitud. Por lo tanto, es importante que estos procesos sean resistentes a las mutaciones y se mantengan. Si bien se desconoce si el contenido de lípidos de la semilla tiene algún significado adaptativo en la avena, el contenido de lípidos y los rasgos que están correlacionados genéticamente con el contenido de lípidos son objetivos importantes para numerosos programas de mejoramiento. En consecuencia, las arquitecturas oligogénicas de los factores enriquecidos con lípidos pueden ser un reflejo de esta selección relativamente reciente de los criadores de lípidos, o rasgos que están correlacionados genéticamente con los lípidos.

Conclusiones

El presente estudio demuestra que es posible traducir el conocimiento biológico obtenido mediante de la caracterización de datos "ómicos" de alta dimensión, para mejorar la predicción y la selección de rasgos de importancia agrícola. La señal genética se puede aprovechar para mejorar la predicción en poblaciones independientes, así como para fenotipos de bajo costo que proporcionan una aproximación de los atributos bioquímicos.