Downloads provided by UsageCounts
pmid: 38475993
handle: 10261/359180
La sélection génomique, l'application de modèles de prédiction génomique (GP) pour sélectionner des individus candidats, a considérablement progressé au cours des deux dernières décennies, accélérant efficacement les gains génétiques dans la sélection végétale. Cet article fournit un aperçu holistique des facteurs clés qui ont influencé la médecine générale dans la sélection végétale au cours de cette période. Nous nous sommes penchés sur les rôles essentiels de la formation de la taille de la population et de la diversité génétique, et de leur relation avec la population reproductrice, dans la détermination de la précision de la GP. Un accent particulier a été mis sur l'optimisation de la taille de la population de formation. Nous avons exploré ses avantages et les rendements décroissants associés au-delà d'une taille optimale. Cela a été fait tout en tenant compte de l'équilibre entre l'allocation des ressources et la maximisation de la précision de la prédiction grâce aux algorithmes d'optimisation actuels. La densité et la distribution des polymorphismes mononucléotidiques, le niveau de déséquilibre de liaison, la complexité génétique, l'héritabilité des traits, les méthodes statistiques d'apprentissage automatique et les effets non additifs sont les autres facteurs essentiels. En utilisant le blé, le maïs et la pomme de terre comme exemples, nous résumons l'effet de ces facteurs sur la précision de la GP pour divers traits. La recherche d'une grande précision dans GP - atteignant théoriquement un en utilisant la corrélation de Pearson comme mesure - est un domaine de recherche actif encore loin d'être optimal pour divers traits. Nous émettons l'hypothèse qu'avec des tailles ultra-élevées d'ensembles de données génotypiques et phénotypiques, des méthodes efficaces d'optimisation de la population de formation et le soutien d'autres approches omiques (transcriptomique, métabolomique et protéomique) associées à des algorithmes d'apprentissage profond pourraient surmonter les limites des limitations actuelles pour atteindre la plus grande précision de prédiction possible, faisant de la sélection génomique un outil efficace dans la sélection végétale.
La selección genómica, la aplicación de modelos de predicción genómica (GP) para seleccionar individuos candidatos, ha avanzado significativamente en las últimas dos décadas, acelerando efectivamente las ganancias genéticas en el fitomejoramiento. Este artículo proporciona una visión general holística de los factores clave que han influido en la GP en el fitomejoramiento durante este período. Profundizamos en los roles fundamentales de la capacitación del tamaño de la población y la diversidad genética, y su relación con la población reproductora, para determinar la precisión del médico de cabecera. Se hizo especial hincapié en la optimización del tamaño de la población de formación. Exploramos sus beneficios y los rendimientos decrecientes asociados más allá de un tamaño óptimo. Esto se hizo teniendo en cuenta el equilibrio entre la asignación de recursos y la maximización de la precisión de la predicción a través de los algoritmos de optimización actuales. La densidad y distribución de los polimorfismos de un solo nucleótido, el nivel de desequilibrio de ligamiento, la complejidad genética, la heredabilidad de los rasgos, los métodos estadísticos de aprendizaje automático y los efectos no aditivos son otros factores vitales. Usando trigo, maíz y papa como ejemplos, resumimos el efecto de estos factores en la precisión de la GP para varios rasgos. La búsqueda de una alta precisión en la GP, que teóricamente alcanza uno cuando se usa la correlación de Pearson como métrica, es un área de investigación activa que aún está lejos de ser óptima para varios rasgos. Planteamos la hipótesis de que con tamaños ultra altos de conjuntos de datos genotípicos y fenotípicos, métodos efectivos de optimización de la población de entrenamiento y el apoyo de otros enfoques ómicos (transcriptómica, metabolómica y proteómica) junto con algoritmos de aprendizaje profundo podrían superar los límites de las limitaciones actuales para lograr la mayor precisión de predicción posible, haciendo de la selección genómica una herramienta efectiva en el fitomejoramiento.
Genomic selection, the application of genomic prediction (GP) models to select candidate individuals, has significantly advanced in the past two decades, effectively accelerating genetic gains in plant breeding. This article provides a holistic overview of key factors that have influenced GP in plant breeding during this period. We delved into the pivotal roles of training population size and genetic diversity, and their relationship with the breeding population, in determining GP accuracy. Special emphasis was placed on optimizing training population size. We explored its benefits and the associated diminishing returns beyond an optimum size. This was done while considering the balance between resource allocation and maximizing prediction accuracy through current optimization algorithms. The density and distribution of single-nucleotide polymorphisms, level of linkage disequilibrium, genetic complexity, trait heritability, statistical machine-learning methods, and non-additive effects are the other vital factors. Using wheat, maize, and potato as examples, we summarize the effect of these factors on the accuracy of GP for various traits. The search for high accuracy in GP-theoretically reaching one when using the Pearson's correlation as a metric-is an active research area as yet far from optimal for various traits. We hypothesize that with ultra-high sizes of genotypic and phenotypic datasets, effective training population optimization methods and support from other omics approaches (transcriptomics, metabolomics and proteomics) coupled with deep-learning algorithms could overcome the boundaries of current limitations to achieve the highest possible prediction accuracy, making genomic selection an effective tool in plant breeding.
تقدم الانتقاء الجيني، وهو تطبيق نماذج التنبؤ الجيني (GP) لاختيار الأفراد المرشحين، بشكل كبير في العقدين الماضيين، مما أدى إلى تسريع المكاسب الجينية في تربية النباتات بشكل فعال. تقدم هذه المقالة نظرة عامة شاملة على العوامل الرئيسية التي أثرت على الممارس العام في تربية النباتات خلال هذه الفترة. لقد بحثنا في الأدوار المحورية لتدريب حجم السكان والتنوع الوراثي، وعلاقتها بالسكان الذين يتكاثرون، في تحديد دقة الممارس العام. تم التركيز بشكل خاص على تحسين حجم مجتمع التدريب. لقد استكشفنا فوائدها والعوائد المتناقصة المرتبطة بها بما يتجاوز الحجم الأمثل. وقد تم ذلك مع مراعاة التوازن بين تخصيص الموارد وتعظيم دقة التنبؤ من خلال خوارزميات التحسين الحالية. ومن العوامل الحيوية الأخرى كثافة وتوزيع تعدد الأشكال أحادية النوكليوتيد، ومستوى اختلال التوازن الرابط، والتعقيد الجيني، ووراثة السمات، وطرق التعلم الآلي الإحصائية، والآثار غير المضافة. باستخدام القمح والذرة والبطاطس كأمثلة، نلخص تأثير هذه العوامل على دقة الممارسة العامة لمختلف الصفات. إن البحث عن دقة عالية في الممارس العام - من الناحية النظرية الوصول إلى واحد عند استخدام ارتباط بيرسون كمقياس - هو مجال بحث نشط بعيد كل البعد عن المثالية للسمات المختلفة. نحن نفترض أنه مع الأحجام العالية جدًا لمجموعات البيانات الوراثية والظاهرية، يمكن لطرق تحسين مجتمع التدريب الفعالة والدعم من مناهج omics الأخرى (علم النسخ، علم الأيض وعلم البروتينات) إلى جانب خوارزميات التعلم العميق التغلب على حدود القيود الحالية لتحقيق أعلى دقة تنبؤ ممكنة، مما يجعل الاختيار الجيني أداة فعالة في تربية النباتات.
Biología, Trait, Evolutionary biology, Plant Science, Gene, Training population optimization, Plant breeding, Agricultural and Biological Sciences, Computational biology, Selection (genetic algorithm), Cultivar Evaluation and Mega-Environment Investigation, Sociology, Single-nucleotide polymorphism, Genome, Agricultura, Life Sciences, Single Nucleotide, Genomics, Plants, Genomic prediction optimization, FOS: Sociology, Programming language, Genomic Selection, Genetic Mapping, Phenotype, Genetic Architecture of Quantitative Traits, Genetic gain, Genomic Selection in Plant and Animal Breeding, Genome, Plant, Biotechnology, Genotype, Population, Polymorphism, Single Nucleotide, Heritability, Genetic, Genetic Value Prediction, Biochemistry, Genetics and Molecular Biology, Machine learning, Genetics, Linkage disequilibrium, Humans, Genetic variation, Polymorphism, Selection, Genetic, Selection, Biology, Demography, Genomic selection, Deep learning, Plant, Computer science, Agronomy, Plant Breeding, FOS: Biological sciences, Population Genetics
Biología, Trait, Evolutionary biology, Plant Science, Gene, Training population optimization, Plant breeding, Agricultural and Biological Sciences, Computational biology, Selection (genetic algorithm), Cultivar Evaluation and Mega-Environment Investigation, Sociology, Single-nucleotide polymorphism, Genome, Agricultura, Life Sciences, Single Nucleotide, Genomics, Plants, Genomic prediction optimization, FOS: Sociology, Programming language, Genomic Selection, Genetic Mapping, Phenotype, Genetic Architecture of Quantitative Traits, Genetic gain, Genomic Selection in Plant and Animal Breeding, Genome, Plant, Biotechnology, Genotype, Population, Polymorphism, Single Nucleotide, Heritability, Genetic, Genetic Value Prediction, Biochemistry, Genetics and Molecular Biology, Machine learning, Genetics, Linkage disequilibrium, Humans, Genetic variation, Polymorphism, Selection, Genetic, Selection, Biology, Demography, Genomic selection, Deep learning, Plant, Computer science, Agronomy, Plant Breeding, FOS: Biological sciences, Population Genetics
| selected citations These citations are derived from selected sources. This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | 142 | |
| popularity This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network. | Top 1% | |
| influence This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | Top 10% | |
| impulse This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network. | Top 0.1% |
| views | 70 | |
| downloads | 117 |

Views provided by UsageCounts
Downloads provided by UsageCounts