湖北农业科学 ›› 2025, Vol. 64 ›› Issue (7): 203-206.doi: 10.14088/j.cnki.issn0439-8114.2025.07.035
向冲, 陈璨
XIANG Chong, CHEN Can
摘要: 通过优化基因型填充算法和筛选最优回归模型,建立适用于低深度测序基因组数据分析的新方法。结果表明,相较于优化前的算法,优化后基因型填充算法的准确率从95%提升至98%,同时通过参数调优与高效算法选择使单次填充时间由24 h缩短至12 h,处理效率明显提高。对于连续型表型分析(如GWAS中的数量性状),岭回归模型、线性回归模型表现较好,在1.0×测序深度下,岭回归模型、线性回归模型的MSE分别为0.07、0.08,Accuracy分别为0.82、0.80。在处理分类问题(如基因组选择)时,Logistic回归模型凭借概率化建模特性展现出明显优势,该模型在分类性能上表现较好(AUC=0.90),明显优于线性回归模型(AUC=0.85)。
中图分类号: