实验室主题导读

基因组序列是生命万物的源代码,决定着大多数疾病表型的发生发展。 然而序列变异与人类疾病表型之间有着高维度、时空特异等复杂的关系,解析两者关系是现代精准医学的核心动力,决定着未来精准医学发展的深度和广度。 我们“精准医学基因组学实验室”聚焦精准医学领域,基于高通量基因组学与表型组学大数据,长期致力于构建推断结果更准确、解析更深入、速度更轻快的统计学习模型和计算软件, 使得“破解疾病的遗传密码”这一极具挑战性的工作变得可行、高效。从学科属性上讲,精准医学基因组学也是时代大潮下新生的重点热门交叉学科之一, 该领域吸纳了生物、医学、数理等专业的优秀人才,通力合作以推进学科发展。

Research Theme Illustration

实验室团队简介

本精准医学基因组学实验室,由李淼新教授2013年组建于香港大学医学院, 2016年迁至中山大学中山医学院,肩负破解人类疾病遗传密码的使命,培养的多名博士和博士后成员已获得教授等正高级职称。 实验室现有博士后5名,硕、博士生10余名,组成了一支新老结合、多学科背景的研究队伍。 经过近十年的积累,实验室已经拥有大量的疾病基因组分析的原创项目代码、多组学测序数据、分析流程、教材体系、服务器平台等。 实验室实行“以人为本”的管理与培养理念,采用因材施教、兴趣驱动和形式自由的模式, 引导学生“开心地”从事科学研究,形成了“创新、严谨、民主、担当”的实验室文化。

实验室研究简介

本实验室长期致力于基于基因组大数据解析疾病表型遗传密码的方法学研究, 重点关注罕见病基因组学、复杂疾病基因组学、肿瘤基因组学以及药物基因组学四大领域。 同时在大规模基因组测序数据挖掘领域,我们系统性地研发了多项被国际同行熟知的分析方法和专业分析软件, 如 KGG, KGGSeq, KGGSEE等。目前课题组主要有以下三大研究方向:

1. 统计模型创建:

构建统计或智能学习模型来整合基因组、转录组等多组学数据,以定位致病突变和基因、 解析突变相关的病理生理机制,评估个体的遗传学疾病风险以及筛选有效的治疗药物等全流程方法。

相关成果: J Hum Genet. 2022; Acids Res. 2022; Genome Biol. 2019; Acids Res. 2019; Acids Res. 2022;

2. 高性能算法开发:

研发快速处理和注释大规模全基因组DNA/RNA测序数据的通用高效算法和软件.

相关成果: Acids Res. 2017; Acids Res. 2012; Patent application number:202011371618.0

3. 疾病基因组分析:

应用多组学数据整合方法对具体疾病(包括肿瘤、脑科疾病等)进行系统的遗传学挖掘分析.

相关成果: Elife. 2022; Cell Infect Microbiol. 2022; BMC Neurol. 2021; Neurobiol Aging. 2017; Am Heart Assoc. 2017;

代表性科研项目

  1. 推断复杂疾病直接关联基因的孟德尔随机化方法研究和应用(32170637) 国家自然科学基金面上项目 2022-2025 主持
  2. 基于截断负二项分布的癌症驱动基因统计检验方法研究及其应用(31970650) 国家自然科学基金面上项目 2020-2023 主持
  3. 结合基因条件关联检验和组织特异性表达谱解析全基因组关联信号的方法研究(31771401)国家自然科学基金面上项目2018-2021 主持
  4. 精准医学大数据的有效挖掘与关键信息技术研发(2018YFC0910503) 国家重点研发计划资助“精准医学研究”重大专项项目
  5. Development of multivariate gene-based association analysis approaches for endophenotypes of complex diseases and their application to genetic mapping in a Chinese schizophrenia sample (02132236) 香港健康医疗研究基金项目 8-2017.7 主持 98.96万元港元 已结题 (2021年获基金会10周年庆杰出成果奖)

Representative Research Achievements

  1. Jiang L#, Xue C# Dai S, Chen S, Chen P, Sham PC, Wang H*†, Li M*†. DESE: estimating driver tissues by selective expression of genes associated with complex diseases or traits, Genome Biology, 2019, 20(1): 233
  2. Jiang L, Miao L, Yi G, Li X, Xue C, Li MJ, Huang H, Li M*†. Powerful and robust inference of complex phenotypes’ causal genes with dependent expression quantitative loci by a median-based Mendelian randomization. Am J Hum Genet. 2022 May 5;109(5):838-856.
  3. Liubin Zhang, Yangyang Yuan, Wenjie Peng, Bin Tang, Mulin Jun Li, Hongsheng Gui, Qiang Wang, Li M*†. GBC: a parallel toolkit based on highly addressable byte-encoding blocks for extremely large-scale genotypes of species. Genome Biol 24, 76 (2023).
  4. 一种大规模基因型数据区块压缩算法及计算机设备 专利申请,申请号:202011371618.0
  5. 临床医学8年制《生物信息学》教材《疾病基因组分析原理与方法》章节(人民卫生出版社)