5月19日,我院成功举办了统计大讲堂第十一讲。此次讲座,我院有幸邀请到了杜克大学的谢季纯助理教授来给大家介绍她的研究成果。
讲座开始前,我院副院长尹建鑫副教授对谢教授的到来表示欢迎。并简要介绍了谢教授的毕业院校和师承关系。在谢教授今天题为“控制错误发现率下高维网络的分位相关性的推断方法”的报告中,谢教授首先介绍到,在他们的研究问题中,他们想要发现基因共表达(gene co-expression)网络。有了基因共表达网络后,我们就可以对基因的相互作用,或者基因的变化进行研究。谢教授介绍,比如对癌症研究,我们可以通过基因共表达网络研究癌症前期和癌症后期某些重要基因的变化情况,从而有助于对癌症的研究。然后,谢教授介绍,基于这一问题,他们想要对基因表达数据进行研究。而现有的线性和半线性的方法的线性相关性假设在现实问题中都太严格了,现实问题中可能存在非线性的相关性,或者未观测到的潜在变量等问题。所以,谢教授考虑非线性的方法来对基因表达数据的相关性进行研究。接着,谢教授介绍他们的方法是从传统的Pearson卡方独立性检验得到启发。传统的卡方检验能对分类变量进行处理,但是对于连续变量,将其离散化成分类变量时确定分位点是一个问题。于是,谢教授提出,在有协变量时下,对每个基因表达数据分别进行分为回归来确定分点,再对所有基因数据两两地计算出独立性检验中的卡方统计量,再对所有卡方统计量进行截断判别,就可以得到对多个基因进行共同检验的多重假设检验,并且在原假设下,能够推导出检验统计量的极限分布仍为一个卡方分布。此外,整个多重假设检验过程,还能控制住错误发现率,使得这种方法在医学上也有较好的意义。最后,谢教授展示了他们的方法在模拟和真实数据分析中,当基因之间具有复杂相关性的情况下,较之现有的方法有相当的优势。
报告结束后,谢教授与老师同学们就高维情况,检验网络的动态变化等内容进行了积极的讨论。最后,谢教授还与同学们交流了自己在学术研究方面的经验,同学们就论文发表,学术规划,研究要求等方面提出了不少问题,谢教授都一一回答了同学们的疑惑,同学们都表示收获良多。