跳到正文
ZC

个人简介

我是一名癌症数据科学家,致力于运用人工智能与机器学习方法分析大规模分子数据。本科以一等荣誉学位毕业于莫纳什大学(Monash University)计算机科学专业,并获专业第一名;随后于悉尼大学(University of Sydney)取得癌症数据科学博士学位。在高盛(Goldman Sachs)担任软件工程师多年后,我转入癌症研究领域,现任儿童医学研究所(Children’s Medical Research Institute,CMRI)高级数据科学家,并兼任悉尼大学医学与健康学院兼任讲师(Adjunct Lecturer)。

我的研究聚焦于深度学习方法在癌症多组学数据中的应用,擅长联邦学习、生成模型与 Transformer 架构等方向。作为 Cancer Cell 杂志上 949 株人类癌细胞系泛癌蛋白质组图谱研究的共同第一作者(被引用超过 230 次),我参与构建了该领域被广泛使用的代表性资源;随后以第一作者身份在 Cancer DiscoveryNature CommunicationsCancer Research Communications 上发表系列工作,分别提出面向癌症亚型分类的隐私保护联邦深度学习框架、用于多组学数据合成增强的生成式 AI 方法,以及结合生物通路信息的 Transformer 多组学整合模型。我与英国 Wellcome Sanger Institute、葡萄牙里斯本大学(Universidade de Lisboa)等机构保持长期的国际合作。

2025 年,我获颁澳大利亚新南威尔士州癌症研究所青年学者基金(Cancer Institute NSW Early Career Fellowship;$597,732,2026–2028),以独立首席研究员身份开展结合联邦学习的蛋白质组基础模型研究,服务多中心癌症诊疗;同时作为联合研究员(Associate Investigator)参与一项面向儿童高级别胶质瘤免疫治疗的医学研究未来基金项目(MRFF;$993,500)。截至目前,我的工作累计获得 900 余次引用(h 指数 8),共参与超过 159 万澳元的竞争性科研经费。

在学术服务方面,我自 2023 年起发起并主持 ProCan 癌症数据科学期刊讨论会(Cancer Data Science Journal Club),并定期为 Nature Communications、Genome Biology、Briefings in Bioinformatics 等期刊审稿,以及为香港创新科技署、荷兰研究理事会(NWO)等机构评审基金申请。我希望将先进的计算方法持续转化为可临床应用的工具,通过精准医疗改善癌症的诊断与预后。

职业任职

  1. 高级数据科学家 · 新南威尔士州癌症研究所青年学者(CINSW Fellow)

    儿童医学研究所(CMRI) · Westmead
    Feb 2023 — 至今
    • 研发新型深度学习方法,将人类先验知识引入多组学数据整合
    • 设计并构建面向多组学整合的多视图变分自编码器(VAE)模型
    • 负责全外显子组与全基因组测序的端到端分析,涵盖胚系/体细胞突变、拷贝数变异与结构变异
    • 负责蛋白质组数据的端到端分析,包括质控、肽段–蛋白质归并、预处理、差异表达、通路与生存分析
    • 探索病理图像与蛋白质组数据的整合,以辅助肿瘤诊断
  2. 兼任讲师(Adjunct Lecturer)

    悉尼大学 · Sydney
    June 2026 — 至今
    • 医学与健康学院
    • 由联合副讲师(Conjoint Associate Lecturer)晋升而来;上一任期 2023–2026
  3. 联合副讲师(Conjoint Associate Lecturer)

    悉尼大学 · Sydney
    June 2023 — June 2026
    • 医学与健康学院
  4. 博士研究生

    悉尼大学 / CMRI · Sydney
    Mar 2020 — Feb 2023
    • 博士论文:基于机器学习的大规模泛癌蛋白基因组分析
    • Sydney Cancer Partners 博士奖学金获得者
  5. 数据科学家

    儿童医学研究所(CMRI) · Westmead
    Jan 2019 — Feb 2020
    • 基于现有模型构建小鼠发育生物学单细胞 RNA-seq 分析流程
    • 为活细胞成像数据构建深度学习模型
  6. 分析师程序员(Analyst Programmer)

    高盛(Goldman Sachs) · Melbourne
    Nov 2014 — Dec 2017
    • 与业务方沟通需求,跟进项目范围与进度
    • 为高盛电子交易(GSET)业务流程设计、开发、测试并部署系统方案
    • 提供生产环境支持,维护测试环境的稳定运行

学历

2020 – 2023

癌症数据科学博士(PhD)

悉尼大学 / 儿童医学研究所(CMRI)

博士论文:基于机器学习的大规模泛癌蛋白基因组分析。Sydney Cancer Partners 博士奖学金获得者。

2018

商业分析硕士(一等荣誉)

墨尔本大学商学院(Melbourne Business School)

KPMG–MBS 数据挑战赛自然语言处理方向第一名;商业分析硕士奖学金;商业分析俱乐部联合主席。

2011 – 2014

计算机科学学士(一等荣誉)

莫纳什大学(Monash University)

计算机科学专业毕业总成绩第一名;Bellamy Award(2011 与 2012 学年优秀学生奖);International Merit Scholarship。

奖项与荣誉

学术服务与社区

组织召集、同行评审、基金评审与行业参与。

ProCan 癌症数据科学期刊讨论会(Cancer Data Science Journal Club)

自 2023 年起发起并主持,每月一次。汇集 ProCan 项目中癌症数据科学、软件工程与肿瘤学等团队的 10–15 名研究人员,共同评议癌症数据科学、机器学习与多组学领域的最新工作。

国际期刊审稿

担任 Nature Communications、Genome Biology、Briefings in Bioinformatics 等高水平国际期刊的审稿人,每年若干篇。

国际科研基金评审

担任香港创新科技署(Innovation and Technology Commission,2025)及荷兰研究理事会(Dutch Research Council,NWO,2025)的基金申请外部评审专家。

澳大利亚医学研究所协会(AAMRI)工作组

参与 AAMRI(Association of Australian Medical Research Institutes)相关工作组,将学术服务从机构与期刊层面延伸至全国医学研究领域。

技术技能

机器学习与人工智能

  • 深度神经网络
  • Transformer
  • 变分自编码器(VAE)
  • 生成式模型
  • 联邦学习
  • 多视图整合

生物信息学与多组学

  • 蛋白质组学端到端分析(质控、肽段–蛋白质归并、预处理、差异表达、通路与生存分析)
  • 全外显子组 / 全基因组测序分析
  • 拷贝数变异(CNV)分析
  • 结构变异(SV)分析
  • 单细胞 RNA 测序(scRNA-seq)

编程语言与环境

  • Python
  • R
  • PyTorch
  • SQL
  • C++
  • Linux
  • Perl

合作伙伴与所属机构