个人简介
我是一名癌症数据科学家,致力于运用人工智能与机器学习方法分析大规模分子数据。本科以一等荣誉学位毕业于莫纳什大学(Monash University)计算机科学专业,并获专业第一名;随后于悉尼大学(University of Sydney)取得癌症数据科学博士学位。在高盛(Goldman Sachs)担任软件工程师多年后,我转入癌症研究领域,现任儿童医学研究所(Children’s Medical Research Institute,CMRI)高级数据科学家,并兼任悉尼大学医学与健康学院兼任讲师(Adjunct Lecturer)。
我的研究聚焦于深度学习方法在癌症多组学数据中的应用,擅长联邦学习、生成模型与 Transformer 架构等方向。作为 Cancer Cell 杂志上 949 株人类癌细胞系泛癌蛋白质组图谱研究的共同第一作者(被引用超过 230 次),我参与构建了该领域被广泛使用的代表性资源;随后以第一作者身份在 Cancer Discovery、Nature Communications 与 Cancer Research Communications 上发表系列工作,分别提出面向癌症亚型分类的隐私保护联邦深度学习框架、用于多组学数据合成增强的生成式 AI 方法,以及结合生物通路信息的 Transformer 多组学整合模型。我与英国 Wellcome Sanger Institute、葡萄牙里斯本大学(Universidade de Lisboa)等机构保持长期的国际合作。
2025 年,我获颁澳大利亚新南威尔士州癌症研究所青年学者基金(Cancer Institute NSW Early Career Fellowship;$597,732,2026–2028),以独立首席研究员身份开展结合联邦学习的蛋白质组基础模型研究,服务多中心癌症诊疗;同时作为联合研究员(Associate Investigator)参与一项面向儿童高级别胶质瘤免疫治疗的医学研究未来基金项目(MRFF;$993,500)。截至目前,我的工作累计获得 900 余次引用(h 指数 8),共参与超过 159 万澳元的竞争性科研经费。
在学术服务方面,我自 2023 年起发起并主持 ProCan 癌症数据科学期刊讨论会(Cancer Data Science Journal Club),并定期为 Nature Communications、Genome Biology、Briefings in Bioinformatics 等期刊审稿,以及为香港创新科技署、荷兰研究理事会(NWO)等机构评审基金申请。我希望将先进的计算方法持续转化为可临床应用的工具,通过精准医疗改善癌症的诊断与预后。
职业任职
- Feb 2023 — 至今
- 研发新型深度学习方法,将人类先验知识引入多组学数据整合
- 设计并构建面向多组学整合的多视图变分自编码器(VAE)模型
- 负责全外显子组与全基因组测序的端到端分析,涵盖胚系/体细胞突变、拷贝数变异与结构变异
- 负责蛋白质组数据的端到端分析,包括质控、肽段–蛋白质归并、预处理、差异表达、通路与生存分析
- 探索病理图像与蛋白质组数据的整合,以辅助肿瘤诊断
- June 2026 — 至今
- 医学与健康学院
- 由联合副讲师(Conjoint Associate Lecturer)晋升而来;上一任期 2023–2026
- June 2023 — June 2026
- 医学与健康学院
- Mar 2020 — Feb 2023
- 博士论文:基于机器学习的大规模泛癌蛋白基因组分析
- Sydney Cancer Partners 博士奖学金获得者
- Jan 2019 — Feb 2020
- 基于现有模型构建小鼠发育生物学单细胞 RNA-seq 分析流程
- 为活细胞成像数据构建深度学习模型
- Nov 2014 — Dec 2017
- 与业务方沟通需求,跟进项目范围与进度
- 为高盛电子交易(GSET)业务流程设计、开发、测试并部署系统方案
- 提供生产环境支持,维护测试环境的稳定运行
学历
癌症数据科学博士(PhD)
博士论文:基于机器学习的大规模泛癌蛋白基因组分析。Sydney Cancer Partners 博士奖学金获得者。
商业分析硕士(一等荣誉)
KPMG–MBS 数据挑战赛自然语言处理方向第一名;商业分析硕士奖学金;商业分析俱乐部联合主席。
计算机科学学士(一等荣誉)
计算机科学专业毕业总成绩第一名;Bellamy Award(2011 与 2012 学年优秀学生奖);International Merit Scholarship。
奖项与荣誉
- 2025 新南威尔士州癌症研究所青年学者基金(Cancer Institute NSW Early Career Fellowship) —— 独立首席研究员$597,732(2026–2028)
- 2024 澳大利亚医学研究未来基金(MRFF) · 早中期研究员资助 —— 联合研究员(Associate Investigator,儿童高级别胶质瘤免疫治疗方向)$993,500(2024–2027)
- 2022 Sydney Cancer Partners 博士奖学金
- 2020 CMRI Peter Rowe 博士奖学金
- 2019 悉尼大学创新挑战赛(University of Sydney Innovation Challenge)一等奖($7,500;2020 年再次获得)
- 2019 ODIR-2019 国际计算机视觉挑战赛三等奖(约 $20,000)
- 2013 莫纳什大学计算机科学专业毕业总成绩第一名(Dux)
学术服务与社区
组织召集、同行评审、基金评审与行业参与。
ProCan 癌症数据科学期刊讨论会(Cancer Data Science Journal Club)
自 2023 年起发起并主持,每月一次。汇集 ProCan 项目中癌症数据科学、软件工程与肿瘤学等团队的 10–15 名研究人员,共同评议癌症数据科学、机器学习与多组学领域的最新工作。
国际期刊审稿
担任 Nature Communications、Genome Biology、Briefings in Bioinformatics 等高水平国际期刊的审稿人,每年若干篇。
国际科研基金评审
担任香港创新科技署(Innovation and Technology Commission,2025)及荷兰研究理事会(Dutch Research Council,NWO,2025)的基金申请外部评审专家。
澳大利亚医学研究所协会(AAMRI)工作组
参与 AAMRI(Association of Australian Medical Research Institutes)相关工作组,将学术服务从机构与期刊层面延伸至全国医学研究领域。
技术技能
机器学习与人工智能
- 深度神经网络
- Transformer
- 变分自编码器(VAE)
- 生成式模型
- 联邦学习
- 多视图整合
生物信息学与多组学
- 蛋白质组学端到端分析(质控、肽段–蛋白质归并、预处理、差异表达、通路与生存分析)
- 全外显子组 / 全基因组测序分析
- 拷贝数变异(CNV)分析
- 结构变异(SV)分析
- 单细胞 RNA 测序(scRNA-seq)
编程语言与环境
- Python
- R
- PyTorch
- SQL
- C++
- Linux
- Perl