医疗大数据挖掘与人工智能是目前当今世界的技术前沿方向,本课程希望通过一段时间的理论与实践教学,让参加的学生能够快速了解行业方向,并基本了解该领域的理论和应用。

主讲老师 周晓华 (azhou@math.pku.edu.cn)
助教 陈堰平 (ypchen.ruc@qq.com)
时间 周四3-4节:第三节10:10—11:00; 第四节11:10—12:00
地点 三教306

一、主要内容

二、目的与要求

教学目的:本课程全面介绍医疗大数据挖掘与人工智能的技术和应用,包括医学大数据分析及智能诊断等方面的理论概述,并结合具体实例进行教学,使学生们能够快速了解相应的技术,为学生们今后在医疗人工智能的研究和应用打下基础。

教学要求:通过讲座让学生掌握医疗大数据挖掘与人工智能的基本理论与流程,通过实践让学生基本掌握基础的知识和方法。

三、主要参考文献

  1. 埃里克 · 托普,颠覆医疗:大数据时代的个人健康革命,电子工业出版社,2012
  2. Katherine Marconi, Harold Lehmann,Big Data and Health Analytics,CRC press,2014
  3. Arvin Agah,Medical Applications of Artificial Intelligence,CRC press,2014

四、各章节学时安排表

时间 主题 主讲
9/14 健康大数据和人工智能综述 周晓华,讲席教授, 北京大学
9/21 国家对健康大数据应用的规划 程龙,国家卫计委卫生发展研究中心信息研究室主任
9/28 医疗大数据的采集 (医疗数据集成,医疗数据标准化医疗数据安全处理) 王琦,北大医信医疗大数据总监
10/12 人机对话 严睿,北京大学助理教授
10/19 知识图谱 邹磊, 北京大学助理教授
10/26 深度学习 朱占星,北京大学助理教授
11/2 自然语言处理 冯岩松,北京大学助理教授
11/9 图片识别与检测的实现 穆亚东,北京大学研究员
11/16 中医大数据分析和知识发现 于彤,中国中医科学院,助理研究员
11/23 中医人工智能 周晓华,黄新霆,杨伟
11/30 用于大数据的线性回归统计学习 周晓华,讲席教授, 北京大学
12/7 用于大数据的分类的统计学习 周晓华,讲席教授, 北京大学
12/14 基因大数据分析 席瑞斌,北京大学助理教授
12/21 高维数据模型变量的选择 贾金柱,北京大学副教授
12/28 医学信息决策与支持系统 孔桂兰,北京大学副教授

五、教学方式

现场讲学与实践作业相结合

六、考试方式

总分100分,其中出勤占20%,课堂表现占10%,项目实践占70%。

七、项目实践描述

  • 选项A (文献综述):
    • 选择一个你感兴趣的问题
    • 搜索解决这一问题的人工智能技术
    • 综述或讨论每种技术的相对优势
  • 选项B (现实世界应用):
    • 选择一个你感兴趣的问题
    • 实现或实验若干种人工智能技术,来解决这一问题
  • 选项C (开发新方法):
    • 找出一个现有方法都无法解决的问题
    • 开发一种新的人工智能技术来解决这个问题
    • 从理论上或实证角度,来评估新方法的性能
  • 选项D (理论分析):
    • 找出一个问题或技术,它的特性(比如,复杂性或性能)没有被很好地理解,研究不足。
    • 分析这一问题或技术的特性
关于项目提案
  • 10月30日11:59之前提交电子版,至少一页
关于项目报告
  • 至少8页
  • 解释问题的全貌以及必要的细节
  • 2018年1月10日11:59之前提交电子版
报告的推荐结构
  • 选项A (文献综述):
    • 引言
      • 问题是什么?
      • 为什么这个问题重要?
    • 概述
      • 总结本课程(也就是你读的6~10篇论文)提到的相关技术指出它们的优缺点
      • 提示:摘要不能是逐段介绍每种技术的列表
      • 建议:基于技术的有用特性来组织摘要。
    • 分析:
      • 有哪些最新技术?
      • 还有哪些未解决的问题?
    • 结论
      • 你从中学到了什么?
      • 你建议未来做哪些研究?
  • 选项B (现实世界的应用):
    • 引言
      • 问题是什么?
      • 为什么这个问题重要?
    • 解决该问题的技术
      • 关于这个问题,前人工作(也就是你阅读的6~10篇论文)的简要概述
      • 选技术的简要描述,以及为什么选择这些技术
    • 实证评估
      • 通过实证来比较这些技术的复杂性、性能以及易用性等方面
    • 结论:
      • 最好的技术是什么?
      • 有没有足够好的技术声明已经解决了这个问题
      • 你建议未来做哪些研究?
  • 选项C (新方法的开发):
    • 引言
      • 问题是什么?
      • 为什么现有的技术不能有效地解决这个问题
      • 你开发的新方法背后的直觉是什么?
    • 解决该问题的技术
      • 关于这个问题,前人工作(也就是你读的3~6篇论文)的简要概述
      • 描述你开发的新方法
      • 简要描述你想做对比的现有方法
    • 评估
      • 分析并比较(理论上或实证上)你的新方法与已有的方法之间的不同
    • 结论
      • 你的新方法是否能有效解决问题
      • 你建议未来做哪些研究?
  • 选项D (理论分析):
    • 引言
      • 问题是什么,或要分析的技术是什么?
      • 关于这一问题或技术,你要分析或证明的特性是什么?
    • 分析
      • 关于这个问题,前人工作(也就是你读的3~6篇论文)的简要概述
      • 描述你所进行的分析
    • 结论
      • 关于你所分析的问题或技术,你有哪些发现?
      • 你建议未来做哪些研究?