北京大学生命科学学院~生命科学联合中心

生物信息平台系列讲座

序号

时间

报告人

题目

地点

1

2014-4-23

Vanderbilt大学

Yu Shyr

Scenes behind statistical and bioinformatic papers

北京大学金光楼

610会议室

2

2014-6-5

哈佛大学

Peter Sicinski

Cell cycle machinery in development and in cancer

北京大学金光楼

101报告厅

3

2014-6-26

斯坦福大学

Wing H Wong

统计学、基因组学的现状和前瞻

北京大学金光楼

610会议室

4

2014-9-18

中科院上海生科院

季红斌

Evidences and mechanisms for the transdifferentiation of lung adenocarcinoma to squamous cell carcinoma

北京大学金光楼

101报告厅

5

2014-12-16

北京大学生科院

李程

不用编程就可以做生物信息分析的网站

北京大学金光楼

610会议室

6

2015-1-22

北京大学生科院

李程

清楚有效的统计和生信做图:探索数据和表达想法

北京大学金光楼

101报告厅

7

2015-5-27

北京大学生科院

张超

RNA-Seq数据分析基础

北京大学金光楼

311会议室

8

2015-12-6

Emory大学

秦昭晖

Improving hierarchical models using historical data with applications to microarray data analysis

北京大学王克桢楼

311会议室

9

2016-3-31

安诺优达公司

陈重建

3D基因组中Hi-C测序技术及应用解析

北京大学王克帧楼

348会议室

10

2016-5-4

哈佛大学

Peter Sicinski

Cell cycle-targeting microRNAs as therapeutic tools against refractory cancers

北京大学金光楼

101报告厅

11

2016-5-18

中科院北京基因组所

凌少平

Redefining cancer genomics with population and evolutionary genetics

北京大学王克桢楼

311会议室

12

2016-6-8

Virginia大学

臧充之

Modeling Gene Regulation with Genomic Data Integration

北京大学王克桢楼

311会议室

13

2016-8-10

 

Baylor医学院

李蔚

Novel Biological Insights from Existing Big Data in Cancer Epigenome and Transcriptome

北京大学王克帧楼

348会议室

 

14

2016-9-1

Feinstein医学研究所

李文田

科研写作与投稿

北京大学王克桢楼

311会议室

15

2016-9-19

百迈客公司

闵浩巍

百迈客生物信息云平台介绍

北京大学王克桢楼

348会议室

16

2017-1-4

未来组公司

汪德鹏

第三代测序技术的机遇

北京大学王克桢楼

348会议室

17

2017-3-15

哈佛大学

Peter Sicinski

G1 cyclins link proliferation, pluripotency and differentiation of stem cells

北京大学王克桢楼

348会议室

18

2017-5-17

University of lowa

Dan Nettleton

Accounting for Within-gene Correlation Structure in RNA-seq Differential Expression Analysis

北京大学王克桢楼

348会议室

19

2017-5

斯坦福大学

Wing H Wong

待定

北京大学王克桢楼

348会议室

 

 

 

标题:生物信息平台讲座详情

时间:2015年12月6日,下午13:00-14:30

地点:王克桢楼311室

报告人:秦昭晖 Associate Professor of Biostatistics and Bioinformatics at Emory University

摘要:
Modern high throughput biotechnologies such as microarray and next generation sequencing produce massive amount of information for each sample assayed. However, in a typical high throughput experiment, only very limited amount of data are observed for each individual feature, thus the classical large p, small n problem. Bayesian hierarchical model, capable of borrowing strength across features within the same dataset, has been recognized as an effective tool in analyzing such data. However, the shrinkage effect, the most prominent feature of hierarchical features, can lead to undesirable over-correction for some features. In this work, we discuss possible causes of the over-correction problem and propose several alternative solutions. Our strategy is rooted in the facts that in Big Data era, large amount of historical data are available which should be taken advantage of. Our strategies present a new framework to enhance the Bayesian hierarchical models. Through simulation and real data analysis, we demonstrated superior performance of the proposed strategies.

报告人简介:
Steve Qin is an Associate Professor of Biostatistics and Bioinformatics at Emory University. He received his PhD degree in Statistics from the University of Michigan and was a Postdoctoral Fellow at the Department of Statistics of Harvard University. The major goal of Dr. Qin’s work is to utilize his extensive training in statistics to provide analytical tools for the genetics and genomics research community. His current research focuses on topics such as developing and evaluating model-based methods to analyze high-throughput genomics and epigenomics data from ChIP-Seq, RNA-Seq, WGBS and Hi-C experiments. In addition to method development, he has collaborated extensively with biologists and clinicians to assist their efforts of extracting novel insights from biomedical data.

资料下载:

标题:北京大学生科院/生命科学联合中心生物信息平台暑期培训班详情

时间:2015年8月3日-8月7日,下午3:30-5:00

地点:王克桢楼348室

报告人:张超,生物信息平台技术员

摘要:北京大学生科院/生命科学联合中心生物信息平台旨在帮助、指导湿实验室进行相关的生物信息学分析。随着二代测序(NGS)技术的飞速发展,其高通量、低成本、快速高效的优点,使得其成为了生物实验室常用的技术手段。但由于其后续的数据处理的复杂性,一些传统湿实验室较难自己掌握后续的数据分析

为此我们将在2015年8月3日(周一)到8月7日(周五)开展一个二代测序数据分析的免费暑期培训班,预计每天1.5小时。这个培训班针对有测序分析需求的实验室中希望掌握测序数据分析的同学。我们将从基础的计算机操作系统开始,到二代测序中的常见分析,注重动手操作和实践,参加的学生需自带笔记本电脑。欢迎大家踊跃报名,或向实验室同学转发此信息。

资料下载:

标题:RNA-Seq数据分析基础详情

时间:2015年5月27日,周三下午3:30-4:30

地点:金光楼311会议室

报告人:张超,生物信息平台技术员

摘要:基因表达在细胞中是一个动态的过程,在生物生长发育的各个阶段和疾病发生中有着重要的作用,研究全基因组的表达水平能让我们更好地理解这一生物过程、产生新颖假说。随着二代测序技术(Next-Generation Sequencing)的飞速发展,测序成本大幅下降,使得在组学水平研究基因的表达水平更加精确和方便。利用RNA测序技术(RNA-seq)可以很方便快捷地得到特定细胞在某一功能状态下的整个转录组表达水平。

北京大学生科院/生命科学联合中心生物信息学平台旨在帮助、指导湿生物实验室进行相关的生物信息学分析。通过本次RNA-seq的基础入门讲座,我将讨论测序技术原理、底层数据格式、RNA-seq常用的分析思路、方法和软件。目的是能让湿实验同学熟悉RNA-seq数据分析,更容易读懂文献中的相关技术和分析方法,帮助自己设计RNA-seq实验甚至自己尝试分析。欢迎大家踊跃参加和提问。

资料下载:

标题:清楚有效的统计和生信做图:探索数据和表达想法详情

时间:2015年1月22日,周四下午3:00-4:30

地点:金光楼610室

报告人:李程,生物信息平台负责人, lch3000@gmail.com

摘要:统计和生物信息做图(数据可视化)的目的包括探索数据、为建立分析模型产生思路、检查模型正确性、展示分析结果等。好的做图的要素包括有信息量、有效率、创新、审美、和故事性,视觉进化的因素如对于大小、颜色、反差的敏感性也会指导如何用图有效地传达信息。在这些背景下,我会介绍:

  • R语言作为灵活通用的统计分析和做图软件,用它画的一些常用的统计图如散点图、分布图、boxplot等,以及如何进阶。
  • 常用的生物信息图的分析原理和解读,如热图、GSEA、Cricos plot。
  • 做图中应该避免的常见误区,如图太繁杂、不适当地用三维透视图、何时用log变换数据。
  • 如何在做图中创新,揭示数据中隐蔽和新的信息,让审稿人和读者眼睛一亮。
  • 参加讲座的同学分享自己的做图经验和问题。

资料下载:

标题:不用编程就可以做生物信息分析的网站详情

时间:2014年12月16日,周二下午3点

地点:金光610室

报告人:李程,生物信息平台负责人, lch3000@gmail.com

摘要:生物信息学家的一个重要研究方向是为生物学 家提供可以自己使用的生物信息工具或网站,不用编写程序就能分析数据。比如每年一度的Nucleic Acids Research的数据库和网络服务器专刊( http://nar.oxfordjournals.org )。我在这里介绍一些常用的可以做生物信息分析的网站,大家可以带上联网的笔记本电脑跟我一起学习使用。

  • UCSC Genome Browser

搜索基因组位置,显示包括的基因信息,如外显子和内含子区域、基因序列在物种间的保守度,可以放大缩小。可显示许多公共数据的数据轨道(data track),如ENCODE项目的组蛋白修饰、转录因子结合位点、某个细胞类型的表达数据等,还可以上传显示自己的数据轨道。

  • Galaxy

生物序列分析,比如抽取一组基因的转录起始位点的上下游5kb的DNA序列。

  • cBioPortal

提供癌症基因组项目(TCGA)的数据分析和画图,比如某一个基因在不同癌症类型中和正常样本相比的拷贝数和表达量变化。

  • Gene Ontology和通路富集分析

从一个全基因组表达谱分析得到的差异表达的基因列表,看看它们中间富集的基因功能注释或通路,是不是有期望的或出乎意料的?

  • Principal Component Analysis (PCA,主成份分析和降维)

把一个有若干样本点和许多变量的二维数据表投射到二维图上,使样本点尽量散开。可能发现新的样本点聚类,或样本点和变量间的隐含关系。

资料下载: