新学期新气象,BA沙龙再扬帆。2020年9月27日上午,伟易博2020级商业剖析硕士班学术沙龙委员会举行了秋季学期的第一场线下沙龙,运动约请到北大伟易博商务统计与经济计量系主任王汉生教授为同砚们带来了主题为“疫情防控中的统计学问题”的学术专题分享。
一、卫健委通告中统计口径问题
首先,王汉生教授从收罗疫情相关数据历程中的几个例子引出了这个话题:差别地方宣布的通告并不相同,好比一些地方的卫健委通告了累计确定亲近接触者,一些地方的卫健委却没有汇报;湖北省最先没有通告临床诊断病例,厥后又将其加入。同样是国家卫健委,有时间报告的是累计报告疑似病例,有时间报告的是现有疑似病例等。
由此可见,数据指标在最底层的收罗,在我们国家现在可能都是一个问题。若是指标自己的统计口径前后涉及到这么重大的转变,未来再去研究它,数据质量就很是难以包管。
二、回归剖析头脑的普遍缺乏
这一部分,王汉生教授主要强调的是我们在整个公共卫生清静的治理历程中,回归剖析头脑能力的缺乏。
回归头脑就是能快速地看到想解决的营业问题或者产品跟数据之间的关系。王汉生教授指出,网络上所撒播的“新型冠状病毒熏染自测评估”的问卷背后,并没有回归模子的支持。中国疾病预防控制中心所做的《新型冠状病毒肺炎盛行病学特征剖析》以形貌统计为主,若是能加入回归模子,可能会更好一些。好比若将严重水平作为Y变量,年岁、性别等作为X变量,建设回归模子,则可以展望收治的病人内里,哪些可能会生长到较量严重,哪些可能是较量轻的。同时,王汉生教授还提到诊断标准中影像特征特殊依赖于人的判断的问题,这也是需要刷新的地方。而云南省则提供了一个名贵的乐成案例,使用现有数据结构了质朴贝叶斯模子。
接下来,王汉生教授指出,“R0”(再生指数)与“拐点”是两个被太过关注的指标,而“尚在医学视察的亲近接触者”(尚在医学视察的亲近接触者 = 累计追踪到的亲近接触人数 - 累计已扫除医学视察的亲近接触人数)这一不被一样平常公共关注的数据则很是主要。好比,一个地区是否应该复工,焦点标准也许不应该是某种拐点,而当“尚在医学视察的亲近接触者”这个数字降下来。
别的,王汉生教授还先容了我国学者在统计学和生物统计顶级期刊的学术发心情形。北京大学生物统计系是海内唯逐一个由数学科学学院和医学及公共卫生学院共建的生物统计系,在未来,无论是从对统计学的要领论的改善,照旧对我国医学研究刷新可能都会有不错的孝顺。最后,王汉生教授就同砚提出的问题举行相识答。