上财“学者•学问•学派”论坛(第三十四期) ——数据时代的推断陷阱

时间:2019-12-09浏览:10设置

12月4日晚,由上海财经大学科研处主办,校团委、校学生会承办的上财“学者•学问•学派”论坛第34期于武东路梯六报告厅如期举行。本期论坛邀请到我校统计与管理学院杨楠教授主讲。杨教授从多角度阐述了商业、科技、卫生、政府、教育、经济、人文等不同领域中常见的数据推断陷阱的表现形式与本质特征。论坛主持人由统计与管理学院应用统计硕士研究生鲜东良担任。当晚报告厅座无虚席,百余名校内外师生一同聆听了本期论坛。

首先,杨教授开宗明义,将“上财2018届毕业生就业情况”和“各城市数据分析师薪资情况”的数据图表呈现在大家面前,介绍这些数据背后的统计方法及可能产生的偏差,引发了同学们的高度关注与极大兴趣。紧接着,杨教授又结合同学们熟知的“抖音小镇90后女吃货”、“纷繁复杂的贵金属价格数据”等案例过渡到关于“数据如何孕育出新产业”的思考,进而总结出:“数据时代,我们已经无时无刻不在与数据打交道,我们自身也早已成为数据的一部分,不论身处何方,数据都会找到我们。”

接着,杨教授抛出了经典的“哈佛新生多富二代?”、“辛普森悖论”、“从1936到2016:美国总统大选民调何以失真?”等数据推断陷阱实例,全面分析总结了导致数据推断陷阱产生的常见原因。杨教授强调道,人们比想象中更容易受到数据的影响,所以从统计学角度来看,使用科学的抽样方法以及规避可能产生的抽样误差是非常重要的。她也提醒同学们在分析问题时,需要深入分析各类影响因素,切忌浅尝辄止地看问题。

随后,杨教授借由“迎新晚会抽奖奖金数额的设计”以及电影《天空之眼》中的预测与决策等案例说明了概率虽然在生活中被经常应用,但是不同人对同一概率的感知可能不同,同一人对不同概率的认知也可能有偏差。特别是人们对概率直觉常有一个普遍弱点,即将很小的风险高估,而将较大的风险低估。究其原因,杨教授解释道,当风险似乎在我们的掌握之中时,会比不能控制它时感到更加安全。

最后,杨教授通过阐述“日本教育史上关于相对评价的批判”的案例,告诉我们正态分布虽然很常见,但是误用正态的后果会很严重。在此基础上,杨教授总结道,世界上没有完美的数据,我们在使用数据模型时,始终要将使用数据模型所要达成的目标和背后的价值判断牢记心中,在警惕统计数据陷阱的同时,更应该掌握如何利用统计数据进行“自卫”。

互动环节中,师生间就“克强指数印证GDP数据的可行性”、“血型分布的区域性统计准确性”、“基于真数据进行假推断行为中的数据伦理”以及“如何解决抽样调查中的无回应问题”进行了探讨与交流。讲座过程中,杨教授运用妙趣横生的教学案例和灵活多样的讲解方式深入浅出地将数据时代统计学的作用呈现在大家面前,讲解了与日常生活休戚相关的情形背后的统计学原理,为身处数据时代的同学们自行避开“数据陷阱”提供了理论和方法的双重支撑。

上财“学者•学问•学派”论坛是专为上财本校学者讲授和传播其所作学问的论坛,旨在提升上财学者与师生就学科学问进行研讨和交流的深度和广度,加强认知和思想碰撞,推动在相关学科领域上财学派的形成。本次讲座,杨教授以其独到的视角和深厚的学识让与会师生领略了上财名师风采,引发了对大数据时代如何分析与使用数据的更深入思考。至此,本学期的三学论坛也已圆满收官。本学期三学论坛共七讲,来自七个学院的资深学者带领我们走进了七个不同的领域,加深了师生对相关学科学问知识的了解,增强了思想的碰撞。主讲嘉宾们或娓娓道来,或慷慨激昂,为同学们奉献了一场又一场精妙绝伦的学术盛宴。今后论坛将不断完善,持之以恒地搭建师生学术交流平台,推动上财学派树立发展。


返回原图
/