本网讯(新闻中心)7月21日-22日,必赢nn699net第二届暑假研究方法培训班在中国文化书院举行,培训班历时两天。本次培训围绕“运用机器语言进行研究”这一主题,山东大学政治学与必赢nn699net孙宗锋博士、中山大学政治与公共事务管理学院郑跃平博士、复旦大学国际关系与公共管理事务学院郑磊博士,腾讯研究院高级工程师方小敏莅临我校,为同学们进行培训。必赢nn699net院长黄其松教授主持此次培训。必赢nn699net胡赣栋副教授负责组织培训。
21日上午,由山东大学政治学与必赢nn699net孙宗锋博士主讲,讲题为“大数据在相关学科中的应用”。 孙宗锋博士分别从研究设计与统计分析基础、大数据的发展及其空间属性、空间大数据获取、空间大数据可视化、空间数据统计建模和大数据与空间分析案例这六大主题做出演讲。
孙宗锋博士强调“好的研究设计要有差异性,从而推导出悖论”,用科学的方法来统计,讲究定量研究的规范性。在介绍理论与数据的关系时,孙宗锋博士说“光做数据是没有用的”,而是要从数据的描述中把握现象,从而探究原因并研判趋势。最后,孙宗锋博士展示了空间可视化建模软件R的操作方法,操作过程中不断与听众互动,解答了各种疑问,增加了听众对于空间可视化建模软件的了解。
21日下午,主讲人为中山大学政治与公共事务管理学院郑跃平博士,为大家讲授“文本分析与机器学习”。郑跃平博士从大数据在生活中的相关应用为切入点,生动地介绍了大数据时代的到来给公共管理研究带来的机遇。他提到,大数据能为研究问题带来新的启发、为理论模型构建带来帮助、能提供新的数据来源和数据分析手段、使研究发现和结果的可视化呈现。并以深圳市十三年来的四万五千条投诉数据为例,从政体状况、部门分析、时间变化等六个方面为大家讲授了大数据分析方法的具体步骤。
接着,郑博士按照文本分析概况、词频统计与词云制作、关键词提取与主题模型、机器学习概述、分类及聚类算法和时间序列分析六个方面来教授。重点介绍了R、Python两种重要数据分析软件的安装、应用方法。郑博士现场出了部分练习题为大家讲解,让同学们更加透彻地理解所讲的内容。
22日上午,腾讯高级工程师方小敏就“数据抓取与数据可视化”这一主题对大家进行培训。他主要通过数据抓取概况、新闻网页数据抓取、微博评论及搜索数据抓取、散掉矩阵图及多维散点图、平行坐标图及崖底碎石图以及时间序列折线图六个要点向大家具体介绍数据抓取与数据可视化。
方小敏首先为大家介绍了数据抓取,对开放数据平台以及其中的实时数据、趋势分析和关联分析,微信公众号文章抓取,微博话题抓取做了详尽的解释。接着,方小敏通过对主题模型、关键字搜取、相关文章的推荐等内容概述机器学习。另外,他指出文本挖掘可视化可简单地理解为图谱这一基本观点。并结合以具体的案例演示、图解为大家讲授文本挖掘可视化的详细内容,最后,同学们积极提出自己的困惑点,方小敏工程师耐心回答大家的问题,加深对数据分析以及数据挖掘的认识。
22日下午,复旦大学国际关系与公共事务学院郑磊博士为同学们上了最后一课,题目为“政府数据开放的研究和实践”。培训开始,郑磊老师就信息公开和数据开放两者的区别这一问题让同学们进行探讨,引出本次培训的主要内容开放的数据。郑磊博士还针对当前数据“困在深闺”的现状提出“数据要跨越科层制共享”,即要做到政府内部之间数据共享,政府与企业和社会之间数据开放。
郑磊博士通过分享美国的“消防栓”事例,以阐明“数据是一种基础设施”的理念,数据的公开可以为公共事务贡献它的微薄之力。政府每年通过税收的形式向人民征集资金去支付相关部门采集特定数据的费用,也理所应当的要把采集到的数据向社会开放,凭借数据开放带来的便捷度来回报社会,致使个人或企业等组织得到数据的成本降低,从而形成一个个智慧型城市。
最后,郑磊博士谈到真正的开放数据不仅必须是原始的、完全的、及时的、可获取的、可机读的,而且还要做到技术性开放和法律性开放,这样才能形成从供给侧的开放数据到利用端的利用数据再到社会端的解决问题和创造价值的循环过程。
本次培训班效果良好,学院许多老师和同学们积极参与,大家从老师们深入浅出的教学中学到实用的数据分析方法,教授、工程师们也与同学们进行了亲切的交流,拉近了校与校、校与公司的联系,活动于22日下午圆满结束。
[责任编辑:秦瑜]