2017年3月14日,CCF YOCSEF深圳分论坛在深圳大学南校区计算机学院大楼938室成功举办了“空间信息处理前沿报告会”。本次报告会由CCF YOCSEF深圳、广东省普及型高性能计算机重点实验室、深圳市电脑学会联合主办。本次报告会由YOCSEF深圳分论坛主席深圳大学毛睿、YOCSEF深圳分论坛学术秘书深圳大学王毅担任执行主席。YOCSEF深圳部分委员、深圳大学师生近50人参加了本次研讨会。
本次报告会的特邀讲者是阿卜杜拉国王科技大学的商烁教授、苏州大学的郑凯教授、上海交通大学的姚斌副教授。
商烁教授是阿卜杜拉国王科技大学极限计算中心研究科学家。中国人民大学信息学院兼职教授,大数据管理与分析方法研究北京市重点实验室主任助理。中国计算机学会数据库专委会委员,中国地理信息产业协会理论与方法委员会委员,教育部-中移动联合实验室专家评审组成员。入选北京市科技新星计划和北京市优秀人才计划。2008年本科毕业于北京大学,2012年博士毕业于澳大利亚昆士兰大学。2012-2013年在丹麦奥尔堡大学进行教学研究工作。主要研究方向为海量时空数据管理与分析,主持国家、教育部、北京市多个科研基金项目。在数据管理领域知名国际期刊/会议发表论文四十余篇,担任数据管理领域国际顶级会议SIGMOD 2018程序委员会委员,ICDE 2013移动对象分会场主席,及VLDBJ、TKDE、ACM TIST等多个领域内顶级期刊的评审专家。
郑凯博士是苏州大学特聘教授,江苏省特聘教授,“青年千人计划”入选者。2012年博士毕业于澳大利亚昆士兰大学,2012-2016年在昆士兰大学信息与电子工程系担任研究员、助理教授,2016年起加入苏州大学先进数据分析中心。主要研究领域包括大数据管理,社交媒体数据分析,时空数据库,不确定数据库, 内存数据库,数据挖掘等。在数据库、数据挖掘领域顶级会议(CCF A类)和期刊(SCI 检索),如SIGMOD,ICDE, EDBT,ACM TODS, The VLDB Journal, IEEE TKDE等,发表论文60余篇。2013年获澳大利亚优秀青年基金(Australia Research Council Discovery Early Career Research Award);2015年获数据库顶级会议ICDE最佳论文奖。担任重要数据库国际会议的程序主席(APWeb 2016)和大会主席(DASFAA 2017),多个顶级数据库期刊,如IEEE TKDE, VLDB Journal,Geoinformatica等的专家评审和多个一流国际会议的程序委员,如ACM SIGMOD (2015年,2016年),CIKM (2014年,2015年),DASFAA (2013年,2015年)。
姚斌博士是上海交通大学计算机科学与工程系副教授、博士生导师。主要研究领域为数据库,大数据处理与分析。主持国家自然科学青年基金一项,作为骨干成员参与973计划,863重大项目各一项,国家自然基金重点一项,面上两项。担任多个国际顶级期刊的审稿人(如ACM TODS,IEEE TKDE,GeoInformatica等),Frontiers of Computer Science in China青年编委,CCF教育工委主任助理。在国际期刊和会议(如VLDBJ,IEEE TKDE,SIGMOD,ICDE)上发表学术论文28篇(其中,CCF A类论文16篇)。申请国家发明专利22项,软件著作权10项。
在本次报告会中,商烁教授作了题为“Interactive Top-K spatial Keyword Queries”的主题报告。商教授介绍了一种新型的集体旅游规划(CTP)查询方法。通过最多k个会议点,可以找到最低成本的路线连接多个源和目的地。当多个旅客的目标相同的目的地(例如体育场和剧院),他们可能要在会议点集合,然后一起前往目的地的公共交通,以减少他们的全球旅行成本。这种类型的功能可以带来显著的环境和经济效益,减少能源的消耗和温室气体排放,减少交通拥堵。商教授的报告极大地激发了在场听众对大数据分析领域的研究兴趣。
图一:商烁教授报告
在稍后的报告会中,郑凯教授作了题为“Interactive Top-K spatial Keyword Queries”的主题报告。他介绍了传统Top-K空间关键字查询需要用户显示地指定自己的喜好质检的空间距离和关键词的相关性。然后探讨了如何通过相互作用增强的常规查询消除这一要求,产生互动的Top-K空间关键字查询。郑教授结合在这一领域的研究经历,全方位展示了解决这一问题的最新方法和最新技术,并与在场听众进行了深入讨论,现场气氛热烈。
图二:郑凯教授报告
随后,姚斌副教授作了题为“Simba:高效的内存空间数据分析系统”的主题报告。他介绍了他研发的基于Spark SQL的分布式空间数据分析系统Simba。Simba提供了一个简单但表达能力强大的编程接口,在分布式环境下具有高效、低延迟、高吞吐和便于扩展等特性。Simba系统支持基于弹性分布式数据集(RDD)的索引,提供了KNN查询、范围查询、连接查询等常见的空间数据操作。Simba系统针对空间数据特性,分别从解析器、逻辑计划、物理计划等阶段对Spark SQL进行扩展。索引结构是Simba系统的一大亮点。Simba在索引建立在RDD上,分别建立了局部和全局的两层索引结构,极大地提高了系统性能。姚斌副教授的报告在听众之间产生了强烈反响。
图三:姚斌副教授报告
报告会结束后,YOCSEF深圳部分委员、深圳大学师生与特邀讲者合影留念。
图四:合影留念