中国计算机学会青年计算机科技论坛
CCF Young Computer Scientists & Engineers Forum
CCF YOCSEF深圳
时间:2017年3月14日(星期二)14:00-17:00
地点:深圳市南山区白石路深圳大学南校区计算机与软件学院大楼938室
研讨会主题
空间信息处理前沿报告会
主办单位:
中国计算机学会青年计算机科技论坛 深圳分论坛(CCF YOCSEF深圳)
深圳大学广东省普及型高性能计算机重点实验室
深圳市电脑学会
执行主席:
毛 睿 CCF YOCSEF深圳2016-2017 主席
王 毅 CCF YOCSEF深圳2016-2017 AC委员、学术秘书
议程
13:50 签到
13:55 报告会开始
CCF YOCSEF深圳 组织方 致辞
14:00 特邀讲者:商烁 教授,阿卜杜拉国王科技大学
演讲题目:Collective Travel Planning in Spatial Networks
15:00 特邀讲者:郑凯 教授,苏州大学
演讲题目:Interactive Top-K spatial Keyword Queries
16:00 特邀讲者:姚斌 副教授,博士生导师,上海交通大学
演讲题目:Simba:高效的内存空间数据分析系统
空间信息处理前沿报告会
报告1:Collective Travel Planning in Spatial Networks
特邀讲者:商烁 教授
商烁,阿卜杜拉国王科技大学极限计算中心研究科学家。中国人民大学信息学院兼职教授,大数据管理与分析方法研究北京市重点实验室主任助理。中国计算机学会数据库专委会委员,中国地理信息产业协会理论与方法委员会委员,教育部-中移动联合实验室专家评审组成员。入选北京市科技新星计划和北京市优秀人才计划。2008年本科毕业于北京大学,2012年博士毕业于澳大利亚昆士兰大学。2012-2013年在丹麦奥尔堡大学进行教学研究工作。主要研究方向为海量时空数据管理与分析,主持国家、教育部、北京市多个科研基金项目。在数据管理领域知名国际期刊/会议发表论文四十余篇,担任数据管理领域国际顶级会议SIGMOD 2018程序委员会委员,ICDE 2013移动对象分会场主席,及VLDBJ、TKDE、ACM TIST等多个领域内顶级期刊的评审专家。
报告提要: Travel planning and recommendation are important aspects of transportation. We propose and investigate a novel Collective Travel Planning (CTP) query that finds the lowest-cost route connecting multiple sources and a destination, via at most $k$ meeting points. When multiple travelers target the same destination (e.g., a stadium or a theater), they may want to assemble at meeting points and then go together to the destination by public transport to reduce their global travel cost (e.g., energy, money, or greenhouse-gas emissions). This type of functionality holds the potential to bring significant benefits to society and the environment, such as reducing energy consumption and greenhouse-gas emissions, enabling smarter and greener transportation, and reducing traffic congestions. The CTP query is Max SNP-hard. To compute the query efficiently, we develop two algorithms, including an exact algorithm and an approximation algorithm. The exact algorithm is capable finding the optimal result for small values of $k$ (e.g., $k = 2$) in interactive time, while the approximation algorithm, which has a $5$-approximation ratio, is suitable for other situations. The performance of the CTP query is studied experimentally with real and synthetic spatial data.
报告2:Interactive Top-K spatial Keyword Queries
特邀讲者:郑凯 教授
郑凯,博士,博士生导师,苏州大学特聘教授,江苏省特聘教授,“青年千人计划”入选者。2012年博士毕业于澳大利亚昆士兰大学,2012-2016年在昆士兰大学信息与电子工程系担任研究员、助理教授,2016年起加入苏州大学先进数据分析中心。主要研究领域包括大数据管理,社交媒体数据分析,时空数据库,不确定数据库, 内存数据库,数据挖掘等。在数据库、数据挖掘领域顶级会议(CCF A类)和期刊(SCI 检索),如SIGMOD,ICDE, EDBT,ACM TODS, The VLDB Journal, IEEE TKDE等,发表论文60余篇。2013年获澳大利亚优秀青年基金(Australia Research Council Discovery Early Career Research Award);2015年获数据库顶级会议ICDE最佳论文奖。担任重要数据库国际会议的程序主席(APWeb 2016)和大会主席(DASFAA 2017),多个顶级数据库期刊,如IEEE TKDE, VLDB Journal,Geoinformatica等的专家评审和多个一流国际会议的程序委员,如ACM SIGMOD (2015年,2016年),CIKM (2014年,2015年),DASFAA (2013年,2015年)。
报告提要:Conventional top-k spatial keyword queries require users to explicitly specify their preferences between spatial proximity and keyword relevance. In this work we investigate how to eliminate this requirement by enhancing the conventional queries with interaction, resulting in Interactive Top-k Spatial Keyword (ITkSK) query. Having confirmed the feasibility by theoretical analysis, we propose a three-phase solution focusing on both effectiveness and efficiency. The first phase substantially narrows down the search space for subsequent phases by efficiently retrieving a set of geo-textual k-skyband objects as the initial candidates. In the second phase three practical strategies for selecting a subset of candidates are developed with the aim of maximizing the expected benefit for learning user preferences at each round of interaction. Finally we discuss how to determine the termination condition automatically and estimate the preference based on the user's feedback. Empirical study based on real PoI datasets verifies our theoretical observation that the quality of top-k results in spatial keyword queries can be greatly improved through only a few rounds of interactions.
报告3:Simba:高效的内存空间数据分析系统
特邀讲者:姚斌 副教授,博士生导师
姚斌,博士,上海交通大学计算机科学与工程系副教授、博士生导师。主要研究领域为数据库,大数据处理与分析。主持国家自然科学青年基金一项,作为骨干成员参与973计划,863重大项目各一项,国家自然基金重点一项,面上两项。担任多个国际顶级期刊的审稿人(如ACM TODS,IEEE TKDE,GeoInformatica等),Frontiers of Computer Science in China青年编委,CCF教育工委主任助理。在国际期刊和会议(如VLDBJ,IEEE TKDE,SIGMOD,ICDE)上发表学术论文28篇(其中,CCF A类论文16篇)。申请国家发明专利22项,软件著作权10项。
报告提要:海量的空间数据无处不在,很多LBS应用需要对空间数据快速分析。然而,传统的空间数据库(如Oracle Spatial)和分布式空间数据分析系统(如Hadoop GIS)一般是基于磁盘的,因此高昂的CPU代价会成为系统的瓶颈。同时,现有的分布式内存查询分析引擎(比如Spark SQL)底层系统无法对空间操作查询计划进行优化,因此对海量数据不具有良好的扩展性。针对以上问题,我们设计并实现了一个基于Spark SQL的分布式空间数据分析系统Simba。Simba提供了一个简单但表达能力强大的编程接口,在分布式环境下具有高效、低延迟、高吞吐和便于扩展等特性。
Simba系统支持基于弹性分布式数据集(RDD)的索引,提供了KNN查询、范围查询、连接查询等常见的空间数据操作。Simba系统针对空间数据特性,分别从解析器、逻辑计划、物理计划等阶段对Spark SQL进行扩展。索引结构是Simba系统的一大亮点。Simba在索引建立在RDD上,分别建立了局部和全局的两层索引结构,极大地提高了系统性能。该研究成果的论文已经被数据库顶级会议SIGMOD 2016接收。
报告提要:海量的空间数据无处不在,很多LBS应用需要对空间数据快速分析。然而,传统的空间数据库(如Oracle Spatial)和分布式空间数据分析系统(如Hadoop GIS)一般是基于磁盘的,因此高昂的CPU代价会成为系统的瓶颈。同时,现有的分布式内存查询分析引擎(比如Spark SQL)底层系统无法对空间操作查询计划进行优化,因此对海量数据不具有良好的扩展性。针对以上问题,我们设计并实现了一个基于Spark SQL的分布式空间数据分析系统Simba。Simba提供了一个简单但表达能力强大的编程接口,在分布式环境下具有高效、低延迟、高吞吐和便于扩展等特性。
Simba系统支持基于弹性分布式数据集(RDD)的索引,提供了KNN查询、范围查询、连接查询等常见的空间数据操作。Simba系统针对空间数据特性,分别从解析器、逻辑计划、物理计划等阶段对Spark SQL进行扩展。索引结构是Simba系统的一大亮点。Simba在索引建立在RDD上,分别建立了局部和全局的两层索引结构,极大地提高了系统性能。该研究成果的论文已经被数据库顶级会议SIGMOD 2016接收。
参加人员:IT领域专业人士、研究生、媒体、其他有兴趣者
报名联系:王毅 Email:yiwang@szu.edu.cn
参会回执
姓名
|
|
单位
|
|
电话
|
|
Email
|
|
是否CCF会员
|
|
会员号
|
|
地点:深圳市南山区白石路深圳大学南校区计算机与软件学院大楼938室
交通:详见下图