中国计算机学会青年计算机科技论坛
CCF Young Computer Scientists & Engineers Forum
CCF YOCSEF
于2014年9月30日(星期二)9:00-11:30
在中国科学技术大学计算机学院学术报告厅(西区电三楼632室)举行
学术报告会,敬请光临
报告会主题
知识发现与数据挖掘研究最新进展
程 序
8:30 签到
9:00 报告会开始
特邀讲者:张磊 博士,安徽大学
演讲题目:Constraint-Based Frequent Pattern Mining: Novel Applications and New Techniques
特邀讲者:许嗣磊 博士, 香港中文大学
演讲题目:Product Selection Problem: Improve Market Share by Learning Consumer Behavior
特邀讲者:赵聪 博士, 中国科学技术大学
演讲题目:Product Selection Problem: Improve Market Share by Learning Consumer Behavior
执行主席:刘淇 博士,中国科学技术大学特任副研究员
执行主席:孙广中 博士,中国科学技术大学副教授
CCF YOCSEF合肥学术委员会副主席
参加人员:IT领域专业人士、研究生、媒体、其他有兴趣者
知识发现与数据挖掘研究最新进展
ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD)是知识发现与数据挖掘领域内最知名的学术会议,是CCF推荐学术会议中的A类会议。KDD 2014于8月24日至27日在美国纽约召开,吸引了来自全球各地2000余名学者参加。本次学术报告会邀请了来自安徽大学、香港中文大学、中国科学技术大学的青年学者介绍他们在发表在KDD会议上的最新成果,并就相关问题进行细致研讨。欢迎感兴趣者参加。
特邀讲者
张磊(安徽大学)
题目:Constraint-Based Frequent Pattern Mining: Novel Applications and New Techniques
摘要:频繁模式挖掘是许多数据挖掘任务中一个非常重要的基本问题。在这一领域的研究中,大部分使用模式支持度(Support)来度量模式的兴趣度。为了提高模式挖掘的有效性和效率,基于约束的频繁模式挖掘吸引了越来越多人的关注。除了模式支持度以外,用户通常会提出另外一种新的模式指标来更好地捕捉用户的兴趣。在这个报告中,首先给出了该研究领域中的一个实际应用(即网页智能打印推荐),在这个应用的驱动下,提出了一个新的模式指标,即模式占用度(Occupancy)来衡量模式的完整性。结合模式的占有度和支持度,可以提供给用户更加准确的推荐。然而,与模式支持度的反单调性不同,模式占有度即不满足单调性,也不满足反单调性。所以,我们提出了一种高效方法可以快速计算模式占有度的上界,利用该上界可以大大提高算法的运行效率。最后,把所提界计算方法进行泛化,可以应用于任一模式指标的上/下界计算。
特邀讲者
许嗣磊(香港中文大学)
题目: Product Selection Problem: Improve Market Share by Learning Consumer Behavior
摘要:在竞争日益激烈的市场中,一个公司如何规划自己的产品以获得更多的市场份额是一个十分重要的课题。在选择将要推出的产品时,厂商只有精确分析客户的需求以及了解哪些因素如何影响客户的选择才能决策出有竞争力的产品。在这个报告中,我们首先提出了基于距离的产品购买模型来描述客户的购买行为。基于这个产品购买模型,我们形式化地描述了从候选产品中选择出k个预期最畅销产品的数学模型,严格地证明了这个问题是NP难问题,并且提出了一个高效的贪心近似算法。通过子模块性质分析,我们证明了该近似算法能够达到至少63%的近似比。更为重要的是本报告中提供了利用线性回归的方法,通过历史的市场份额数据来准确推断用户的购买行为,从而可以准确地预测不同的生产计划所带来的市场份额。通过模拟生成数据和现实网络数据 (TripAdvisor.com)上的实验表明,我们的近似算法比穷举搜索有五个量级以上的提速,并且能够达到最优解的96%。同时,实验还证明了对用户购买行为预测的准确性,证明了不同距离度量标准时对于选择结果的重大影响,进一步验证了选择适当的距离度量标准可以提高产品选择问题的精确性。
特邀讲者
赵聪(中国科学技术大学)
题目:GeoMF: Joint Geographical Modeling and Matrix Factorization for Point-of-Interest Recommendation
摘要:兴趣地点(Point-of-Interest)推荐已经成为帮助人们发现他们感兴趣地点的重要手段。然而,极度稀疏的“用户-位置”矩阵是一个很大的挑战。为了克服它,首先我们把基于位置的社交网络 (LBSNs)上的移动记录看作POI推荐的隐式反馈 (implicit feedback),提出了利用带权矩阵分解,因为它可以更好地用隐式反馈为协同过滤服务。此外,研究者们最近在基于位置的社交网络上的人类移动行为中发现一个“空间聚类”现象:个人访问过的地点趋向聚集在一起。这在兴趣地点推荐中很有帮助,因此我们把它融合到分解模型里。特别地,我们把在分解模型中用户和兴趣地点的隐向量分别加上了“用户的活跃区域”向量和“兴趣位置的影响区域”向量。基于这样的增量模型,我们不仅捕捉了“空间聚类”现象,更可以解释为什么向矩阵分解里引入该现象有助于解决矩阵特别稀疏的问题。然后,我们在大规模基于位置的社交网络数据集上评估了新的算法。结果表明:带权矩阵分解比其他分解模型更优,考虑了“空间聚类”现象的矩阵分解可以改进推荐的效果。