本帖最后由 fantomas 于 2018-10-11 17:12 编辑
【重磅】【重磅】【重磅】: 易学开发平台,已内置2018 CCF 大数据与计算智能大赛(BDCI 2018)活跃赛道的数据集。采用易学开发平台作为算力支持的选手,无需下载数据集。直接使用即可。
以下是竞赛的介绍:
2018 CCF大数据与计算智能大赛(BDCI 2018 ),由教育部高等学校计算机类专业教学指导委员会、沈阳市人民政府指导,中国计算机学会主办。经过五年举办,累计吸引来自25个国家、1000余所科高校、1200余家企事业单位、80余所科研机构的30000余人参与。大赛以前沿技术与应用为导向, 汇聚政产学研用智慧,已成为最具影响力的大数据赛事品牌之一。 BDCI 2018立足国际化、产业化、普及化,将联合200余位专家院士、70余家合作单位,将于全球启动仪式,面向互联网、金融、通信、电商等方向发布多道赛题,邀请AI巨擘,与大数据及人工智能专业学生及从业者,探讨数据与智能双引擎驱动的人才观与生态。 https://www.datafountain.cn/
2018 CCF大数据与计算智能大赛
大赛介绍2018 CCF大数据与计算智能大赛(BDCI 2018 )由教育部高等学校计算机类专业教学指导委员会、沈阳市人民政府指导共同指导,中国计算机学会主办,以前沿技术与应用为导向, 汇聚政产学研用智慧。 BDCI大赛通过连续五年举办,累计吸引来自25个国家、1000余所科高校、1200余家企事业单位、80余所科研机构的30000余人参与,已成为最具影响力的大数据赛事品牌之一。BDCI 2018立足国际化、产业化、规模化、普及化,面向金融、电信、汽车等方向,发布算法赛、系统赛、方案赛10道赛题,面向全球开放报名。数据驱动,智见未来! 赛题名称
自动驾驶三维点云分割 赛题背景
自动驾驶离不开对车辆周围环境中的车辆、行人和自行车等物体的三维感知。三维激光点云是实现三维感知不可或缺的数据源,本赛题要求对场景三维点云进行分割,这是实现三维感知的非常重要的一个环节。本赛题提供超过80000帧三维点云数据帧,每帧数据由数量不等(大部分有5万多)的带强度信息的三维点(x,y,z,intensity)组成。对于训练数据,每个点有一个对应的标注指定该点的类别信息。数据被标注成了八个类别:自行车,三轮车,小车,大车,行人,人群,未知障碍物(在可行驶区域但难以识别为前面六个类别的物体)和背景(除去前面七个类别的其他所有点)。注意,训练数据的标注是有噪声的。 赛题任务
赛题要求参赛者给出测试数据中每个点的类别预测(每帧输出一个和测试数据文件同名的.csv文件,按照顺序每一行对应一个点的从0到7的类别预测)。要求参赛者的方案在i7 CPU+GTX 1080 GPU显卡的硬件上达到至少10帧每秒的处理速度(初赛排名不考虑速度,复赛要求方案必须达到速度要求,否则不予考虑评奖)。 面向自动驾驶的三维点云标注数据非常稀有,严重阻碍相关科研的发展。阿里巴巴希望借助本次比赛开放一批面向自动驾驶的三维点云数据,和学术界共同探索针对自动驾驶的高效三维点云分割方案。相比于基于现有的方案进行简单的调参,我们更鼓励参赛者提出创新的解决方案。 赛题名称
基于视频的可移动物体实例分割(算法题) 赛题背景
自动驾驶是当前科研和产业界非常重要的项目。环境感知是自动驾驶众多关键技术之一。百度这个赛题的目的是推动在环境感知问题中计算机视觉和机器学习算法的科研水平。为此我们开放了一个具备精细标注的大规模数据集。基于这个数据集,我们也定义了一系列实际的问题,并希望参赛者为自动驾驶开发新颖独特的算法和框架。在这个比赛中,我们选取了基于视频的可移动物体分割的任务,参赛者也可以在百度Apollo官网上找到更多的相关任务。 百度提供的ApolloScape数据集是一个综合全面的数据集,包括了测绘级别的三维点云和对齐过的带相机姿态的视频图像。点云的每个点和图像的每个像素都具备语义信息。我们希望我们提供的新数据集可以让自动驾驶相关的应用都有所受益,包括但是不限于2D/3D场景解析、定位、迁移学习和驾驶仿真。用于当前赛题的数据集开放了近九万帧具备可移动物体实例标注的视频图像。 赛题任务
在这个任务中,我们提供给参赛者一系列像素级别标注的视频图像,其中可移动物体例如车辆和行人为实例标注。任务的目的是评估当前先进的基于视频的物体分割算法。由于缺乏公开的视频上精细标注的数据集,这项任务还未被正式提出。除了视频标注这一独特之处,ApolloScape数据集还具备其他的挑战。例如,ApolloScape具备更高的场景复杂度(如下图),单图平均车辆和行人可高达到50。另外, ApolloScape具备更为多样性的光照条件,晴天,阴天,背光,以及立交桥下两级分化的光照效果等。 赛题名称
供应链需求预测 赛题背景
浙江执御信息技术有限公司是一家专注出海的跨境电商企业,利用移动互联网创新和大数据应用,助力中国制造升级,将中国和全球的优质品牌、设计、产品输送到“一带一路”沿线国家和地区。在电商产业链中,为提升用户物流服务体验,供应链协同将货品提前准备在全球各个市场的本地仓,可有效降低物流时间,极大提升用户体验。不同于国内电商物流情况,出海电商的产品生产和销售地区是全球化的,商品的采购,运输,海关质检等,整个商品准备链路需要更长的时间。在大数据和人工智能技术快速发展的新时代背景下,运用大数据分析和算法技术,精准预测远期的商品销售,为供应链提供数据基础,将能够为出海企业建立全球化供应链方案提供关键的技术支持。 赛题任务
供应链需求预测,对原问题做建模问题简化。考虑商品在制造,国际航运,海关清关,商品入仓的供应链过程,实际的产品准备时长不同。这里将问题简化,统一在45天内完成,供应链预测目标市场为沙特阿拉伯。赛题为运用平台积累最近1年多的商品数据预测45天后5周每周(week1~week5)的销量。 赛题名称
基金间的相关性预测
赛题背景
指旺财富是宜信财富旗下平台,为高速成长的新锐中产人群提供基于目标的财富规划和咨询服务。基金作为投资理财的一个重要工具,是指旺财富关注的投资品种之一。而研究基金的特征和性质,则是形成正确投资规划的一个必要步骤,也是指旺财富投资研究团队正在进行的工作。 基金间的相关性是基金的重要特征。根据金融学原理,一个基金组合的整体风险,不仅和其中各只基金的风险水平有关,还和这些基金之间的相关性有关。构造一个基金之间相关性小、或者说分散程度高的基金组合,能在保持一定收益水平的基础上,降低整体风险。因此,对基金之间的相关性进行预测,有助于我们构建一个好的基金组合。 赛题任务
参赛者需要根据给出的基金净值、基金业绩比较基准、对应指数行情、基金间相关性等数据,构建模型、算法进行训练。然后针对我们提供的测试样本,通过您的算法或模型预测出之后一段时间内基金间的相关性情况。
赛题名称汽车行业用户观点主题及情感识别 赛题背景
随着政府对新能源汽车的大力扶植以及智能联网汽车兴起都预示着未来几年汽车行业的多元化发展及转变。汽车厂商需要了解自身产品是否能够满足消费者的需求,但传统的调研手段因为样本量小、效率低等缺陷已经无法满足当前快速发展的市场环境。因此,汽车厂商需要一种快速、准确的方式来了解消费者需求。 赛题任务
本赛题提供一部分网络中公开的用户对汽车的相关内容文本数据作为训练集,训练集数据已由人工进行分类并进行标记,参赛队伍需要对文本内容中的讨论主题和情感信息来分析评论用户对所讨论主题的偏好。讨论主题可以从文本中匹配,也可能需要根据上下文提炼。 赛题名称
面向电信行业存量用户的智能套餐个性化匹配模型 赛题背景
电信产业作为国家基础产业之一,覆盖广、用户多,在支撑国家建设和发展方面尤为重要。随着互联网技术的快速发展和普及,用户消耗的流量也成井喷态势,近年来,电信运营商推出大量的电信套餐用以满足用户的差异化需求,面对种类繁多的套餐,如何选择最合适的一款对于运营商和用户来说都至关重要,尤其是在电信市场增速放缓,存量用户争夺愈发激烈的大背景下。针对电信套餐的个性化推荐问题,通过数据挖掘技术构建了基于用户消费行为的电信套餐个性化推荐模型,根据用户业务行为画像结果,分析出用户消费习惯及偏好,匹配用户最合适的套餐,提升用户感知,带动用户需求,从而达到用户价值提升的目标。 套餐的个性化推荐,能够在信息过载的环境中帮助用户发现合适套餐,也能将合适套餐信息推送给用户。解决的问题有两个:信息过载问题和用户无目的搜索问题。各种套餐满足了用户有明确目的时的主动查找需求,而个性化推荐能够在用户没有明确目的的时候帮助他们发现感兴趣的新内容。 赛题任务
此题利用已有的用户属性(如个人基本信息、用户画像信息等)、终端属性(如终端品牌等)、业务属性、消费习惯及偏好匹配用户最合适的套餐,对用户进行推送,完成后续个性化服务。
|