• 2017-06-05 10:41:57,本站原创
    本届竞赛于2018年3月1日正式开始,至2018年4月18日截止提交附件,历时一个半月。竞赛共计有来自全国300多所高校3016支队伍报名参赛,由高校和公司共同组成的评审专家组历时一个月的评审,最后决出特等并获企业冠名奖作品3份、特等奖作品3份、一等并获信诺创新奖3份、一等奖作品50份(含专科组2份)、二等奖作品145份(含专科组4份)、三等奖作品297份(含专科组5份)、成功参赛作品951份、以及最佳组织奖35份(针对学校)。本届竞赛采用盲审(屏蔽参赛者信息;评审专家只能评阅非本区域作品;三位评阅专家同
  • 2017-06-13 11:48:08,本站原创
    第六届“泰迪杯”数据挖掘挑战赛将颁发省级奖项省份为广东省以及江苏省。 奖项设置: 一等奖:约占该省份队伍总数的5%,颁发“泰迪杯”XXX省一等奖荣誉证书; 二等奖:约占该省份队伍总数的10%,颁发“泰迪杯”XXX省二等奖荣誉证书; 三等奖:约占该省份队伍总数的25%,颁发“泰迪杯”XXX省三等奖荣誉证书。 获奖队伍依据“泰迪杯”全国评审专家组统一评阅的最终成绩区分专科及本科以上(含本科)从高到低依序按比例产生。

点击下载第六届“泰迪杯”参赛者操作手册

A题:基于非侵入式负荷检测与分解的电力数据挖掘

出题单位——广州市能智电力技术有限公司

一、背景

区别于常规的连接在入户线上的电能表只能获得总能耗数据,电力分项计量可以对连接到入户线后的建筑物内各个用电设备所消耗的电能进行独立计量。电力分项计量对于电力公司准确预测电力负荷、科学制定电网调度方案、提高电力系统稳定性和可靠性有着重要意义;对用户而言可以帮助用户了解用电设备的使用情况、提高用户的节能意识、促进科学合理用电。另一方面,分项计量还可以针对能耗数据来实现设备老化、故障预警的功能,在我们的生产、生活中有非常实际的意义。同时,基于电力分项计量的一系列技术,是将电器识别作为物联网的一个重要研究方向,从物理层面去真正查看、操控物联网设备,达到绝对可信的要求,这是未来物联网的目标。

分项计量技术目前主要分为两种:一种在总负荷内部为每个用电设备配备带有数字通信功能的传感器,通过通讯网络采集各用电设备的用电信息,这种方式称为侵入式电力负荷监测(intrusive residential load monitoring,ILM);另一种如图1所示,仅在电网的用户入口处安装一个传感器,通过采集和分析用户用电总功率或总电流来监测每个或每类用电设备的用电功率和工作状态,从而了解用户家中每个或每类用电设备的耗电情况和用电规律,这种方式称作非侵入式电力负荷监测与分解(non-intrusive load monitoring and decomposition,NILMD)。基于NILMD技术的用电分析计量具有简单、经济、可靠和易于迅速推广应用等优势,更加适用于居民用户。

 1.png

图1  非侵入式电力负荷监测与分解系统示意图

NILMD装置量测得到的是整个线路上的电压、电流数据,它们可以看作是各个用电设备的电压、电流数据的叠加。NILMD的核心,是如何从采集到的整条线路的电压、电流数据中“分解”出每个用电设备独立的用电数据。

就像人类的声纹、指纹等生物特征具有唯一性可以用来实现个体识别一样,不同种类和型号的用电设备在运行过程中产生的电压、电流以及谐波等时序数据中也有相对稳定的较为显著的特征,称之为用电设备的负荷印记(load signatures,LS)。而根据用电设备运行的过程,又可将数据分为暂态数据和稳态数据两大类,其中暂态数据主要指设备启动、设备停止、设备模式切换时的状态数据,稳态数据主要指设备稳定运行时的状态数据。

图2所示的电器启动暂态功率波形就是一种典型的LS。因工作原理不同,荧光灯和电动机的暂态行为明显不同。

 2.png

图2  电器启动暂态功率波形是一种典型的LS

NILMD系统的目标是根据不同类型用电器独特的负荷印记从一个能源网关设备记录的数据中检测出接入该设备的电路中各种用电器的开关等操作,并对其用电量进行分项计量。

用电设备根据用户用电设备工作状态的不同,可分为以下3种类型:

(1) 启/停二状态设备(ON/OFF)。这类用电设备只有运行和停机两种用电状态,如白炽灯、电热水壶等。

(2) 有限多状态设备。这类用电设备通常具有有限多个分立的工作状态,与之相对应的用电功率间是离散的,不同的功率水平即标志着不同的工作状态,如洗衣机、微波炉、电磁炉等。

(3) 连续变状态设备。这类用电设备的稳态区段功率无恒定均值,而是在一个范围内连续变动,如变频空调、电动缝纫机等。

......


请仔细阅读以下对于A题的说明:

1、关于赛题数据

①部分数据:2018年3月1日公布部分数据。

②全部数据:2018年4月1日公布挑战赛使用的全部数据。

③测试数据:2018年4月15日上午8:00:00准时放出测试数据,并于2018年4月15日上午12:00:00前提交测试结果。

④以上数据请参赛者在相应时间点根据本页面提示下载。

2、提交作品

①挑战赛作品内请勿出现学校、学院、队员以及指导老师相关任何信息,否则该作品视为无效作品。

②请参赛队于2018年4月14日23:59:59之前在挑战赛系统中在线提交大小不超过50M的论文正文的PDF文件。同时,在系统中获取附件的MD5码【这里的附件为包括论文正文(doc式)、源数据(组委会提供的源数据外)、过程数据、程序及模型文件的压缩包】;请注意获取该压缩包对应的MD5码后,对文件进行的任何操作(如打开、编辑、另存等),都将改变压缩包对应的MD5码,造成无法上传,因此,请参赛队获取MD5码之后,不要再对参赛作品及附件进行任何操作,直到2018年4月15—18日(23:59:59之前)完成参赛作品附件(不超过200M)的上传。

3、公布测试数据,提交测试结果

2018年4月15日上午8:00:00准时放出测试数据,请在"结果测试"页面下载测试数据,并于2018年4月15日上午12:00:00前将测试结果上传至FTP指定路径(FTP路径将于2018年4月10日公布)。

4、提交附件

2018年4月15—18日(23:59:59之前)在系统中在线提交挑战赛作品附件,附件大小不得超过200M。


点击下载A题赛题

点击下载A题部分数据

点击下载A题全部数据




B题:电视产品的营销推荐

出题单位——广州泰迪智能科技有限公司

一、问题背景

伴随着互联网技术的快速发展和应用拓展,“三网融合”(因特网、电信网、广播电视网)为传统广播电视媒介带来了发展机遇,广播电视运营商可以与众多的家庭用户实现信息的实时交互,使得全方位、个性化的产品营销和有偿服务成为现实。

某广电网络运营公司现已建设大数据基础营销服务平台,附件1~附件3给出了部分用户的观看记录信息数据和运营公司的产品信息数据。该公司请你们深入分析附件1~附件3的信息数据,利用数据挖掘的方法解决下面的问题。

二、解决问题

1.产品的精准营销推荐

根据附件1所给出的用户观看记录信息数据,试分析用户的收视偏好,并给出附件2中产品的营销推荐方案。

2.相似偏好用户的产品打包推荐

为了更好地为用户服务,扩大营销范围,利用附件1~附件3的数据,试对相似偏好的用户进行分类(用户标签),对产品进行分类打包(产品标签),并给出营销推荐方案。

三、数据说明

附件1:用户收视信息数据,记录数:561288条;

附件2:电视产品信息数据,记录数:41876条;

附件3:用户基本信息数据,记录数:1329条。


请仔细阅读以下对于B题的说明:

1、关于赛题数据

①部分数据:2018年3月1日公布部分数据。

②全部数据:2018年4月1日公布挑战赛使用的全部数据。

③测试数据:2018年4月15日上午8:00:00准时放出测试数据,并于2018年4月15日上午12:00:00前提交测试结果。

④以上数据请参赛者在相应时间点根据本页面提示下载。

2、提交作品

①挑战赛作品内请勿出现学校、学院、队员以及指导老师相关任何信息,否则该作品视为无效作品。

②请参赛队于2018年4月14日23:59:59之前在挑战赛系统中在线提交大小不超过50M的论文正文的PDF文件。同时,在系统中获取附件的MD5码【这里的附件为包括论文正文(doc式)、源数据(组委会提供的源数据外)、过程数据、程序及模型文件的压缩包】;请注意获取该压缩包对应的MD5码后,对文件进行的任何操作(如打开、编辑、另存等),都将改变压缩包对应的MD5码,造成无法上传,因此,请参赛队获取MD5码之后,不要再对参赛作品及附件进行任何操作,直到2018年4月15—18日(23:59:59之前)完成参赛作品附件(不超过200M)的上传。

3、公布测试数据,提交测试结果

2018年4月15日上午8:00:00准时放出测试数据,请在"结果测试"页面下载测试数据,并于2018年4月15日上午12:00:00前将测试结果上传至FTP指定路径(FTP路径将于2018年4月10日公布)。

4、提交附件

2018年4月15—18日(23:59:59之前)在系统中在线提交挑战赛作品附件,附件大小不得超过200M。


点击下载B题赛题

点击下载B题部分数据

点击下载B题全部数据

点击下载B题论文附件提交说明

点击下载B题测试结果提交说明


C题:智能阅读模型的构建

出题企业——广州火焰信息科技有限公司

一、赛题背景

近年来,自然语言处理(NLP)作为人工智能的一个重要领域得到了飞速发展,并且相关技术及其应用的需求日益广泛。在国家政策的推动下,目前市面上有众多的创业公司,对NLP的人才需求相当大。

目前,作为人工智能中自然语言处理的代表产品之一,“智能交互技术”已经逐渐渗透到我们周围的很多产品中。但是很多所谓的智能产品,仅仅可以识别一些特定命令,例如,当输入为“打开QQ”,就能够启动QQ,但输入改为“看一下QQ”,就会毫无反应,更不用说一般的语言交流了。而对于普通大众来说,他们希望机器更加“智能”,能够通过自然语言就可以跟机器交流,让机器为我们服务,最大程度上减少额外学习负担,所以未来自然语言处理的一个发展方向就是如何让用户“更自然”、“更低成本”地实现人与机器的交流。

本赛题聚焦于智能交互在电子书阅读的应用。

日常生活中人们要阅读大量的txt文本,其内容可能是小说、教程、文集、词典等。很多情况下我们只是需要从文本中查找某一些片段来解决我们的问题。比如,通过查找法律文献中的一些段落来解决我们的法律疑惑,这时并不需要精读整个法律文献;对于小说,有时候我们也只是想知道其中一些特殊细节,并不想花时间去通读整个小说;因此我们希望智能阅读技术能够在这方面提供一些帮助。下面是两个典型的智能阅读的使用场景:

场景一:

TXT:汽车的说明书

问题:1、怎样打开远光灯? 2、后排要不要系安全带?

需求:定位到txt中能帮我们回答问题的所在行,或者给出明确的答案

场景二:

TXT:《射雕英雄传》小说全文

问题:1、“江南七怪”分别是谁? 2、九阴真经的作者是谁?

需求:定位到txt中能帮我们回答问题的所在行,或者给出明确的答案

本题希望能够构建一个智能的文本挖掘模型,针对自然语言输入的问题,能够根据txt内容给出需要的回答。

......


请仔细阅读以下对于C题的说明:

1、关于赛题数据

①部分数据:2018年3月1日公布部分数据。

②全部数据:2018年4月1日公布挑战赛使用的全部数据。

③测试数据:2018年4月14日上午12:00:00准时放出测试数据,并于2018年4月15日上午12:00:00前提交测试结果。

④以上数据请参赛者在相应时间点根据本页面提示下载。

2、提交作品

①挑战赛作品内请勿出现学校、学院、队员以及指导老师相关任何信息,否则该作品视为无效作品。

②请参赛队于2018年4月14日23:59:59之前在挑战赛系统中在线提交大小不超过50M的论文正文的PDF文件。同时,在系统中获取附件的MD5码【这里的附件为包括论文正文(doc式)、源数据(组委会提供的源数据外)、过程数据、程序及模型文件的压缩包】;请注意获取该压缩包对应的MD5码后,对文件进行的任何操作(如打开、编辑、另存等),都将改变压缩包对应的MD5码,造成无法上传,因此,请参赛队获取MD5码之后,不要再对参赛作品及附件进行任何操作,直到2018年4月15—18日(23:59:59之前)完成参赛作品附件(不超过200M)的上传。

3、公布测试数据,提交测试结果

2018年4月14日上午12:00:00准时放出测试数据,请在"结果测试"页面下载测试数据,并于2018年4月15日上午12:00:00前将测试结果上传至FTP指定路径(FTP路径将于2018年4月10日公布)。

4、提交附件

2018年4月15—18日(23:59:59之前)在系统中在线提交挑战赛作品附件,附件大小不得超过200M。


点击下载C题赛题

点击下载C题部分数据

点击下载C题全部数据

点击下载C题测试结果评估指标说明





  • 2018-09-03 18:01:01,本站原创
    第六届“泰迪杯”获奖证书已经全部邮寄完毕,请获奖同学(含成功参赛)下载《第六届“泰迪杯”获奖证书快递单号》查询,证书邮寄以校区为单位寄给了指导老师(无指导老师则寄给参赛队员)。如对邮寄情况有疑问,请咨询:3514662177(QQ)或18922381327(手机)。
  • 2018-08-06 13:55:07,本站原创
    2018年7月24日,中国高校大数据教育创新联盟筹立会暨“泰迪杯”数据挖掘挑战赛颁奖会在贵阳-贵州大学北校区 1号行政楼报告厅隆重召开,出席本次大会的有原贵州大学校长、浙江大学陈叔平教授,佛山科学技术学院校长郝志峰教授,贵州省数学会理事长、贵州大学副校长向淑文教授,广州泰迪智能科技有限公司张良均董事长,广东省工业与应用数学学会理事长、中山大学冯国灿教授,深圳信诺公益基金会副秘书长任绍军先生,贵州大学数学与统计学院副院长胡支军教授,天津大学边馥萍教授、北京大学邓明华教授、信息工程大学韩中庚教授、国防科技大学
  • 2018-07-28 18:22:48,本站原创
    2018年7月24日,2018年全国高校大数据教学创新研讨暨“泰迪杯”数据挖掘挑战赛颁奖会圆满结束在贵州大学贵州大学北校区 1号行政楼报告厅隆重举行。会议由泰迪杯数据挖掘挑战赛组委会主办,贵州省数学学会、贵州大学承办,广州泰迪智能科技有限公司协办。
  • 2018-07-28 10:39:18,本站原创
    2018年7月25日下午,2018年“泰迪杯”数据挖掘挑战赛教练员培训——贵阳站正式开始,国防科技大学毛紫副教授为各位老师开讲《Python与数据挖掘》课程,课程包含基础数据类型、结构,常用数据管理,文件读写,Python数据挖掘常用模块:Numpy、Pandas,正则表达式以及文本特征提取,为各参与培训的老师提供了很好的学习Python的思路跟方法。
  • 2017-05-26 16:20:58,本站原创
    ​为推广高等院校大数据教学,增强校企产学创交流合作和信息共享,提升高等院校的教学和技术创新能力,决定于2018年7月23日-27日在贵阳市召开全国高校大数据教学创新研讨暨“泰迪杯”数据挖掘挑战赛颁奖会。 会议的主要议题为:1)数据挖掘挑战赛颁奖;2)当前形势下高校大数据人才培养面临的挑战与对策;3)教育部协同育人项目交流;4)数据挖掘挑战赛优秀作品展示及教练员培训。
  • 2018-04-10 15:40:52,本站原创
    通知一: 如需发票报销而在报名时没有勾选需要发票的队伍,请在4月18日前把队号、发票抬头及纳税人识别号发送到邮箱services@tipdm.com。逾期发票则无法开出,请各位需要发票报销的队伍及时申请。 通知二: 发票会在本月月中全部寄出,寄出后会在官网(www.tipdm.org)上公布每个学校的发票收件人以及快递单号。(注:发票邮寄以学院为单位寄给指导老师。)
  • 2018-02-28 20:35:34,本站原创
    “泰迪杯”数据挖掘挑战赛致力于推广我国高校数据挖掘实践教学,培养学生数据挖掘的应用和创新能力,增加校企间的交流合作和信息共享,提升我国高校的教学质量和企业的竞争能力。迄今已经成功举办了五届竞赛活动,并获得丰硕佳果。 本届泰迪杯竞赛由全国大学生数学建模竞赛组委会主办,广州泰迪智能科技有限公司承办,广东省工业与应用数学学会、华南师范大学协办,本届竞赛共有来自全国30多个省市、自治区的325所高校2541支队伍参赛。本届竞赛在参赛队伍数量和水平、分布地域、院校层次都有了很大的突破。从获奖结果上来
  • 2018-02-26 15:13:22,本站原创
    赛题的背景解读以及数据挖掘基础知识及相关工具的使用都可以在我们的线上视频观看平台泰迪云课堂(moodle.tipdm.com)上观看,其中,赛题背景解读在3月1日开题之后就会立刻放出。网络直播是3月11日上午10点在网易云课堂(http://study.163.com/course/courseMain.htm?courseId=1005087010&utm_campaign=commission&utm_source=cp-1019777174&utm_med)上进行。直播间链接届时会在各竞赛群上发布。
  • 2018-01-17 23:19:59,本站原创
    为了激励学生学习数据挖掘知识的积极性,提高学生建立数据挖掘模型解决实际问题的综合能力,培养和锻炼学生的创新精神,丰富学生的社会实践活动,泰迪杯数据挖掘挑战赛组织委员会决定举办第六届“泰迪杯”数据挖掘挑战赛。
  • 2018-01-17 23:03:50,本站原创
    1、组委会(按拼音排序) 主任:郝志峰(佛山科技学院教授) 副主任:蔡志杰(复旦大学教授) 张良均(广州泰迪智能科技有限公司 董事长) 成员:冯国灿(中山大学教授) 冯伟贞(华南师范大学副教授) 杨 虎(重庆大学教授) 秘书长:张尚佳(广州泰迪智能科技有限公司) 副秘书长:张 剑(广州泰迪智能科技有限公司)
  • 2018-01-17 23:03:31,本站原创
    “泰迪杯”数据挖掘挑战赛(以下简称挑战赛)是由泰迪杯数据挖掘挑战赛组织委员会主办,广州泰迪智能科技有限公司承办,广东省工业与应用数学学会协办的面向全国在校研究生和大学生的群众性科技活动。举办挑战赛的目的在于以赛促学,激励学生学习数据挖掘的积极性,提高学生分析、解决实际问题的综合能力;以赛促教,推动数据挖掘技术在高校的推广和应用;以赛促研,为高校相关智力资源转化为推进国家大数据战略的生产力提供合作平台。
公众号
返回
顶部
请关注“官方公众号”
Copyright © 2013-2017   广州泰迪智能科技有限公司   技术支持   粤ICP备14098620号