• 2017-01-17 10:21:12,本站原创
    主任:陈叔平(浙江大学教授) 副主任:郝志峰(佛山科技学院教授) 张良均(广州泰迪科技董事长) 组委会成员(按姓氏笔划排序): 冯伟贞(华南师范大学副教授) 冯国灿(中山大学教授) 杨 虎(重庆大学教授) 张颖峰(广州泰迪科技总经理) 谢金星(清华大学教授) 蔡志杰(复旦大学教授) 秘书长:张颖峰(兼) 专家组组长:陈叔平(浙江大学教授)
  • 2017-01-10 14:47:53,本站原创
    “泰迪杯”数据挖掘挑战赛(以下简称竞赛)是由全国大学生数学建模竞赛组织委员会主办,广州泰迪智能科技有限公司承办,广东省工业与应用数学学会、华南师范大学协办的面向全国在校研究生和大学生的群众性科技活动,目的在于激励学生学习数据挖掘的积极性,提高学生利用数据分析方法解决实际问题的综合能力,鼓励广大学生踊跃参加课外科技活动,开拓知识面,培养创造精神及合作意识,推动数据挖掘技术在高校的推广和应用。
  • 2017-01-04 15:07:33,本站原创
    泰迪杯数据挖掘挑战赛宗旨:创新意识,培养人才,挑战探索,公平竞争。

A题   基于市场资金流向分析的商品期货量化交易策略

出题单位——深圳数字动能信息技术有限公司

      “水涨船高”是个很简单的道理,在股票市场也是如此。一般来说,大量资金不断往某只股票流入,这只股票的价格就会上涨;当某只股票的资金大量流出,股价可能下跌,甚至一泻千里。股票市场中常说“量于价先行”,这个“量”包括资金的流向和资金的流量,统称为资金流向( money flow)。资金流向在国际上是一个成熟的技术指标,反映市场当前对某只股票超额的需求或者供给,它能够帮助投资者透过指数(价格)涨跌的迷雾看到其他投资者的投资行为。

       资金流向的计算方法多种多样,没有统一的公式。例如可以根据成交价格的涨跌来界定资金的流入或流出,或者根据主动买卖双方的力量强弱来界定资金的流入或流出。

      在期货市场中因为有做空机制,所以直接采用股票市场中的资金流向公式是无法刻画出期货标的合约真实的资金流向规律。比如某一期货标的合约价格下跌,可能是资金流入导致的,也可能是资金流出导致的。所以需要考虑持仓量与成交量以及价格的涨跌等综合因素,来刻画期货产品的资金流向。

……

请仔细阅读以下对于A题的说明:

1、关于赛题数据和解题软件

①测试数据:2017年3月10日公布2011年1月1日至2013年12月31日的商品期货分钟数据。

②答题数据:2017年4月7日公布2014年1月1日至2015年12年31日的商品期货分钟数据。

③需下载解题软件策略回测工具Auto-Trader V2.3版(请注意版本),软件适用系统win7、win10;建议配置i5、8G。

④数据下载请登录DigQuant量化社区(网址:www.digquant.com.cn,进入【泰迪杯】栏目,建议使用Google浏览器),初始登录账号密码见竞赛组委会发出的竞赛报名成功邮件,社区和Auto-Trader客户端的登录名和密码一致。

⑤数据的使用方法请查看《A题-赛题说明》或DigQuant社区【泰迪杯】专栏大赛公告中的《A题答题必读》。 

       A题数据包使用方法的补充说明:数据包为ZIP压缩文件,下载成功后,使用解压软件解压后形成数据文件。进入文件二级目录中,将会看到有一个或多个文件名为年份的文件。进入C:\Users\Public\Documents\Bitpower”\“cache”\“mink”文件目录,在“mink”目录下,将上述的文件名为年份的文件复制进来后。 登陆Auto-Trader客户端后就可以使用这些数据文件。(mink文件夹在登录Auto-Trader查询数据后才会出现)。

2、提交作品

①竞赛作品内请勿出现学校、学院、队员以及指导老师相关任何信息,否则该作品视为无效作品。

②请参赛队于2017年4月22日23:59:59之前在竞赛系统中在线提交大小不超过50M的论文正文的PDF文件。同时,在系统中获取附件的MD5码【这里的附件为包括论文正文(doc式)、源数据(组委会提供的源数据外)、过程数据、程序及模型文件的压缩包】;请注意获取该压缩包对应的MD5码后,对文件进行的任何操作(如打开、编辑、另存等),都将改变压缩包对应的MD5码,造成无法上传,因此,请参赛队获取MD5码之后,不要再对参赛作品及附件进行任何操作,直到2017年04月26日23:59:59前完成参赛作品附件的上传。 

3、提交附件

在2017年04月26日23:59:59之前在泰迪竞赛系统中在线提交竞赛作品附件。

在2017年04月26 日23:59:59之前将策略的回测报告、MATLAB源代码、调用的外部的代码包和说明文档(若没有调用,则无需上传),通过Auto-Trader的内置的报告上传功能提交。操作流程详见《A题-结果提交和策略评估说明》和DigQuant社区【泰迪杯】专栏大赛公告中的《A题答题必读》。 

注:A题答题过程中,遇到数据或软件使用问题,请拨打400-1860-552客服热线。

                                                                                                                        点击下载A题赛题及相关说明

点击下载A题答题数据


B题   中央空调系统的数据分析与控制策略

出题单位——广州泰迪智能科技有限公司及美国伊利诺伊大学新加坡高等数字科学中心联合出题

一、问题的背景

随着全球气候的变迁和空调技术的发展,越来越多的大型建筑物利用中央空调系统来实现室内温度和湿度的调节控制。特别是随着“智慧城市”建设步伐的快速推进,如何围绕智慧城市建设实现中央空调系统的智能控制与节能,这是智慧城市建设中的重要研究课题之一。中央空调系统的优化控制策略研究也是实际中的一个很有普遍意义的重要课题。

图1给出了常见的一类中央空调系统的基本结构示意图,该系统包括三套冷却装置(Chiller,记为CH-1/2/3)、两个冷却塔(Cooling Tower,记为CT-1/2,二者等效)、三个冷凝水泵(Condenser Water Pump,记为CWP-1/2/3)和四个冷水泵(Chilled Water Pump,记为CHWP-1/2/3/4)。三套冷却装置的额定功率分别为550RT,550RT和235RT(RT为冷却吨,即表示制冷能力的功率单位,1 RT = 3.517kw )。

……

请仔细阅读以下对于B题的说明:

1、关于赛题数据

①样例数据:2017年3月10日公布样本数据。

②建模数据:2017年4月7日公布建模使用的全部数据。

③验证数据:2017年4月23日上午8:00准时放出验证数据,并于2017年4月23日上午11:59:59前提交验证结果。

④以上数据请参赛者在相应时间点根据本页面提示下载。

        注:因原数据为传感器实测数据,客观存在着时延和精度误差,作为实际问题的研究依所给数据为准,请参赛者忽略原附件2中的公式。

2、提交作品

①竞赛作品内请勿出现学校、学院、队员以及指导老师相关任何信息,否则该作品视为无效作品。

②请参赛队于2017年4月22日23:59:59之前在竞赛系统中在线提交大小不超过50M的论文正文的PDF文件。同时,在系统中获取附件的MD5码【这里的附件为包括论文正文(doc式)、源数据(组委会提供的源数据外)、过程数据、程序及模型文件的压缩包】;请注意获取该压缩包对应的MD5码后,对文件进行的任何操作(如打开、编辑、另存等),都将改变压缩包对应的MD5码,造成无法上传,因此,请参赛队获取MD5码之后,不要再对参赛作品及附件进行任何操作,直到2017年4月26日23:59:59前完成参赛作品附件的上传。

3、公布验证数据,提交验证结果

      2017年4月23日上午8:00准时放出验证数据,请通过下方“点击获取B题验证数据”或云盘(链接1:http://pan.baidu.com/s/1nv8vCtN 密码:h1nc;链接2:https://pan.baidu.com/s/1i5eHBNZ 密码: bqxq )下载验证数据,并于2017年4月23日上午11:59:59前将验证结果上传至FTP指定路径,详见点击下载FTP安装包及操作手册”内《FTP操作手册》

4、提交附件

      2017年4月26日23:59:59之前在系统中在线提交竞赛作品附件。



  点击下载B题赛题

点击下载B题样例数据

点击下载B题建模数据

点击下载关于B题验证结果格式说明

点击下载FTP安装包及操作手册

点击获取B题验证数据

  

C题   通用论坛正文提取

出题单位——互动派科技股份有限公司

一、问题的背景

      在当今的大数据时代里,伴随着互联网和移动互联网的高速发展,人们产生的数据总量呈现急剧增长的趋势,当前大约每六个月互联网中产生的数据总量就会翻一番。互联网产生的海量数据中蕴含着大量的信息,已成为政府和企业的一个重要数据来源,互联网数据处理也已成为一个有重大需求的热门行业。借助网络爬虫技术,我们能够快速从互联网中获取海量的公开网页数据,对这些数据进行分析和挖掘,从中提取出有价值的信息,能帮助并指导我们进行商业决策、舆论分析、社会调查、政策制定等工作。但是,大部分网页数据是以半结构化的数据格式呈现的,我们需要的信息在页面上往往淹没在大量的广告、图标、链接等“噪音”元素中。如何从网页中有效提取所需要的信息,一直是互联网数据处理行业关注的重点问题之一。

      网页通常采用超级文本标记语言(英文缩写:HTML)来编写,页面上的不同元素如作者、主题、发布日期等出现在一对特定的标记符之间。例如当我们看到如下一个论坛网页:

……

请仔细阅读以下对于C题的说明:

1、关于赛题数据

①样本数据:2017年3月10日公布样本数据,学生可根据样本数据做题,也可再自行爬取相关数据。

②验证数据:2017年4月23日上午8:00准时放出验证数据,并于2017年4月23日上午 11:59:59前提交验证结果。

③以上数据请参赛者在相应时间点根据本页面提示下载。

2、提交作品

①竞赛作品内请勿出现学校、学院、队员以及指导老师相关任何信息,否则该作品视为无效作品。

②请参赛队于2017年4月22日23:59:59之前在竞赛系统中在线提交大小不超过50M的论文正文的PDF文件。同时,在系统中获取附件的MD5码【这里的附件为包括论文正文(doc式)、源数据(组委会提供的源数据外)、过程数据、程序及模型文件的压缩包】;请注意获取该压缩包对应的MD5码后,对文件进行的任何操作(如打开、编辑、另存等),都将改变压缩包对应的MD5码,造成无法上传,因此,请参赛队获取MD5码之后,不要再对参赛作品及附件进行任何操作,直到2017年4月26日23:59:59前完成参赛作品附件的上传。

3、公布验证数据,提交验证结果

      2017年4月23日上午8:00准时放出验证数据,请通过下方“点击获取C题验证数据”或云盘(链接1:http://pan.baidu.com/s/1mhU2aXM 密码:xy9u;链接2: https://pan.baidu.com/s/1o8NSC10 密码: q2ry)下载验证数据,并于2017年4月23日上午11:59:59前将验证结果上传至FTP指定路径,详见点击下载FTP安装包及操作手册”内《FTP操作手册》。   

4、提交附件

      2017年4月26日23:59:59之前在系统中在线提交竞赛作品附件。     


                                                                                                                                                                                   

                                                                                         

点击下载C题赛题

点击下载C题样例数据

点击下载关于C题验证数据及结果格式说明

点击下载FTP安装包及操作手册

点击获取C题验证数据




另外:1、三道题的赛题解读及相关赛前指导见http://moodle.tipdm.com/

          2、美国MathWorks公司为本届泰迪杯提供赞助,点击获取MathWorks公司支持              

                正版MATLAB软件试用申请:https://cn.mathworks.com/academia/student-competitions/taidi-cup.html




                                                                                                  

                          点击下载参赛者操作说明书 

点击下载第五届泰迪杯数据挖掘挑战赛承诺书


  • 2017-06-05 10:41:57,本站原创
    本届竞赛于2017年3月10日正式开始,至2017年4月26日截止提交附件,历时一个半月。竞赛共计有来自全国300多所高校2541支队伍报名参赛,由高校和公司共同组成的评审专家组历时一个月的评审,最后决出特等并获企业冠名奖作品3份、特等奖作品3份、MATLAB创新奖作品2份、一等奖作品49份、二等奖作品109份、三等奖作品203份、成功参赛作品1131份。本届竞赛采用盲审(屏蔽参赛者信息;评审专家只能评阅非本区域作品;三位评阅专家同时评阅同一作品,超限调整后再取平均分),没有区分研究生、本科生及专科生。
  • 2017-06-13 11:48:08,本站原创
    为了让更多花费了心血在竞赛中的学生能够获得认可,从今年开始,“泰迪杯”开始增设省级奖项。由广东省以及湖北省开始试行。 奖项设置: 一等奖:约占该省份队伍总数的5%,颁发“泰迪杯”XXX省一等奖荣誉证书; 二等奖:约占该省份队伍总数的10%,颁发“泰迪杯”XXX省二等奖荣誉证书; 三等奖:约占该省份队伍总数的25%,颁发“泰迪杯”XXX省三等奖荣誉证书。 获奖队伍依据“泰迪杯”全国评审专家组统一评阅的最终成绩从高到低依序按比例产生,没有区分研究生、本科生及专科生。
  • 2017-05-26 16:20:58,本站原创
    为推广高等院校数据挖掘应用创新,增强校企产学研交流合作和信息共享,提升高等院校的教学和科研创新能力,决定于2017年8月10日在贵阳召开高等院校数据挖掘应用创新研讨会,会议的主要议题为: 1)2017年数据挖掘挑战赛赛题评讲及优秀作品展示;2)大数据形势下高校大数据挖掘人才培养面临的挑战与对策。同时,为了给一直以来指导学生参加数据挖掘竞赛的老师们提供新的指导思路、培养高出水平的数据挖掘挑战赛教练员,决定于2017年8月11日—2017年8月12日举行教练员培训。
  • 2017-05-25 09:56:57,本站原创
    经过了漫长的初审,进入第二轮视频答辩的队伍名单以千呼万唤始出来,犹抱琵琶半遮面的姿态出来了。进入第二轮评审的都是竞赛中的佼佼者,预祝各位进了视频答辩的参赛队伍能更上一层楼。
  • 2017-05-22 14:30:06,本站原创
    通知一 由于税务改革的原因,发票正在申请,发票开出后会在竞赛官网、各个竞赛QQ群及微信公布。不便之处,敬请谅解! 通知二 第二轮评阅时间延后至2017年6月4日,具体进入视频答辩的队伍名单会在这周四(2017年5月25日)在竞赛官网及微信公布。 成绩公示的时间延后至2017年6月6日-6月16日。
  • 2017-04-23 00:19:17,本站原创
    由于文件上传服务器在受到了较大压力的情形下出现堵塞,特将论文提交及获取附件MD5码的时间向后顺延1小时,即: 顺延至2017年4月23日凌晨1:00! 请在2017年4月23日凌晨1:00——2017年04月26日23:59:59之间再次登录系统完成“提交附件”的操作
  • 2017-04-20 15:08:57,本站原创
    第五届泰迪杯数据挖掘挑战赛志愿者工作已圆满结束,感谢各位志愿者的踊跃参与,也感谢志愿者们的辛苦宣传。以下同学是我们今年“泰迪杯”的优秀志愿者:
  • 2017-03-29 15:08:23,本站原创
    2017年3月30日下午三点将在华南师范大学石牌校区数学科学学院阶梯科室二楼报告厅举行A题基于市场资金流向分析的商品期货量化交易策略赛前指导。届时由出题企业深圳数字动能信息技术有限公司量化研究部总监刘峰先生为大家围绕试题背景、量化交易模型介绍与分析等进行详细介绍。
  • 2017-03-24 13:32:10,本站原创
    为让泰迪杯参赛者们能够更深入了解数据挖掘挑战赛赛题(A题:基于市场资金流向分析的商品期货量化交易策略;B题:中央空调系统的数据分析与控制策略;C题:通用论坛正文提取)的出题背景、项目需求、解题思路及相关知识点,第五届泰迪杯数据挖掘挑战赛赛前指导火热进行中!
  • 2017-03-22 17:37:34,本站原创
    “泰迪杯”数据挖掘挑战赛(www.tipdm.org/)(以下简称泰迪杯)是由全国大学生数学建模竞赛组织委员会主办,广州泰迪智能科技有限公司承办,广东省工业与应用数学学会、华南师范大学协办的面向全国在校研究生和大学生的群众性科技活动,目的在于激励学生学习数据挖掘的积极性,提高学生利用数据分析方法解决实际问题的综合能力,鼓励广大学生踊跃参加课外科技活动,开拓知识面,培养创造精神及合作意识,推动数据挖掘技术在高校的推广和应用。
  • 2017-03-13 14:55:39,本站原创
    为了迎接第五届泰迪杯数据挖掘挑战赛,泰迪云课堂从即日起免费开放往年赛题的讲评和与数据挖掘相关的视频。 目前已开放的视频有“2017泰迪杯赛前培训之往届赛题讲评”、“2017泰迪杯赛前培训之MATLAB”、“2017泰迪杯赛前培训之R语言与数据挖掘”,以访客的身份登录即可免费观看。 “泰迪云课堂”是泰迪智能科技旗下的大数据挖掘与开发线上学习平台,它为对大数据具有浓厚兴趣的人提供了多种便捷的线上视频教学课程。
  • 2017-03-09 23:11:25,本站原创
    2017年3月8日,美国MathWorks公司赞助2017泰迪杯数据挖掘挑战赛签约仪式在在佛山科学技术学院举行。参加仪式的主要有佛山科学技术学院郝志峰校长、MathWorks中国教育业务总监卓金武先生、中山大学冯国灿教授、广州泰迪智能科技有限公司总经理张颖峰先生以及MathWorks公司跟佛山科技学院的其他专家老师。
  • 2017-01-10 14:19:13,本站原创
    为推广我国高校数据挖掘实践教学,培养学生数据挖掘的应用和创新能力,增加校企交流合作和信息共享,提升我国高校的教学质量和企业的竞争能力,由全国大学生数学建模竞赛组织委员会发起的第五届“泰迪杯”数据挖掘挑战赛将于2017年3月如期举行。本届竞赛由全国大学生数学建模竞赛组织委员会主办,广州泰迪智能科技有限公司承办,广东省工业与应用数学学会、华南师范大学协办。
  • 2016-09-06 14:47:12,本站原创
    在原有优势资源的基础上,第五届“泰迪杯”将在全国大学生数学建模竞赛组织委员会的指导下再次扬帆起航,为能够切实落实“整合高校、政府、企业、人才、资本等多方资源,促进高校教育向应用型转型;加强学生应用创新能力;为企业选拔优秀人才,并快速获得高价值解决方案,实现优秀竞赛作品的成果转化”的竞赛目标,现面向社会各界征集赛题。
  • 2017-06-21 11:28:40,本站原创
    资金流向是一个成熟的技术指标,能帮助投资者透过价格涨跌的迷雾看到其他投资者的行为。而由于期货市场上有做空机制,所以无法直接采用股票市场的资金流向公式。因此需要从持仓量、成交量、当前价格涨跌等因素来看期货的资金流向。
  • 2017-06-21 11:23:47,本站原创
    中央空调系统为人类带来了舒适的生活环境,同时也带来了巨大的能源消耗,因此关于中央空调系统的节能降耗问题也成为了热门研究之一。 在本文中,利用MATLAB对所给出的数据进行数据清理、集成、归约和变换等预处理步骤。基于预处理的数据,将各属性的数据与系统消耗功率进行皮尔森相关系数分析。相关系数大于0.5的属性之间再进行二级相关性分析,相关系数小于等于0.3的属性即为特征向量。提取出了10个特征向量,见表3。
  • 2017-06-20 11:12:05,本站原创
    信息价值的作用日益凸显,利用网络爬虫技术提取论坛网站的有价值信息效果明 显。报告针对论坛网站主帖和回帖的标题、作者、时间、内容的提取,提出了三种可行方案,并通过对比分析、综合三种方案的优缺点,提出最优方案,且该方案对网络论坛具有普遍适用性。 该方案基于网页分块的论坛爬虫思想,利用CSS选择器和正则表达式(用于筛选时间), 结合HTML DOM树及HTML标签的特性,考虑到部分网络论坛的特殊性,具有高度通用性。
  • 2017-06-20 11:05:03,本站原创
    本文旨在开发基于期货市场资金流向分析的商品期货量化交易策略,通过分 析商品期货历史数据,结合期货市场相关背景,来刻画了期货市场资金流向规律, 并构建策略模型。
  • 2017-06-20 10:57:57,本站原创
    随着经济社会的发展,中央空调的使用在大中型城市中越来越普遍,随之而来的是 中央空调的智能控制与节能问题。我们从数学模型角度考虑系统动态实时的控制,并采 用动态分析方法,对系统进行优化控制。
  • 2017-06-20 10:50:08,本站原创
    在当今的大数据时代里,当前每六个月互联网中产生的数据总量就会翻一番。借助网络爬虫技术提取数据资料至关重要。并且网页论坛的结构各种各样,能够对于多样论 坛有一个通用提取算法,则是可以快速获取的数据的有利条件之一。 本文完成了对主题帖标题,作者,发帖时间和主题帖正文的提取,以及回帖楼层, 作者,回帖时间和回帖正文的提取。经过一个月的程序调试,最终得到了得到了较为完 整的爬虫内容,特别是在处理噪声内容方面,达到了较好的结果。
公众号
返回
顶部
请关注“官方公众号”
Copyright © 2013-2017   广州泰迪智能科技有限公司   技术支持   粤ICP备14098620号