2024年第三届“钉钉杯”大学生大数据挑战赛常见问题解答

一、报名相关

1.如何报名?

答:钉钉杯大学生大数据挑战赛官网:

http://www.nmmcm.org.cn/match_detail/33

每支参赛队伍需缴纳参赛费用100元人民币,参赛队伍可以单独报名缴费,也可以通过学校组织(社团、老师)集体进行缴费。

2.报名截止时间是什么时候?

答:报名截止时间是2024年7月26日06:00(周五),提前报名,提前备赛。

3.报名需要哪些信息?

答:(1)指导老师基本信息,包括:指导老师邮箱、指导老师姓名、指导老师电话(没有指导老师可不填写)。

(2)队员基本信息,包括:真实姓名、学校、手机号码和邮箱、证书邮寄地址。

4.有关组队人数、跨校组队问题?

答:每支参赛队伍成员上限为3人,允许跨校组队。竞赛允许跨校组队参加,没有专业限制,只要是在校本科生、专科生、研究生,不限专业,不限组别,无论参加什么组别都可以选择两道题中任意一道参赛。如果要组队的话,只需要队伍一个负责人报名缴费即可,也可以先报名缴费,然后再邀请别人加入自己的队伍。

5.报名信息必须都是中文吗?

答:钉钉杯为中文形式,所有页面出现的信息均填写中文形式填写,因为涉及到跨校问题,每名队员的学校名称和证书邮寄地址等信息务必准确填写。

6.报名缴费后因特殊情况需要更换队长/队员信息,应该怎么办?

答:所有参赛信息,开赛前如果需要更换队员、学校等信息,可直接官网自行修改或请及时联系钉钉杯竞赛组委会工作人员处理。

7.如果是想集体组织报名,该怎么报名?

答:集体报名的高校负责人须下载2024年第三届“钉钉杯”大学生大数据挑战赛集体报名登记表统一填写报名信息。统一填写好集体报名表后,同集体报名支付截图统一发至钉钉杯报名工作组邮箱(fw@nmmcm.org.cn),格式要求:学校+队伍数+支付人姓名。

8.报名后竞赛主页显示的报名编号(参赛队伍号)有什么用?

答:参赛队伍号是后续参赛写论文及提交论文用到的队伍号就是这个。

9.报完名以后电子档状态未提交是什么意思?

答:这里的电子档状态是比赛提交论文的状态标识,比赛期间提交论文之后,该状态会更新,比赛开始后,该状态旁边会开放提交论文入口。
二、竞赛相关

1.请问钉钉杯这个比赛是什么级别性质的?获奖证书章盖什么章?

答:一般认定为国赛,属于国家级竞赛,但不同的学校认定标准不同,具体情况请咨询自己学校的相关负责老师。

证书盖内蒙古创新教育学会、内蒙古基础教育研究院、钉钉(中国)信息技术有限公司三个章,在国内高校中是作为保研、综合测评、创新奖学金等评定竞赛之一,也可以丰富简历,面试直通车、大厂offer的敲门砖。

钉钉(Ding Talk)是阿里巴巴集团打造的企业级智能移动办公平台,钉钉是本届竞赛的联合举办单位。

2.钉钉杯赛题是什么类型的?和数学建模竞赛有什么区别?

答:钉钉杯赛题方向为数据分析和数据挖掘,题目来自国内大数据资深专家、企事业单位实际应用场景应用题目;大数据竞赛和数学建模,作为数据科学领域的两个重要分支,数学建模是将现实问题抽象为数学模型,利用数学方法分析和求解。而大数据竞赛更注重通过大规模数据和相关工具进行数据分析、预测和决策。钉钉杯和传统(如kaggle、天池)大数据竞赛相比,难度适中,适合各种基础的学生学习提高。另外,数学建模竞赛,每年都会出现数据分析和数据挖掘题型(如国赛、美赛、数维杯等),和数学建模竞赛衔接较大,有数学建模基础更容易上手。

3.钉钉杯大数据竞赛基本参赛流程是怎样的?

答:常规线路一般是:数据清洗-> 特征挖掘/特征工程 -> 搭建模型 -> 训练模型 -> 给出预测 -> 提交论文及结果

4.参加钉钉杯大数据竞赛需要掌握哪些必备知识或技能?

答:(1)包括数据预处理、特征工程、机器学习、深度学习等方面的知识和实践经验。

(2)大数据竞赛最常用的七种模型:XGBoost、LightGBM、CatBoost、SVR、MLP+Embedding、Tabnet和Transformer。

(3)竞赛常用的工具:

1.Numpy| 必用的科学计算基础包,底层由C实现,计算速度快。

2.Pandas| 提供了高性能、易用的数据结构及数据分析工具。

3.NLTK| 自然语言工具包,集成了很多自然语言相关的算法和资源。

4.Stanford CoreNLP| Stanford的自然语言工具包,可以通过NLTK调用。

5.Gensim| 主题模型工具包,可用于训练词向量,读取预训练好的词向量。

6.scikit-learn| 机器学习Python包 ,包含了大部分的机器学习算法。

7.XGBoost/LightGBM| Gradient Boosting 算法的两种实现框架。

8.PyTorch/TensorFlow/Keras| 常用的深度学习框架。

9.StackNet| 准备好特征之后,可以直接使用的Stacking工具包。

10.Hyperopt| 通用的优化框架,可用于调参。

5.报名比赛后如何准备比赛?

答:大赛官网及参赛群文件里可参考历年真题、优秀论文、训练题目及答案进行学习。

组委会也为报名同学准备了赛前培训课程及公益讲座等培训学习资料报名成功后就可以尽快投入到学习中了。

6.获奖比例是怎么算的?未进入复赛能获奖吗?

答:没有进入复赛的队伍,也会根据初赛成绩排名,颁发一等奖、二等奖、三等奖和优秀奖若干名。

复赛选取初赛中前15%获奖选手将晋级,颁发一等奖、二等奖、三等奖。

复赛中选取排名前10支队伍进行决赛答辩,最终奖项答辩总排名设为冠军,亚军,季军。

7.如何下载赛题及数据?

答:7月26日09:00开放初赛试题的下载,选手可以从竞赛官网下载赛题及数据集。

8.初赛时长是多久呢?

答:初赛时间是7月26日09:00-8月1日09:00,为了让大家避开假期其他事项,假期中也有充足的时间进行比赛;另一方面是因确保比赛数据的严谨性,赛题数据量较大,需要多一些的时间去做题。

9.其他说明。

答:本项比赛全程不允许使用外部数据集。

三、提交相关

1.参赛作品提交方式是什么样的?最终提交哪几项内容?

答:

(1)作品在报名官网或邮件形式提交进行提交,初赛论文必须在8月1日09:00之前提交完毕,会以最后一次提交的作品为准。

(2)最终提交的内容包含:参赛作品、结果、源代码等相关材料,详见竞赛提交流程说明。

2.提交文件大小有限制吗?

答:考虑实际使用,我们希望参赛选手使用的模型是简单而高效的,不鼓励使用超大模型,具体可查看竞赛提交流程说明。

3.本次大赛是否设置排行榜?如果没有排行榜,怎么验证自己模型的合理性呢?

答:目前竞赛不设置排行榜,后期若发布排行榜会及时官网通知

(1)第一可以看准确率。

(2)第二就是设置一个验证题,从验证题里看模型效果,机器学习常用方法,就是训练集分两部分,一部分用于训练,一部分用于验证。

四、证书问题

1.获奖证书如何分发?

答:初赛结果将于2024年8月下旬左右发布,公布获奖情况后,电子证书可以在钉钉杯官网下载。

2.团队参赛的话,证书如何发放?

答:队内每位队员都会颁发一份纸质证书,证书上每名参赛队员都会有第一作者及自己的学校名称。(跨校队员也是如此)

打开网易新闻 查看更多图片

五、志愿者问题

1.我报了比赛,还可以报名志愿者吗?

答:可以的,参加志愿者活动,完成任务后均会有特惠福利赠送。

2.我没有报名比赛,可以参加志愿者吗?

答:可以的,全日制在校大学生、数模、大数据好者和高校老师都可以报名。鼓励学生既报名志愿者,也可以报名竞赛。

3.做志愿者有什么奖励吗?

答:有证书、经费等相应奖励

六、高校协办申请

1、我是我们学校一个社团负责人,请问可以申请协办单位吗?

答:可以申请,协办单位征集对象为全国各高校团委、学生会、数学、计算机等学习类社团。

2.协办竞赛后,想通过线下宣传钉钉杯,对于海报、条幅、单页等物料组委会提供吗?

答:对于有符合线下开展宣传的,组委会将会提供物料等相关活动经费支持,具体需要提前和组委会工作人员进行协商。

打开网易新闻 查看更多图片