AI领域最最最稀缺的人才—

AI 架构师这个角色是在最近几年里逐渐衍生出来的，可谓是人工智能界的“新贵”。

“新”，是因为随着近几年来AI工程化落地的人才需求井喷，才催生出了“AI架构师”这份职业；“贵”，则是因为这份工作的年薪，由于其人才稀缺性，达到了令人咋舌的程度。在网上随便一搜，便能发现各大互联网公司开出的薪资，平均竟高达40k-50k，更有甚者可达年薪百万。

图片来源：拉勾网

这是随随便便工作一年，就凑够一套北上广首付的节奏。若是再加上股票期权等隐形福利，40岁之前实现财务自由，从此逍遥快活不是梦。

但是，这份工作并不是人人都能做，我们得看看它到底“贵”在哪儿？需要哪些核心技能？

什么样的人才能让大厂为之疯狂？

以阿里巴巴在招的AI高级解决方案架构师为例，我们来归纳总结一下此职位的技能树：

图片来源：猎聘网

坚实的机器学习和深度学习理论基础

能熟练使用Python、Tensorflow等建模工具，对数据挖掘、机器学习算法有深入的了解。

丰富的项目实战经验

包括机器学习算法应用、分布式深度学习框架、数据挖掘项目等实际应用的经验。

业务理解能力

能够快速理解业务，将业务问题转化为实际问题，并给出针对性解决方案。

总的来说，AI架构师不仅要对AI知识体系有一个穿透性的理解，更要通过大量的项目实践，将理论应用到现实中来，而想要达到年薪百万的水平，还需不断训练自己将业务问题抽象成AI问题的能力，并提出相应的解决方案。

挣钱难吗？难。

但并不是不可能。

贪心学院

分布式高性能深度学习实战培养计划

现在加入，给自己一个跻身金字塔尖的机会

为什么推荐这门课程？

帮你打基础

各大AI框架设计原理讲解，学完你将迅速掌握Tensorflow、Pytorch、Mxnet等常用训练框架的分布式通信及计算原理。CUDA、MPI、OPENMP等常用并行计算库的使用。TensorRT、TNN等常用部署框架的设计及使用。模型量化、压缩、裁剪、混合精度训练等常用优化方法。

带你做项目

语音、视觉、推荐，三大性能提升项目实战，涵盖深度学习的目标检测算法，AI个性化语音合成项目实战，以及基于算法的分布式推荐系统实操。

大厂导师亲自带队，手把手传授一线业务经验

课程主讲人任老师，是现任某大厂深度学习高性能负责人，百度深度学习技术平台部Paddle资深架构师，猎豹移动NR推荐系统及语音识别资深算法工程师，以及中科院信息工程研究所的助理研究员。

曾参与研发产品包括小爱同学、小雅、小豹智能音箱智能语音系统，News Republic新闻推荐系统，中科院大规模GPU+FPGA分布式异构计算系统，Paddle 集合通信框架及PLSC开发。资历丰富，技术过硬，对于AI架构师的能力要求及培养非常有经验。

课程大纲

阶段一：基础准备及概述

Week01 基础理论及课程介绍

课程安排与三大项目介绍（图像+语音+推荐）
高性能计算技术深度学习应用概览。
矩阵计算基础理论。
Cupy矩阵加速技术。
Numba 编译加速技术。
练习：使用Cupy实现千万级矩阵加法运算。

Week02 并行及分布式框架概述

经典并行计算方案介绍。
OPENMP技术详细介绍。
MPI技术详细介绍。
NV集合通信NCCL 技术介绍。
练习：使用MPI/NCCL/OPENMP实现并行规约算法。

阶段二: 目标检测项目

Week 03 -Week 05

内容简介：

目标检测计算机视觉中的经典问题。目前已经广泛应用在行人跟踪、车牌识别、无人驾驶等领域。基于深度学习的目标检测算法由于具有较高的识别准确率逐渐成为主流。目标检测算法对实时性要求较高，本项目着力于解决这一问题。

学习目标：

通过目标检测这类以卷积模块为主的模型的解构，掌握并能够上手自己动手实现卷积等常规的神经网络算子，并使用TensorRT框架完成基于GPU的目标检测项目的部署。

Week 04 目标检测算法

RCNN系列模型分析。
YOLO系列模型分析。
SSD系列模型分析。
Tensorrt框架入门。
练习：Tensorrt SSD项目的部署。

Week 05 NvidiaTensort核心算法和Plugin开发

TensoRT 量化技术。
TensoRT混合推理的原理。
TensoRT的Plugin开发流程。
练习：使用不同级别量化对比YOLO 推理性能。

阶段三：个性化语音合成项目实战

Week 06-10

内容简介：

智能化的读书功能，允许选择语音音色来进行听书。导航的智能语音-如百度地图、高德地图、传统Garmin导航等，都支持选择不同语言进行实时导航。智能音箱-喜马拉雅FM的小雅、科大讯飞的智能语音输入，支持辨识活体语音，进行反馈处理再以语音方式反馈回复。这些问题背后都是基于Seq2Seq的深度学习合成模型，该模型结构复杂计算量大，本项目旨在通过通过优化解决这一问题。

学习目标：

掌握个性化语音合成中经典的声纹提取、基于Attention的合成模型、以及典型的基于卷积网络的声码器设计。在此基础上掌握基于ONNX的通用模型转换技术及基于TensorRT来进行模型部署推理加速。

Week 06：合成项目全貌概览

合成项目整体介绍。
声纹提取网络结构。
Tacotron/Tacoton2 结构介绍。
Wavenet、WaveRNN、WaveGlow 结构介绍。
实践课：Pytorch 实现Google Speaker Embedding。

Week 07 计算图表示及优化

ONNX计算图表示方法介绍。
ONNX 图优化的常用技术。
Pytorch模型转ONNX技术介绍。
实践课：实现Google Speaker Embedding 模块的onnx输出并进行图优化。

Week 08 Attention-Based Seq2Seq模型Tacotron2

Tacotron2模型整体结构。
Attention技术回顾。
teacher forcing技术。
GRU算法的TensorRT实现。
练习：将tacotron2模型输出为优化后的onnx模型并Tensorrt部署。

Week 09 声码器: Wave序列生成算法实战。

声码器技术回顾。
wavenet模型解读。
WaveRNN模型解读。
WaveGLow模型解读。
实践课：整体部署优化后的5s语音合成系统。

阶段四：分布式推荐系统

Week 10 – week12

内容介绍：

头条新闻推荐、抖音短视频推荐、京东商品推荐个性化推荐已经成为现代人们生活的一部分。推荐系统特征往往具备稀疏性的问题，如果解决大规模稀疏模型的训练时本项目拟解决的问题。

学习目标：

通过推荐系统这一大规模稀疏特征特性的模型结构，了解参数服务器的设计以及分布式环境下的反向传播算法的实现，以及常见梯度计算优化算法Local SGD,同时具备常用推荐模型的应用部署能力。

Week10 推荐系统概览

基于LR的朴素新闻推荐系统设计。
常用Layer的前向传播和反向传播算法。以fc和pooling为例。
实践课：实现最基本的LR推荐。

Week11 分布式参数服务器

Week 12：分布式推荐系统实战

FM算法详细详细介绍。
DeepFM算法详细介绍。
稀疏矩阵的全局参数更新算法。
实战项目：用pslite实现分布式FM推荐算法。

阶段五深度学习高级主题

Week13-Week15

内容介绍：

深度学习框架日新月异。国际上有Tensorflow、Pytorch、Keras等框架，国内有PaddlePaddle、旷世天元，清华计图等框架，那么这些框架遵循怎样的设计理念和发展发现，本阶段内容通过梳理典型框架的设计来让学员对这些问题有更为清晰和直观的认识。

学习目标：掌握深度学习架构的设计思想及技术演进，通过对核心的框架通信技术的解读以及经典的图优化算子融合等技术的讲解，让读者未来对框架的使用更加熟练。

Week13 深度学习架构演进

主流深度学习框架的核心设计思路对比。
第一代系统
第二代系统
第三代系统
实战项目：paddle中的program技术分析报告。

Week14 训练加速高级技术1

Local SGD原理。
并行执行器设计。
实战项目：动手实现local sgd。

Week15 训练加速高级技术 2

深度学习框架分布式通信技术。
深度学习框架计算图fuse技术。
实践课：TNN fuse技术源码分析报告。

阶段六结业答辩

Week16 闭幕式

课程总结

项目答辩

毕业典礼

这门课程适合谁？

毕业后希望跻身AI领域的大学生

计算机或者信息领域相关的本科/硕士/博士生。
毕业后希望从事深度学习相关的工作。
想要在深度学习应用外掌握深度学习框架的设计。
想要学习框架二次开发，验证新算法的能力。

想要实现技能提升，跳槽大厂的在职人士

具备良好的工程研发背景，希望从事AI相关的项目或者工作。
从事AI单一领域，但希望具备深度学习从框架到部署优化全链路能力。
希望能够提升模型部署中遇到的性能瓶颈时的问题解决能力。
希望提升针对框架进行二次开发的能力，及时上线新模型新算法。

你需要具备什么基础，才能达到最佳学习效果？

理工科专业相关本科生、硕士生、博士生或者IT领域的在职人士。
具备良好的编程能力，具备良好的C++和Python编程能力。
从事深度学习领域相关工作，对深度学习训练、部署及优化有初步的认识。
具备良好的论文阅读能力。

学完课程，你将成为这样的专业人才

解决专业技能不扎实，硬实力薄弱的问题

核心内容知识点涵盖CUDA、Cupy、Numba、TensorRT、TNN、计算图优化、算子融合、 GMM Attention、Forward Attention、tts、Tacotron2、 FastSpeech……你所需要的技能工具，我们都准备好了。

解决实战经验不足，导致简历无项目可写的问题

从深度学习的应用场景（语音、视觉、推荐项目），到AI项目落地全链路流程，包括深度学习系统设计、并行计算优化、部署优化、应用，丰富的实践挑战，让你的简历不再有任何空白。

AI领域最最最稀缺的人才——AI架构师

4月20日，北大运动会“机器人太奶”走红，24日代理公司回应：机器人是开放平台可编程，配齐大概80万

美参议院投票通过向乌克兰和以色列援助法案

耿彦波留给大同的这块警示碑再引关注：华严寺综治犯三错，明耻彰过

官方否认种地交钱被免镇干部为干部子女当地回应：其父为普通居民，学历问题正调查核实

沉默的日本，衰落的国运

我国居民居住条件处于欧洲60年前水平，未来高层住宅必定都会被拆除

苏纳克宣布“有史以来最大规模军援”！英国军工业转入战时状态

美国首条"真正意义上的"高铁开工交通部长感慨

上海江边多人跑步被保安拦，“你们衣服一样的！”公园：统一着装要报备，不能拍照

成都二环高架公交车道能否开放？已初步拟定方案

大v称"上海人民广场下面的店全关完了" 记者实地走访

工商银行突然设立人民武装部，释放了什么信号？逻辑是什么？

快船独行侠G2裁判报告：最后两分钟两次漏判官方解释取消小卡2+1

太蹊跷！上海小区一报废车长期占据车位，车主按时、足额交停车费，投资已过万，物业很无奈

中部三省外贸失速，河南一季度手机出口减少1000万台

19连跌！沪牌竞拍人数逐月下降，原因何在？

NASA局长给中国登月泼脏水，结果丢了个大脸

杨利伟获得钱学森最高成就奖

利物浦0-2埃弗顿！近3轮输2场，落后英超榜首3分，努涅斯错失单刀

被指香港金融史重大时刻华夏博时嘉实三家现货比特币、以太币ETF获批

AI领域最最最稀缺的人才——AI架构师

4月20日，北大运动会“机器人太奶”走红，24日代理公司回应：机器人是开放平台可编程，配齐大概80万

美参议院投票通过向乌克兰和以色列援助法案

耿彦波留给大同的这块警示碑再引关注：华严寺综治犯三错，明耻彰过

官方否认种地交钱被免镇干部为干部子女 当地回应：其父为普通居民，学历问题正调查核实

沉默的日本，衰落的国运

我国居民居住条件处于欧洲60年前水平，未来高层住宅必定都会被拆除

苏纳克宣布“有史以来最大规模军援”！英国军工业转入战时状态

美国首条"真正意义上的"高铁开工 交通部长感慨

上海江边多人跑步被保安拦，“你们衣服一样的！”公园：统一着装要报备，不能拍照

成都二环高架公交车道能否开放？已初步拟定方案

大v称"上海人民广场下面的店全关完了" 记者实地走访

工商银行突然设立人民武装部，释放了什么信号？逻辑是什么？

快船独行侠G2裁判报告：最后两分钟两次漏判 官方解释取消小卡2+1

太蹊跷！上海小区一报废车长期占据车位，车主按时、足额交停车费，投资已过万，物业很无奈

中部三省外贸失速，河南一季度手机出口减少1000万台

19连跌！沪牌竞拍人数逐月下降，原因何在？

NASA局长给中国登月泼脏水，结果丢了个大脸

杨利伟获得钱学森最高成就奖

利物浦0-2埃弗顿！近3轮输2场，落后英超榜首3分，努涅斯错失单刀

被指香港金融史重大时刻 华夏博时嘉实三家现货比特币、以太币ETF获批

官方否认种地交钱被免镇干部为干部子女当地回应：其父为普通居民，学历问题正调查核实

美国首条"真正意义上的"高铁开工交通部长感慨

快船独行侠G2裁判报告：最后两分钟两次漏判官方解释取消小卡2+1

被指香港金融史重大时刻华夏博时嘉实三家现货比特币、以太币ETF获批