本周为TechBeat人工智能社区第280期线上Talk!
北京时间2月25日(周四)晚8点,美国东北大学助理教授—王言治博士的talk将准时在TechBeat人工智能社区上线!
他与大家分享的主题是“如何实现最优的移动端神经网络加速”,将介绍其团队最近的工作“CoCoPIE”,通过压缩——编译协同设计,以克服限制,实现边缘设备上最佳的深度神经网络加速性能。
Talk·信息
主题:如何实现最优的移动端神经网络加速
嘉宾:美国东北大学助理教授 王言治
上线时间:北京时间2月25日 (周四) 20:00
地点:TechBeat人工智能社区
http://www.techbeat.net/
Talk·提纲
移动与嵌入式计算设备已经成为深度学习的关键载体,以促进机器智能的普及。然而,由于边缘设备上的计算/存储资源有限,如何在边缘设备上实现深度神经网络的实时推理是一个公认的挑战。为了克服这一挑战,人们已经研究了深度神经网络的模型压缩,包括权重剪枝与权重量化。然而,目前关于深度神经网络压缩的工作受限于难以同时满足高精度与高硬件性能的双重要求。
本次Talk介绍了我们最近的工作CoCoPIE,其内容代表了通过压缩——编译协同设计,以克服上述限制,实现边缘设备上最佳的深度神经网络加速性能。我们提出了新型的细粒度结构化剪枝方案,包括模式化权重剪枝、块状权重剪枝等。在编译器的帮助下,它们可以同时实现高硬件性能(类似于通道剪枝),同时保持零精度损失,这是之前的工作无法做到的。
同样,我们提出了新颖的量化方案,实现了接近2位权重量化的超高硬件性能,同时几乎没有精度损失。通过CoCoPIE框架,我们能够在现有的移动设备上实现实时深度神经网络任务的执行,包括物体检测、姿势估计、活动检测、语音识别等,与之前的工作相比,速度提升了近180倍。
综合演示请参考以下链接:
https://space.bilibili.com/573588276?from=search&seid=11881710196887435131
Talk·参考资料
▼
这是本次分享中将会提及的资料,建议提前预习哦!
1. “CoCoPIE: Making Mobile AI Sweet as PIE — Compression-Compilation Co-Design Goes a Long Way” (Communications of the ACM Featured Article) is on Arxiv.
https://arxiv.org/pdf/2003.06700.pdf
2. YOLObile: Real-Time Object Detection on Mobile Devices via Compression-Compilation Co-Design(AAAI 2021)
https://arxiv.org/pdf/2009.05697.pdf
3. RT3D: Achieving Real-Time Execution of 3D Convolutional Neural Networks on Mobile Devices(AAAI 2021)
https://arxiv.org/pdf/2007.09835.pdf
4. An Image Enhancing Pattern-based Sparsity for Real-Time Inference on Mobile Devices(ECCV 2020)
https://arxiv.org/pdf/2001.07710.pdf
5. RTMobile: Beyond Real-time Mobile Acceleration of RNNs for Speech Recognition(DAC 2020)
https://arxiv.org/pdf/2002.11474.pdf
6. PCONV: the missing but desirable sparsity in DNN weight pruning for real-time execution on mobile device(AAAI 2020)
https://arxiv.org/abs/1909.05073
7. PatDNN: Achieving real-time DNN execution on mobile devices with pattern-based weight pruning(ASPLOS 2020)
https://arxiv.org/abs/2001.00138v1
8. Towards Real-Time DNN Inference on Mobile Platforms with Model Pruning and Compiler Optimization(IJCAI 2020)
https://arxiv.org/pdf/2004.11250.pdf
9. Wootz: A Compiler-based Framework for Fast CNN Pruning via Composability(PLDI 2019)
https://people.engr.ncsu.edu/xshen5/Publications/pldi2019.pdf
Talk·提问交流
▼
方式 ①
在Talk界面下的【交流区】参与互动!留下你的打call和问题,和更多小伙伴们共同讨论,说不定就被讲者直接翻牌解答了呢!
你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!
方式 ②
在本文留言区直接提出你的问题,或扫描下方二维码提问!问题被选中的小伙伴们将获得一个红包奖励!
♫. ♪ ~ ♬..♩~ ♫. ♪..♩~ ♫. ♪ ~ ♬..♩..♩~ ♫. ♪ ~ ♬..♩..♩~ ♫. ♪ ~ ♬..♩
♫. ♪ ~ ♬..♩~ ♫. ♪..♩~ ♫. ♪ ~ ♬..♩..♩~ ♫. ♪ ~ ♬..♩..♩~ ♫. ♪ ~ ♬..♩
♫. ♪ ~ ♬..♩~ ♫. ♪..♩~ ♫. ♪ ~ ♬..♩..♩~ ♫. ♪ ~ ♬..♩..♩~ ♫. ♪ ~ ♬..♩
♫. ♪ ~ ♬..♩~ ♫. ♪..♩~ ♫. ♪ ~ ♬..♩..♩~ ♫. ♪ ~ ♬..♩..♩~ ♫. ♪ ~ ♬..♩
快来提问啦!
Talk·嘉宾介绍
▼
王言治
美国东北大学助理教授
王言治,现为美国东北大学电子与计算机工程系助理教授。他于2009年获得清华大学学士学位,2014年获得南加州大学博士学位。他的研究方向为深度学习应用的模型压缩与平台加速。自2018年09月以来,他的研究成果创造了在各大代表性深度神经网络上最高的模型压缩率。他在基于AQFP超导的深度神经网络加速方面的工作是迄今为止所有硬件设备中能效最高的。他最近的研究成果CoCoPIE可以利用现成的移动设备在几乎所有的深度学习应用上实现实时性能,其加速性能超过同类型其他各类加速框架的达180倍。
他的工作被广泛发表在顶级会议和期刊上(如:AAAI、ICML、CVPR、ICLR、IJCAI、ECCV、ICDM、ACM MM、DAC、ICCAD、ASPLOS、ISCA、MICRO、HPCA、PLDI、ICS、PACT、ISSCC、FPGA、LCTES、CCS、VLDB、PACT、ICDCS、Infocom、C-ACM、JSSC、TComputer、TCAS-I、TCAD、JSAC、TNNLS等),被引用超过8300次。他发表的论文曾获5次最佳论文奖和顶级论文奖,1篇Communications of ACM专题文章,另有10次最佳论文提名和4次热门论文奖。他曾获美国陆军青年研究员计划奖(YIP)、马萨诸塞州橡子创新奖(Acorn Innovation Award)、谢明学者奖(Ming Hsieh Scholar Award),以及谷歌、英特尔、MathWorks、Snap等公司的其他研究奖项。他的3名博士/博士后学生成为康涅狄格大学、克莱姆森大学和德克萨斯农工大学(Corpse Christi)的终身制教师。
关于TechBeat人工智能社区
TechBeat(www.techbeat.net)是一个荟聚全球华人AI精英的成长社区。
我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。
期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!