今天给大家带来字节跳动人工智能实验室王晓晖先生所做的分享《LightSeq:高性能NLP序列推理实践.pdf》。本次分享主要包含如下三大部分:
1、CUDA;
2、压缩量化;
3、TVM。
省时查报告 专业、及时、全面的行研报告库 | 长按并识别关注 |
微信扫一扫
今天给大家带来字节跳动人工智能实验室王晓晖先生所做的分享《LightSeq:高性能NLP序列推理实践.pdf》。本次分享主要包含如下三大部分:
1、CUDA;
2、压缩量化;
3、TVM。
省时查报告 专业、及时、全面的行研报告库 | 长按并识别关注 |
相关推荐