page contents

腾讯联合英伟达开源 TensorRT 插件自动生成工具 TPAT

腾讯联合英伟达开发的TensorRT插件自动生成工具TPAT正式宣布开源。

attachments-2022-03-ne7s1JuC62427b2d5e6ac.png

腾讯联合英伟达开发的TensorRT插件自动生成工具TPAT正式宣布开源。

TensorRT是英伟达推出的一个GPU推理框架,应用广泛,但由于支持的算子数量有限,用户面临手写插件以支持算子的痛点。

而TPAT的出现,则可以支持开放神经网络交换(ONNX)格式所有的算子,端到端生成TensorRT插件,在解放人力成本的同时,性能对比手写毫不逊色。

TPAT 实现了TensorRT插件的全自动生成,手写插件的步骤由TPAT替代,全自动生成一个算子插件耗时仅需要30-60分钟的时间。

attachments-2022-03-bR2fOysb62427b082f0e4.png

上图是TPAT的架构设计图,接受用户输入的 ONNX-Model,指定需要生成 TensorRT Plugin 的算子和 batch size,基于 TVM 深度学习编译器,对固定形状的算子进行 AutoTune,自动生成高性能的 CUDA Kernel. 将 CUDA Kernel 和 Runtime 必要的参数填充进 TensorRT Plugin 模板,生成动态链接库,可以直接加载到 TensorRT 运行。

与其它工具相比,TPAT主要有三大亮点:

  • 覆盖度:支持 onnx/tensorflow/pyTorch 所有的算子
  • 全自动:端到端全自动生成用户指定的 TensorRT Plugin
  • 高性能:大部分算子上性能超越手写 Plugin

根据TPAT的开源计划,未来它将重点进行三个方面的改进,分别是支持算子的多精度,支持子图优化以及支持动态形状。

更多相关技术内容咨询欢迎前往并持续关注六星社区了解详情。

如果你想用Python开辟副业赚钱,但不熟悉爬虫与反爬虫技术,没有接单途径,也缺乏兼职经验
关注下方微信公众号:Python编程学习圈,获取价值999元全套Python入门到进阶的学习资料以及教程,还有Python技术交流群一起交流学习哦。
attachments-2022-06-vFsPLqep62b3cafe7b808.jpeg
  • 发表于 2022-03-29 11:21
  • 阅读 ( 596 )
  • 分类:行业资讯

你可能感兴趣的文章

相关问题

0 条评论

请先 登录 后评论
轩辕小不懂
轩辕小不懂

2403 篇文章

作家榜 »

  1. 轩辕小不懂 2403 文章
  2. 小柒 1474 文章
  3. Pack 1135 文章
  4. Nen 576 文章
  5. 王昭君 209 文章
  6. 文双 71 文章
  7. 小威 64 文章
  8. Cara 36 文章