基于边缘计算的轻量化 AI 模型自主化部署的研究进展

董 禹含(东南大学成贤学院,中国;)
邢 超然(东南大学成贤学院,中国;)
梅 益仙(东南大学成贤学院,中国;)
王 俊博(南京师范大学中北学院,中国;)
徐 宝佳(东南大学成贤学院,中国;)

DOI: http://dx.doi.org/10.12349/iser.v6i5.5700

Article ID: 5700

摘要


随着边缘计算在自动驾驶、工业物联网等领域的广泛应用,轻量化AI模型部署成为实现低延迟、高能效自主智能的关键。本文系统综述模型压缩、硬件协同优化及自主化部署工具的技术进展:在算法层面,剪枝、量化与知识蒸馏技术可将模型尺寸大大压缩,动态推理与轻量Transformer架构使边缘端推理速度提升;在硬件协同层面,专用NPU与编译工具链显著提升能效比。典型应用验证了轻量化技术在工业缺陷检测、可穿戴医疗等场景的实效性。然而,精度-效率平衡、硬件碎片化及动态环境适应性仍是核心挑战。未来需融合自动化压缩工具、边缘-云协同推理及存算一体芯片等方向,推动边缘智能生态的实用化与标准化。本文为构建高效、鲁棒的自主化边缘AI系统提供技术参考与实践指南。

关键词


边缘计算;AI模型;自主化部署

全文:

PDF

参考


李辉,李秀华,熊庆宇,文俊浩,程路熙. "边缘计算助力工业互联网:架构、应用与挑战." 《计算机科学》 1(2021).

季繁繁,杨鑫,袁晓彤. "基于深度神经网络二阶信息的结构化剪枝算法." 《计算机工程》 2(2021).

Xizi Chen,Jingyang Zhu,Jingbo Jiang,C. Tsui. “Tight Compression: Compressing CNN Model Tightly Through Unstructured Pruning and Simulated Annealing Based Permutation.” 2020 57th ACM/IEEE Design Automation Conference (DAC)(2020).

王鑫,姚洋,蒋昱航,关超宇,朱文武. "硬件感知的神经架构搜索." 《中国科学:信息科学》 5(2023).

王周生,杨庚,戴华. "基于梯度选择的轻量化差分隐私保护联邦学习." 计算机科学 1(2024).

刘耕,唐小勇,游正鹏,赵立君,陈庆勇. "联邦学习在5G云边协同场景中的原理和应用综述." 通讯世界 7(2020).

任建吉,王鹏然. "动态物联网环境下的联盟学习计算卸载优化." 计算机工程与应用 16(2019).


Refbacks

  • 当前没有refback。


版权所有(c)2025 董 禹含, 邢 超然, 梅 益仙, 王 俊博, 徐 宝佳

Creative Commons License
此作品已接受知识共享署名-非商业性使用 4.0国际许可协议的许可。