信息科学与工程研究, 卷 6, 期 5 (2025)

基于边缘计算的轻量化 AI 模型自主化部署的研究进展

董 禹含, 邢 超然, 梅 益仙, 王 俊博, 徐 宝佳

摘要


随着边缘计算在自动驾驶、工业物联网等领域的广泛应用,轻量化AI模型部署成为实现低延迟、高能效自主智能的关键。本文系统综述模型压缩、硬件协同优化及自主化部署工具的技术进展:在算法层面,剪枝、量化与知识蒸馏技术可将模型尺寸大大压缩,动态推理与轻量Transformer架构使边缘端推理速度提升;在硬件协同层面,专用NPU与编译工具链显著提升能效比。典型应用验证了轻量化技术在工业缺陷检测、可穿戴医疗等场景的实效性。然而,精度-效率平衡、硬件碎片化及动态环境适应性仍是核心挑战。未来需融合自动化压缩工具、边缘-云协同推理及存算一体芯片等方向,推动边缘智能生态的实用化与标准化。本文为构建高效、鲁棒的自主化边缘AI系统提供技术参考与实践指南。