如何实现多模态AI模型的体积压缩与轻量化部署?