如何降低多模态AI调用GPU资源过高的问题?