CVE-2025-62372vLLM是一个用于大型语言模型(LLM)推理和服务的高性能引擎。该漏洞存在于vLLM 0.5.5到0.11.0版本中,攻击者可以通过传递具有正确ndim但形状错误的多模态嵌入输入(如隐藏维度不正确)来崩溃vLLM引擎。这种攻击影响所有支持多模态功能的模型,无论模型是否被设计为支持此类输入。攻击者利用此漏洞可以造成服务中断,导致多模态模型服务不可用。由于该漏洞可通过网络远程利用,且只需要低权限认证,因此具有较高的实际威胁性。攻击成功后会导致vLLM引擎进程崩溃或进入异常状态,需要重启服务才能恢复。
漏洞根源在于vLLM对多模态嵌入输入的形状验证不充分。当用户提交多模态嵌入数据时,系统仅验证了ndim(维度数量)参数是否正确,但未对每个维度的实际大小进行严格校验。攻击者可以构造一个ndim值正确但形状参数(如hidden dimension)不符合模型期望的输入。例如,如果模型期望隐藏层维度为768,攻击者可以提交一个维度为512的输入。当vLLM尝试处理这种不匹配的嵌入数据时,会在张量运算过程中触发断言失败或内存访问错误,最终导致引擎崩溃。漏洞影响所有使用多模态功能的模型,包括图像、视频等多模态输入处理流程。由于多模态处理在vLLM的推理管线中属于关键组件,崩溃会导致整个服务实例不可用。