CVE-2026-44222vLLM是一个大型语言模型推理引擎。在0.6.1至0.20.0之前的版本中,其多模态处理模块存在Token注入漏洞。攻击者无需认证,可通过发送包含特殊Token的纯文本提示词,欺骗系统将其解释为控制指令。此外,如果提供的图像或视频占位符缺少匹配数据,会导致系统在计算输入位置时索引空网格,触发未处理的IndexError异常,从而导致工作进程终止或服务可用性降级。
该漏洞源于vLLM在处理多模态输入时对Token验证的不严格。在受影响版本中,系统错误地将文本中拼写的特殊Token当作控制指令处理,导致Token注入。利用原理在于,攻击者构造恶意的HTTP请求,向vLLM服务端发送精心设计的文本提示词。当系统中包含未匹配数据的图像或视频占位符序列时,vLLM在调用`image_grid_thw`或`video_grid_thw`进行输入位置计算时,尝试访问空的数据网格。由于代码缺乏对数组越界的检查,引发了`IndexError`异常。由于该异常未被捕获,导致Worker进程崩溃,从而实现拒绝服务攻击。攻击者无需用户交互,仅需网络访问权限即可利用此漏洞。