CVE-2026-34756vLLM是一个用于大语言模型的推理和服务引擎。在0.1.0至0.19.0之前的版本中,其OpenAI兼容API服务器存在一处拒绝服务漏洞。该漏洞源于ChatCompletionRequest和CompletionRequest Pydantic模型中未对n参数设置上限验证。未经过身份验证的攻击者可发送包含超大n值的HTTP请求。这将导致Python asyncio事件循环被完全阻塞,并通过在堆中分配数百万个请求对象副本引发立即的内存耗尽崩溃,导致服务不可用。该问题已在0.19.0版本中修复。
该漏洞的根因在于vLLM在处理API请求时,未对请求参数中的`n`值进行合理的边界检查。由于Pydantic模型缺乏约束,攻击者可以传入一个极大的整数。当服务器尝试处理该请求时,基于该参数的逻辑会在Python的异步事件循环中执行。由于操作量级巨大,这直接阻塞了单线程的事件循环,导致无法处理其他连接。同时,瞬间分配的数百万个对象会迅速耗尽系统堆内存,触发OOM Killer强制终止进程。这种攻击方式利用了资源耗尽原理,无需复杂交互即可实现DoS。