根据中国电子报报道,开源软件解决方案供应商红帽召开线下交流会。美国红帽公司全球副总裁兼大中华区总裁曹衡康表示,AI开源能帮助开发者实现任意模型、加速器(GPU)、云环境下的自由部署。

曹衡康强调:“开源是红帽AI的特色,其次是小模型和降低成本,DeepSeek发布时所强调的价值主张与我们不谋而合。”他认为,未来AI将向着开源方向发展,而红帽将成为驱动这一目标实现的重要引擎。开源生态的优势在于更加透明、安全,并且可移动,能广泛支持各类硬件,兼容各类模型,帮助开发者实现任意模型、任意加速器(GPU)、任意云环境下的自由部署。
在模型方面,曹衡康认为,推理能力是模型的关键要素。红帽大中华区方案架构部总经理王慧慧表示:“2025年是AI的推理元年。AI进入推理阶段,意味着所有的AI应用正式开始上线运行,并且为企业带来业务收入和内部成本控制等真正的收益。”她指出,来自中国的贡献者在vLLM社区的贡献量已占到35%,展现了中国市场对推理技术的重视及其未来的发展潜力。
目前,推理技术的发展面临两大难题:一是如何用的硬件设备和少的成本完成性能的推理;二是如何做出分布式的推理引擎,将推理的工作量分散到不同的服务器上。红帽基于vLLM架构搭建的AI推理服务器——RHEL AI,为这两个问题的解决提供了参考路径。据了解,RHEL AI能够向上支撑Qwen、DeepSeek、Llama等众多开源模型,向下兼容NCVIDIA、Google、英特尔等主流GPU。它还能在单台服务器、扩展型服务器集群、私有云或边缘设备等多种环境运行。
同时,借助vLLM的分布式推理,结合Kubernetes架构,红帽还推出了开源项目llm-d,能够利用生成式AI推理技术,支持企业内部的大规模推理,帮助企业实现不同部门内部的私密推理。
在本次媒体交流会上,曹衡康还公开了红帽2025年面向中国市场的三条发展策略,其中两条与AI紧密相关。一是成立企业级AI+委员会,打造AI生态发展引擎;二是打造AI原生的全栈开源方案,助力企业降本增效。