端侧AI卷疯了,海光DCU这次没掉队
说真的,过去一年大家聊大模型,总爱比谁参数大、谁算力猛。但最近风向明显变了,端侧AI才是真战场。腾讯混元开源的Hy-MT2翻译模型,1.8B版本塞进手机芯片,440MB存储空间,本地推理速度还提升了1.5倍。这不就是开发者梦寐以求的小钢炮吗?
但问题来了,模型再轻量化,总得有个算力底座吧?总不能全靠海外GPU。这时候海光DCU站出来说“我适配好了”,而且不是头一回。之前混元Hy3 preview、智谱的对话模型、商汤的视觉模型,海光DCU都陆续跟上了。这次针对Hy-MT2,直接打通DAS/DTK软件栈,vLLM、SGLang这些热门推理框架全支持,开发者不用改底层代码就能跑起来。
说白了,国产算力以前总被诟病硬件还行,软件难用。但现在看海光这套组合拳,明显是要先把主流模型适配全,再优化开箱即用体验。尤其是端侧趋势下,轻量化模型对算力效率要求极高,海光DCU能快速响应,说明他们真的听懂了行业需求。下次再聊国产替代,别只盯着训练,推理和端侧才是更接地气的突破口。
海光信息 大模型
