人民財訊3月31日電,中信證券研報稱,AI從“簡單對話”向“智能體(Agent)”演進,驅動上下文長度激增。據(jù)Epoch AI數(shù)據(jù),最長上下文窗口約每年增長30x,KV Cache顯存容量和上下文長度呈線性增長關系,遠超硬件配置增速。目前大模型廠商、硬件廠商主要通過量化、分層存儲、模型架構優(yōu)化的方式解決存力瓶頸,但仍不改顯存需求爆發(fā)。中信證券認為,顯存優(yōu)化有望降低單Token生成成本,進而刺激用戶開啟更高并發(fā)與更長上下文,總存力需求將不減反增,存力升級為當前Agent推理核心需求,堅定看好存儲成長趨勢。