(资料图)
7月8日讯(记者 郭辉)今年生成式AI带火了“存算一体”的概念。当下AI大模型竞相“开花”,但算力的扩展速度却被认为远没有跟上算法的发展。于是,业内将GPU、存算一体、量子计算等方案列为AI算力的三大解药。在本次2023世界人工智能大会上,对算力增长的路径探讨和成果展示,成了一项关注焦点。其中,存算一体被业界认为将撑起AI算力需求下继CPU、GPU之后的算力架构“第三极”。方正证券认为,存算一体作为一种新的计算架构,其核心是将存储与计算完全融合,以新的高效运算架构进行二维和三维矩阵计算,具有更大算力(1000TOPS以上)、更高能效(超过10-100TOPS/W)、降本增效三大优势,能有效克服冯·诺依曼架构瓶颈,实现计算能效的数量级提升。记者关注到,2023WAIC活动和展台上,忆芯科技五款存算一体计算主流机型集体亮相。忆芯科技是一家业务方向覆盖消费级和企业级SSD主控芯片的科技企业,近年在持续投入计算存储融合架构研发。此次展示的忆芯科技DeepSSD边缘计算一体机,采用自研主控芯片,是集合了物联网、人工智能、边缘计算、存储等服务,提供一站式存算一体化、软硬一体化的管理分析计算平台。忆芯科技边缘计算事业部副总裁孙唐在直播间接受记者采访表示,此次大会公司展台的一大亮点,就是公司最新一代的STAR2000可计算的存储控制器。“基于这颗控制器,我们也带来了不同算力、不同形态、适合于不同行业应用的各类边缘计算一体机的产品。”据了解,面向不同应用场景,具体可分为可计算存储机型、高性能嵌入式机型、三防机型、工控机型、高性能服务器机型五款机型,能够应用于水利、电力、能源、铁路、学校、加油站等场景,具备低功耗、低成本、防尘防水等物理隔离、防爆特性。孙唐表示,上述存储控制器本身是一颗PCIe 4.0世代上有顶级性能的存储控制器,其芯片上的AI算力矩阵计算加速和数据库加速应用,帮助他们在实际的智慧化业务应用中,形成了4倍乃至30倍以上功效比的提升。“我们的全国产、高可靠、高保密应用的存储数据底座能力,也帮助我们在一些行业应用中获取了用户的认可。今天早上在展台中,许多参展观众针对这一块跟我们有很深入的讨论。今年AI发展迎来阶跃式技术变革,产业环境急剧变化对公司成长的影响,孙唐认为,AI大模型的出现,带来的不仅是算力需求上的急剧提升,它还在整个动态存储应用当中,带来了20倍以上的存储需求。“在这一块上,肯定对我们是一个很大的商业机会。”AI大模型的训练过程中,对于数据的直接存储有着极强要求。孙唐表示:“使用SSD和GPU进行直通式的数据处理,而不需要再经过CPU的中转,可以说是提升整个AI大模型训练效率、加速其商业落地非常有效的手段。”忆芯科技在可信计算这一远景式的技术需求方面也有着前瞻布局,为其抓住AI产业增长创造了良好条件。据介绍,目前国内正在兴起的隐私计算,或者AI大模型的应用,都涉及到数据主权和数据应用伦理的问题。孙唐表示,忆芯作为国产化的可信计算联盟的存储主任单位,正在联合各家国产化GPU厂商共同协作讨论如何发挥好各自的能力,在生态上把可信计算、可信存储两块业务实现更高效的融合。AI大模型也带来了数据库的蓬勃发展。如今在国外最火的向量数据库,在今年上半年总体上也拿到了超过5亿美金的融资,而忆芯今年的展台上也带来了存算融合对这类向量数据库加速的现场展示。据孙唐介绍,其方案可进行60路以上的视频采集分析,以及每秒百万次以上的检索和比对的能力。“这体现了我们对现在整个AI大模型生态底层加持的能力。”“通过这两年可以看到,存算一体的技术真正地从实验室走向了市场,国内也涌现了一大批基于存算一体技术的新兴公司。”孙唐预计,在不久的将来,存算一体技术将会有更多选择,“从传统的芯片工艺到新的元器件,其实在市场上已经可以看到一些公司在采用新技术来进行一些产品的延展。”孙唐表示,在当前已经遇到的传统计算机架构工艺瓶颈面前,存算一体的架构未来一定有属于它的更广阔应用空间;存算一体的技术特点和优势,也一定会在未来的数字化市场当中占据一席之地。“从小算力的可穿戴设备,到中等算力的边缘计算设备,再到大算力场景下的数据中心的大量业务应用,其实都离不开存算一体相关技术。”孙唐表示,只有通过存算一体的技术,才能把现在整个系统当中应用功能分离所导致的功耗增加、成本上升以及扩展不变的弊端或痛点,给解决掉。“我们会坚定不移地沿着存算一体、存算融合的这个方向走下去,”孙唐表示,“企业级的存储市场已经跨入PCIe 5. 0世代,未来,我们会在算存一体化的新兴芯片架构、新兴的市场应用方面,继续我们的研发探索。