华为徐直军:不是每个企业都要建设大规模AI算力

在今日(9月19日)举行的2024年华为全联接大会上,华为副董事长、轮值董事长徐直军发表了题为“拥抱全面智能化时代”的主题演讲。会上,徐直军回顾了华为自2018年以来在人工智能领域的发展历程,并提出了全面智能化战略,同时也分享了对智能化的观察和思考。

徐直军 图片来源:企业供图

徐直军认为,智能化将是一个长期过程,而算力是智能化的关键基础。“智能化的可持续,首先是算力的可持续。而算力是依赖半导体工艺的,但我们必须要面对一个现实,那就是,美国在AI芯片领域对中国的制裁长期不会取消⋯⋯人工智能正在成为主导性算力需求,促使计算系统正在发生结构性变化,需要的是系统算力,而不仅仅是单处理器的算力。这些结构性变化,为我们通过架构性创新,开创出一条自主可持续的计算产业发展道路,提供了机遇。”

对此,徐直军给出的解决方案是:“充分抓住人工智能变革机遇,基于实际可获得的芯片制造工艺,计算、存储和网络技术协同创新,开创计算架构,打造‘超节点+集群’系统算力解决方案,长期持续满足算力需求。”

此外,徐直军也谈到了近年来蓬勃发展的大模型。在他看来,不是每个企业都要建设大规模AI算力,也不是每个企业都要训练自己的基础大模型。“AI服务器,特别是AI算力集群不同于通用x86服务器,对供电、散热等数据中心机房环境要求极高,且随着大模型越来越大,AI算力也将走向更大规模,而且变化节奏快,AI服务器快速升级换代,数据中心机房面临要么浪费、要么满足不了需求的困境⋯⋯训练出基础大模型,关键是数据,而准备足够多的高质量数据是很大挑战,基础大模型预训练数据量进入10万亿tokens量级,这对于企业来说,不仅意味着高成本,同时是否能获取到足够的数据量也是挑战。”

他还进一步表示:“不是所有的应用都要追求‘大’模型。从华为盘古在行业的实践看,十亿参数模型可以满足科学计算、预测决策等业务场景的需求,比如降雨预测、药物分子优化、工艺参数预测,在PC(个人电脑)、手机等端侧设备上,十亿参数模型也有广泛应用;而百亿参数模型可以满足面向NLP(自然语言处理)、CV(计算机视觉)、多模态等大量特定领域场景的需求,比如知识问答、代码生成、安全检测。面向NLP、多模态的复杂任务,可以用千亿参数模型来完成。”

“企业需要的是根据自身不同业务场景需求,选择最合适的模型,通过多模型组合,解决问题,创造价值。”徐直军说道。

在终端AI方面,虽然当前各种终端引入AI能力已经成为普遍的趋势,但徐直军认为,终端AI应以体验为中心,而不是以算力为中心。基于这一理念,华为与清华大学人工智能产业研究院共同提出AI终端智能化L1到L5分级标准,以消费者体验为牵引,量化用户的智能体验。

免责声明:本文章由会员“极目新闻”发布如果文章侵权,请联系我们处理,本站仅提供信息存储空间服务如因作品内容、版权和其他问题请于本站联系

- -