大模子时期，国产GPU面临哪些挑战-苦口婆心网

大模子时期，国产GPU面临哪些挑战

[焦点] 时间：2024-05-05 01:51:57 来源：苦口婆心网作者：娱乐点击：39次

电子发烧友网报道（文/李弯弯）随着家养智能技术的大模快捷睁开，对于GPU合计能耐的时期需要也越来越高。国内企业也正在不断提升GPU功能，国产以知足日益削减的临挑运用需要。可是大模，相较于国内巨头，时期国内GPU依然存在差距，国产国产GPU在不断妨碍的临挑历程中也存在诸多挑战。

在大模子磨炼上存在差距

狂语言模子是大模基于深度学习的技术。这些模子经由在海量文本数据上的时期磨炼，学习语言的国产语法、语境以及语义等多条理的临挑信息，用于清晰以及天生做作语言文本。大模狂语言模子是时期做作语言处置（NLP）规模中的一个紧张分支，运用于文本天生、国产分类、激情合成等多种使命。

深度学习是今世机械学习规模的一种强盛的算法，它可能在图像识别、语音识别、做作语言处置、游戏AI等种种运用规模取患上惊人的下场。可是，深度学习对于合计多少硬件的要求颇为高，个别需要运用GPU妨碍大规模磨炼。在运用GPU妨碍深度学习时，一个罕有的下场便是抉择单精度仍是双精度。

浮点数是一种用于浮事实数的数值格式，它搜罗标志位、指数位以及尾数位三部份。经由这三部份，浮点数可能展现颇为大或者颇为小的数，同时坚持确定的精度。

单精度以及双精度是指浮点数在合计机中的存储方式以及精度。单精度个别运用32位（4字节）来存储一个浮点数，而双精度则运用64位（8字节）来存储。由于双精度运用了更多的位数，因此它可能展现更大规模的数值，并具备更高的精度。

大模子磨炼需要处置高颗粒度的信息，因此对于用于大模子磨炼的GPU芯片措信托息的详尽度以及算力速率要求更高，现阶段，国产GPU在反对于大模子磨炼的能耐方面相对于来说还较差。

差距于多媒体以及图形处置的单精度浮点合计（FP32）合计需要，双精度浮点合计能耐FP64是妨碍高算力合计的硬性目的。英伟达的A100同时具备上述两类能耐，而国内大多GPU只能处置单精度浮点合计。

从当初的信息来看，海光信息的协处置器（DCU）可能反对于FP64双精度浮点运算，海光DCU属于GPGPU 的一种，接管“类CUDA”通用并行合计架构。据该公司介绍，其DCU产物可能残缺反对于大模子磨炼。不外比照于英伟达的A100功能惟独其60%。

此外，景嘉微展现面向AI 磨炼、AI推理、迷信合计等运用规模研发乐成的景宏系列，反对于INT八、FP1六、FP3二、FP64等混合精度运算，该产物在大模子的磨炼上概况也可能期待一下。

在软件以及生态方面存在差距

除了上述情景之外，国产GPU在软件以及生态方面与全天下争先品牌比照，也存在确定的差距。软件工具链的美满度方面，全天下争先的GPU厂商已经构建了残缺的软件工具链，搜罗编译器、调试器、功能合成工具等，可能利便地反对于开拓职员妨碍GPU挨次的开拓、调试以及优化。而国产GPU在这方面还需要进一步美满，以知足用户的多样化需要。

生态零星的成熟度方面，全天下GPU市场已经组成为了较为成熟的生态零星，涵盖了种种运用规模以及场景。可是，国产GPU在生态零星建树方面尚处于起步阶段，缺少饶富的运用反对于以及市场招供。这导致国产GPU在市场上的相助力相对于较弱，难以与全天下争先品牌坚持。

近些年可能清晰的看到，国产PGU企业也正在这些方面不断自动。在软件反对于方面，国产GPU企业正在自动与主流操作零星、开拓情景以及图形处置软件等妨碍适配，确保用户可能流利地运用种种运用软件。同时，一些企业还在增长GPU在家养智能、云合计等新兴规模的运用，为国产GPU生态注入新的去世气愿望。

在驱动挨次优化方面，国产GPU企业也在加大投入力度，不断提升驱动挨次的功能以及晃动性。经由优化驱动挨次，可能短缺发挥GPU的功能优势，提升部份合计功能。

此外，国产GPU企业还在自动探究与种种运用途景的深度融会。好比，在游戏、图形妄想、视频渲染等规模，国产GPU正在与相关企业相助，配合增长相关运用的睁开。这种深度融会不光要助于提升国产GPU的市场相助力，也有助于增长全部财富的后退。

写在最后

近些年国产GPU正在发达睁开，不皮毛较于国内巨头，依然存在较大差距。近些年来，大模子快捷睁开，国产GPU在大模子磨炼方面的缺少也凸显进去。不外也可能看到，当初国产GPU企业都在自动朝大模子倾向妄想，搜罗磨炼以及推理。此外软件以及生态建树也在减速增长。

(责任编辑：综合)

耳温枪？耳温枪的优缺陷吉林长岭市场监管部份为“名优特”小作坊授牌