比特派入账你不错向它发问:ChipNeMo 就会基于这个问题
发布日期:2023-11-29 02:08    点击次数:189

比特派入账你不错向它发问:ChipNeMo 就会基于这个问题

英伟达推出了自家最新 430 亿参数空话语模子 ——ChipNeMo。

关于它的用途,英伟达在官方显露音讯中也詈骂常的明确,剑指 AI 芯片诡计。

具体而言,ChipNeMo 不错匡助职责主说念主员完成与芯片诡计操办的任务,包括回话相关芯片诡计的一般问题、转头 bug 文档,以及为 EDA 用具编写剧本等等。

英伟达首席科学家 Bill Dally 对此示意:

以英伟达 H100 Tensor Core GPU 为例,它由数百亿个晶体管构成,在显微镜下看着就像是一个悉心权术建立的城市一般。

这些晶体管联接在比东说念主类头发丝还细 10000 倍的“街说念”上,需要多个工程团队统一两年多的期间来完成,其间繁琐且高大的职责量,可见一斑。

因此,在英伟达看来,跟着 ChipNeMo 这么空话语模子的问世,统共的职责经过齐将在效果上得以提高。

用 Bill Dally 的话来说:

总体来看,ChipNeMo 大要匡助英伟达里面的芯片诡计师们完成三大方面的职责。

最初便是问答。

ChipNeMo 包含一个原型聊天机器东说念主,它不错回话相关 GPU 架构和诡计的问题,匡助好多工程师在早期测试中快速找到本事文档。

举例,你不错向它发问:

ChipNeMo 就会基于这个问题,给出精确的谜底:

其次是 DEA 剧本生成。

举例只需向 ChipNeMo 用当然话语建议念念要生成代码的条目即可:

仅需静候顿然,带着谨防的代码片断“啪的一下”就生成了。

据了解,英伟达现在还在对代码生成器(如下图所示)进行开拓,它翌日会和现存的用具作念一个集成,好让工程师用起来愈加绵薄。

终末是 Bug 转头和分析。

芯片诡计东说念主员只需要向 ChipNeMo 描摹一下情况即可,举例 prompt 的本色可能包括 Bug 的 ID、Synopsis、Module 和 Description 等等。

此后 ChipNeMo 就会字据 prompt,给出作念好的本事转头和处分转头等。

最初在数据集方面,英伟达主要选拔的 Bug 转头、诡计源(Design Source)、文档以及维基百科、GitHub 等硬件操办的代码和当然话语文本。

再经过一个联接的数据汇聚过程来网罗,最终在清洗和过滤之后,变成了 241 亿个 token。

其次在算法、架构诡计方面,英伟达并莫得告成拿现在已商用、开源的空话语模子来作念部署。

而是主要选拔了这些范围自恰当(Domain-Adapted)本事,包括自界说符号器、范围自恰当捏续预检会、带有范围特定辅导的监督微调(SFT),以及范围自恰当检索模子。

比特派doge

在此设施之下,便提高了空话语模子在工程助理聊天机器东说念主、EDA 剧本生成和 Bug 提要和分析等三个运用中的性能。

齐全涌现,这些范围自恰当本事使得空话语模子的性能卓著通用基础模子;同期模子大小最多可减少 5 倍,且保捏同样或更好的性能。

不外论文作家也坦言:

参考联贯:

告白声明:文内含有的对外跳转联贯(包括不限于超联贯、二维码、口令等神气),用于传递更多信息,从简甄选期间比特派入账,齐全仅供参考,IT之家统共著作均包含本声明。

  声明:新浪网独家稿件,未经授权辞让转载。 -->

热点资讯
相关资讯


Powered by 比特派安全 @2013-2022 RSS地图 HTML地图

Copyright 365建站 © 2013-2023 比特派 版权所有