快科技10月30日讯息,今天比特派不开源,昆仑万维官方晓示,开源百亿级大言语模子“天工”Skywork-13B系列,并荒原地配套开源了600GB、150B Tokens的超大高质料开源中语数据集。
凭据官方先容,昆仑万维“天工”Skywork-13B系列包括Skywork-13B-Base、Skywork-13B-Math两大模子及150B Tokens高质料中语数据集。
其中Skywork-13B-Base模子是Skywork-13B的基础模子,其经由3.2万亿个多言语高质料数据测验比特派不开源,在CEVAL, CMMLU, MMLU, GSM8K等评测与基准测试上齐展现了同等规模模子的最好成果。
Skywork-13B-Math模子经过挑升的数学才调强化测验,在GSM8K等数据集上获取了同等规模模子的最好成果。
本次开源的数据集大小约为600GB,总token数目约为150B比特派不开源,是现在开源最大的高质料中语数据集之一。
此外,昆仑万维还公开了模子中使用的评估顺次、数据配比照顾和测验基础要道调优有筹商等,助力关于大型模子预测验的瓦解,激动东说念主工智能通用智能的杀青。
比特派余额现在开源社区中的中语大模子大齐并非是全齐可商用比特派不开源,不息需要进行复杂的商用授权央求经过,致使设定法例不给以生意授权。
这次Skywork-13B系列大模子将全面怒放商用许可,无需再次央求授权即可将大模子进行生意用途,匡助更多对中语大模子感意思意思的用户和企业在行业中束缚探索和跨越。
附Skywork-13B下载地址:
https://modelscope.cn/organization/skywork
https://github.com/SkyworkAI/Skywork比特派不开源
声明:新浪网独家稿件,未经授权防碍转载。 -->