快科技10月30日音尘,今天,昆仑万维官方晓示比特派登录,开源百亿级谎言语模子“天工”Skywork-13B系列,并隐衷地配套开源了600GB、150B Tokens的超大高质地开源汉文数据集。
字据官方先容比特派登录,昆仑万维“天工”Skywork-13B系列包括Skywork-13B-Base、Skywork-13B-Math两大模子及150B Tokens高质地汉文数据集。
其中Skywork-13B-Base模子是Skywork-13B的基础模子比特派登录,其经由3.2万亿个多话语高质地数据闇练,在CEVAL, CMMLU, MMLU, GSM8K等评测与基准测试上齐展现了同等规模模子的最好扫尾。
Skywork-13B-Math模子经过有利的数学智商强化闇练比特派登录,在GSM8K等数据集上获得了同等规模模子的最好扫尾。
本次开源的数据集大小约为600GB,总token数目约为150B比特派登录,是现在开源最大的高质地汉文数据集之一。
此外,昆仑万维还公开了模子中使用的评估措施、数据配比扣问和闇练基础要道调优决策等,助力关于大型模子预闇练的解析,鼓动东谈主工智能通用智能的已毕。
现在开源社区中的汉文大模子无数并非是十足可商用,频频需要进行复杂的商用授权苦求经由,致使设定规章不给以营业授权。
这次Skywork-13B系列大模子将全面盛开商用许可,无需再次苦求授权即可将大模子进行营业用途,匡助更多对汉文大模子感兴味的用户和企业在行业中不断探索和朝上。
附Skywork-13B下载地址:
比特派L ghttps://modelscope.cn/organization/skywork
https://github.com/SkyworkAI/Skywork比特派登录
声明:新浪网独家稿件,未经授权辞让转载。 -->