快科技10月30日音书,今天,昆仑万维官方文告,开源百亿级大讲话模子“天工”Skywork-13B系列比特派登录,并萧索地配套开源了600GB、150B Tokens的超大高质地开源中语数据集。
比特派和im钱包把柄官方先容,昆仑万维“天工”Skywork-13B系列包括Skywork-13B-Base、Skywork-13B-Math两大模子及150B Tokens高质地中语数据集。
其中Skywork-13B-Base模子是Skywork-13B的基础模子比特派登录,其经由3.2万亿个多讲话高质地数据训导,在CEVAL, CMMLU, MMLU, GSM8K等评测与基准测试上齐展现了同等界限模子的最好后果。
Skywork-13B-Math模子经过专诚的数学材干强化训导,在GSM8K等数据集上获得了同等界限模子的最好后果。
本次开源的数据集大小约为600GB比特派登录,总token数目约为150B,是现在开源最大的高质地中语数据集之一。
此外,昆仑万维还公开了模子中使用的评估措施、数据配比盘考和训导基础面貌调优决策等,助力关于大型模子预训导的证明,鼓动东谈主工智能通用智能的完好意思。
现在开源社区中的中语大模子无数并非是透顶可商用比特派登录,常常需要进行复杂的商用授权央求进程,甚而设定收尾不予以贸易授权。
这次Skywork-13B系列大模子将全面通达商用许可,无需再次央求授权即可将大模子进行贸易用途,匡助更多对中语大模子感兴致的用户和企业在行业中不断探索和杰出。
附Skywork-13B下载地址:
https://modelscope.cn/organization/skywork
https://github.com/SkyworkAI/Skywork比特派登录
声明:新浪网独家稿件,未经授权谢却转载。 -->