快科技10月30日音问,今天,昆仑万维官方晓示比特派登录,开源百亿级大谈话模子“天工”Skywork-13B系列,并目生地配套开源了600GB、150B Tokens的超大高质料开源华文数据集。
笔据官方先容比特派登录,昆仑万维“天工”Skywork-13B系列包括Skywork-13B-Base、Skywork-13B-Math两大模子及150B Tokens高质料华文数据集。
其中Skywork-13B-Base模子是Skywork-13B的基础模子比特派登录,其经由3.2万亿个多谈话高质料数据磨真金不怕火,在CEVAL, CMMLU, MMLU, GSM8K等评测与基准测试上齐展现了同等界限模子的最好恶果。
Skywork-13B-Math模子经过挑升的数学才略强化磨真金不怕火比特派登录,在GSM8K等数据集上赢得了同等界限模子的最好恶果。
本次开源的数据集大小约为600GB比特派登录,总token数目约为150B,是当今开源最大的高质料华文数据集之一。
此外比特派登录,昆仑万维还公开了模子中使用的评估设施、数据配比扣问和磨真金不怕火基础才略调优决议等,助力关于大型模子预磨真金不怕火的贯通,鼓动东说念主工智能通用智能的完毕。
当今开源社区中的华文大模子无数并非是透澈可商用,相同需要进行复杂的商用授权央求历程,以致设定收尾不赐与生意授权。
这次Skywork-13B系列大模子将全面洞开商用许可,无需再次央求授权即可将大模子进行生意用途,匡助更多对华文大模子感兴趣的用户和企业在行业中束缚探索和跨越。
附Skywork-13B下载地址:
比特派的网址https://modelscope.cn/organization/skywork
https://github.com/SkyworkAI/Skywork比特派登录
声明:新浪网独家稿件,未经授权辞让转载。 -->