国产130亿参数大模型免费商用！性能超Llama2-13B，支持8k上下文，哈工大已用上

来源:商业新知网发布时间:2023-08-08 12:46:22

国产大模型，再次迎来新玩家！

(相关资料图)

XVERSE-13B，开源即免费商用。

来自前腾讯副总裁、腾讯AI lab创始人姚星创立的明星独角兽元象，公司成立一年即完成1.2亿美元融资。

此次开源的大模型，它支持40多种语言、8192上下文长度。在多项中英文测评中，性能超过了同尺寸（130亿参数）的LIama2、Baichuan等。

目前，哈尔滨工业大学已经率先用上。

国产百亿大模型免费商用

据介绍，XVERSE-13B大模型主要有这几个方面的特点。

模型架构方面，它是基于标准Transformer架构（Decoder-only），支持8K上下文长度，据称这也是目前同尺寸标准模型中最长。这样一来，可满足更多轮对话，减少遗忘现象，以及输入更多内容完成复杂任务。

训练数据上，构建了1.4万亿tokens的数据集，包含中、英、俄、西等40多种语言。

而为了充分利用训练数据，他们在分词策略上，基于BPE（Byte-Pair Encoding）算法，使用上百 GB 语料训练了一个词表大小为 100,278 的分词器。

这样一来，能够同时支持多语言，而无需额外扩展词表。

此外，还在训练框架上进行了算子、通信、并行策略及调度等方面的优化，包括高效算子、显存优化、并行调度策略、数据-计算-通信重叠、平台和框架协同等自研技术，使得千卡集群上的峰值算力利用率达到 58.5%，据介绍位居业界前列。

作为通用大模型，它支持文本生成、自动化写作、数据分析、知识问答、多语言翻译、个性化交互、人物角色扮演、专业小助手等功能。

具体到各项能力测评上，他们选取了 MMLU（英文）、 C-Eval（中文）、AGIEval（中英）、GAOKAO-Bench（中英）、GAOKAO-English（英文）等在内的评测集。

比如在MMLU测评中，其综合评分达到55.1分，在多个维度超过了同参数规模的主流模型。

（MMLU 由加州大学伯克利分校等高校共同打造，集合了科学、工程、数学、人文、社会科学等领域的 57 个科目，主要目标是对模型的英文跨学科专业能力进行深入测评。其内容涵盖从初级水平到高级专业水平）

还有在C-Eval、AGIEval和GAOKAO-Bench等中文测评中，分别以54.7、41.4以及53.9分超越了其他模型。

目前，XVERSE-13B代码采用 Apache-2.0 协议，向学术研究完全开源，企业只需简单登记，即可免费商用。

哈工大已经率先使用大模型推进相关研究工作。哈工大计算机科学与技术学院张伟男教授表示：

开源是互联网时代主流模式，不仅能贡献社区，推动技术持续创新，还能利用协同解决算法透明性、稳定性、公众信任度等共性问题。

来自元象XVERSE团队

随着XVERSE-13B的发布，国产大模型迎来了新玩家：

元象XVERSE，2021年3月成立，专注于AI与元宇宙技术服务。

创始团队来自腾讯游戏、Adobe、微软、IBM、麦肯锡等公司。创始人是前腾讯副总裁姚星，他曾亲手创立了腾讯AI lab以及机器人实验室Robotics X，并兼管腾讯技术工程事业群（TEG）多个技术部门。

他也是腾讯在受AlphaGo震动决定战略布局AI时的一号位负责人，代表腾讯全球挖人组队，也代表腾讯喊出了口号：AI in All。在此期间曾主导推出了绝艺、绝悟、云深智药等行业代表性产品和应用，张潼张正友都曾向他汇报。

2022年3月，元象完成A与A+轮融资1.2亿美元，投资机构包括腾讯、高榕资本、五源资本、高瓴创投、红杉中国、淡马锡和CPE源峰等。

在3D和AI技术领域，已自主研发出行业领先的“端云协同” 3D互动技术，主打零门槛、一站式、高品质的元宇宙体验。

目前客户包括澳门大三巴、腾讯音乐、央视、一汽大众、阿迪达斯、邮储银行等企业。

标签：

国产130亿参数大模型免费商用！性能超Llama2-13B，支持8k上下文，哈工大已用上

国产百亿大模型免费商用

来自元象XVERSE团队

国产130亿参数大模型免费商用！性能超Llama2-13B，支持8k上下文，哈工大已用上

我国夏粮购销两旺：主产区已完成预计旺季收购量六成左右

友邦传世盈佳终身寿险(分红型)怎么样？10年交保终身收益有多少？

义乌科迪办公（义乌市科迪宠物用品有限公司简介）

海融科技8月8日快速上涨

太平洋长相伴精英版2.0介绍？

阿贾克斯23/24赛季客场球衣印号壁纸Desig...

张掖甘州区：重大项目建设为高质量发展注入强劲动能

怎么界定大中型企业（大中型企业的定义是什么简介介绍）

房企销售连续两月大幅下降，继续探底

券商首份半年报出炉 多家上市券商业绩回暖

兵马俑坑旁游客打架，警方通报

太钢不锈（000825）：8月7日北向资金减持44.2万股

什么是负面影响?怎么能证明呢?（负面影响是什么意思）

师清漪名字出处 师清漪

未名医药：近三年销售费用率超80%，公司已建立内部控制制度保障｜医药合规进行时⑩

奇闻：男子吃白饭配咸菜，坚持20年存款9300万，只想提前退休

券商观点|农林牧渔行业周观点（2023年第31周）：猪价快涨趋势或难持续，建议关注极端天气对种植影响

河北大、中型水库总蓄水量超常年同期22.12亿立方米

蒙牛发布 AI 模型 MENGNIU.GPT，宣称“通过营养健康认证考试”

蓝莓是碱性水果还是酸性水果?

最正宗的糖醋排骨做法窍门（最正宗的糖醋排骨做法）

开创国际: 开创国际2023年第一次临时股东大会决议公告

俄罗斯萨哈共和国森林火灾过火面积已超12.5万公顷

8月9日亮相 凯雷德ESCALADE IQ预告图

北京房山东关上村：山洪让61岁的老支书头一次觉得山路变得陌生

西安发布暴雨红色预警 长安鄠邑降水量将达100毫米以上

暂停前募资项目 诺思兰德下调定增募资近2000万

西安至西藏旅游团报价？

一千多种睡莲荷花亮相青岛第三届荷花节

国产130亿参数大模型免费商用！性能超Llama2-13B，支持8k上下文，哈工大已用上

国产大模型，再次迎来新玩家。

我国夏粮购销两旺：主产区已完成预计旺季收购量六成左右

主产区已完成预计旺季收购量六成左右—— 我国夏粮购销两旺受连续

友邦传世盈佳终身寿险(分红型)怎么样？10年交保终身收益有多少？

友邦传世盈佳终身寿险(分红型)怎么样？10年交保终身收益有多少？友邦人

义乌科迪办公（义乌市科迪宠物用品有限公司简介）

HELLO，我是智能手机网小溪，我来为大家解答以上问题。义乌科迪办公，

海融科技8月8日快速上涨

以下是海融科技在北京时间8月8日10:31分盘口异动快照：8月8日，海融科

券商首份半年报出炉多家上市券商业绩回暖

师清漪名字出处师清漪

8月9日亮相凯雷德ESCALADE IQ预告图

西安发布暴雨红色预警长安鄠邑降水量将达100毫米以上

暂停前募资项目诺思兰德下调定增募资近2000万