元象XVERSE公司近日宣布,他们将开源一个650亿参数的高性能通用大模型——XVERSE-65B,并将其无条件免费商用,这一举动引起了业界的广泛关注。
元象XVERSE公司表示,他们希望通过这一行动,推动国产大模型开源生态的繁荣和产业应用的快速发展。他们相信,这将使海量中小企业、研究者和AI开发者更早一步实现“大模型自由”,根据其算力、资源限制和具体任务需求,自由使用、修改或蒸馏元象大模型,推动研究与应用的突破创新。
元象XVERSE公司的创始人姚星表示:“面对研发时间紧、算力持续短缺等挑战,团队依靠丰富经验,三个月内研发出多款高性能7B、13B模型,并最早为社区献上一个‘大有可为’的65B模型,为研究、商业及生态创造三重价值。”
据了解,XVERSE-65B底座模型在2.6万亿Tokens的高质量数据上从头训练,上下文窗口扩展至16K,支持中、英、俄、法等40多种语言。而XVERSE-65B Chat版也将在近期发布。
元象XVERSE公司坚持“高性能”定位,通过多项技术创新,显著提升了65B的基础能力、工具调用能力和代码解释能力。同时,他们还通过一些措施缓解了7B、13B中常见且可能很严重的幻觉问题,提高了模型的准确性和专业度。
为了确保业界能对元象大模型性能有全面、客观、长期的认知,研究人员参考了一系列权威学术测评,制定了涵盖问答、理解、知识、推理、数学、代码等六个维度的11项主流权威测评标准,将持续使用并迭代。
在与国外标杆对比测评中,XVERSE-65B部分指标超越、综合性能媲美GPT3.5;全面超越开源标杆 Llama2-70B 和Falcon-180B ;与GPT4仍有差距。尽管如此,XVERSE-65B的表现仍然非常出色,显示出元象大模型在技术上的领先地位。
元象大模型可在Github、Hugging Face、魔搭ModelScope等多平台搜索“XVERSE”下载,简单登记后即可无条件免费商用。元象公司表示,他们将为中小企业、科研机构和个人开发者提供全方位技术服务,帮助他们将大模型应用于智能客服、创意写作、精准推荐等多场景,打造出行业领先的用户体验。
姚星表示:“真实世界的感知智能(3D),与真实世界的认知智能(AI),是探索通用人工智能(AGI)的必由之路,也是元象持续探索前沿科技的动力。XVERSE开源系列致力于推动大模型国产可替代与持续技术创新,为实体经济、数字经济发展注入强劲动力。我们期待与企业和开发者携手,共同开启大模型应用新时代!”
这一开源大模型的推出,无疑将为AI领域带来新的发展机遇。元象XVERSE公司的这一行动不仅展现了他们的技术实力和创新能力,也体现了他们对推动AI领域发展的责任感和使命感。未来,随着更多企业和开发者加入到这个领域中来,AI技术的进步和应用将会更加迅速和广泛。