正在阅读:网易伏羲预训练模型“玉言”登顶CLUE分类榜单,成绩首次超过人类水平

网易伏羲预训练模型“玉言”登顶CLUE分类榜单,成绩首次超过人类水平

2023-01-21 10:00:00来源:TechWeb.com.cn 关键词:人工智能网易伏羲阅读量:24245

导读:近日,网易伏羲预训练模型“玉言”成功登顶 CLUE分类任务榜,这是网易伏羲在中文文本预训练领域又一重要里程碑。
  近日,网易伏羲的“玉言”系列模型在CLUE分类任务排行榜中超越其他模型,荣登榜单第一。在CLUE1.1分类任务排行榜(包含AFQMC[文本相似度]、TNEWS[短文本分类]、IFLYTEK[长文本分类]、OCNLI[自然语言推理]、WSC[代词消歧]、CSL[关键词识别]6个理解任务)上首次超过人类水平。
 
  作为中文语言理解领域最具权威性的测评基准之一,CLUE榜单在学术界及工业界有着深远影响。此次「玉言」成功登顶 CLUE分类任务榜,是网易伏羲在中文文本预训练领域又一重要里程碑。值得一提的是,一年前网易伏羲的“玉言”系列模型也曾登顶CLUE推出的中文小样本学习评测榜单FewCLUE。
 
  "玉言“是网易伏羲自主研发的中文文本预训练大模型系列,这次登顶CLUE分类任务榜单的模型参数达到110亿,结构由深层 Encoder 和浅层 Decoder 组成,这种结构可以使得大模型具有优秀理解能力的同时,也有着较为优秀的生成能力。除此之外,Encoder-Decoder结构方便训练任务的设计,不需要复杂的掩码策略。其预训练数据包括网易自有高质量数据、各类百科、新闻、社区问答、wiki、小说等等;网易伏羲对收集到的数据进行去重,清洗,产出了大量高质量数据,并采用这些数据训练模型,使得模型具有良好的泛化性,在各类任务上都有着出色的性能。
 
  网易伏羲在"玉言“模型的训练中,采用多任务训练框架对模型Encoder和Decoder进行训练。为了提升模型的语义表示能力,同时让模型更好的理解不同长度的文本信息,提出了不同的预训练策略来帮助模型学习:
 
  1. 掩码策略:掩码[MASK]将句子中的词进行掩盖,让模型还原被掩盖的词语,提升模型对词语的语义表示能力;
 
  2. Word Shift 策略:通过打乱中文词语里单字的顺序,让模型对其进行还原,从而提升模型对中文词语表达的关注能力,增强对中文词语的敏感性;
 
  3. Short Sentence Reorder 策略:通过打乱出现在句子中的短句,再让模型还原以提升模型对句子语义的理解;
 
  4. Word/Sentence Deleted 策略:删除句子中的单词或整句后再让模型进行还原,以提升模型对不同长度的文本的语义表示能力;
 
  网易伏羲的大规模预训练相关工作由网易高级副总裁、网易雷火事业群总裁胡志鹏牵头主持,并且入选2022年度浙江省科技计划项目--“尖兵”项目。自研模型规模从最早的一亿参数增长至千亿参数,模型领域从文本拓展到图文、音乐、行为序列等多种模态,积累了丰富的预训练模型训练和工程优化的经验。相关技术也已经应用在网易集团内的文字游戏、智能NPC、文本辅助创作、音乐辅助创作、美术设计、互联网搜索推荐等业务场景,并取得了显著的业务效果。
 
  另外,网易伏羲参与了中国人工智能产业发展联盟组织的大规模预训练模型技术的应用评估方法编写,并且在由中国信息通信研究院、人工智能关键技术和应用评测工业和信息化部重点实验室等机构发起的2022可信AI峰会上,网易伏羲的大模型应用「 LOFTER-AI 写文」和「傀儡戏-互动式文字游戏」同时入选“2022大规模预训练模型优秀应用案例”,在大模型技术及AI实践领域获行业认可。
 
  网易伏羲作为国内专业从事游戏与泛娱乐AI研究和应用的顶尖机构,未来会在大规模预训练模型领域持续探索,并结合有灵机器人众包能力,引入“人”的决策及数据闭环,进一步提升大模型的能力。
我要评论
文明上网,理性发言。(您还可以输入200个字符)

所有评论仅代表网友意见,与本站立场无关。

  • 制造业与AI“双向奔赴”成大势,共促中国“智造”升级

    在人工智能浪潮席卷之下,中国制造业正迎来智能化升级的关键机遇期。制造业企业拥抱AI的意愿高涨,实践从试点应用迈向系统布局,例如宝钢利用高炉大模型优化能效、美的集团巨额投入AI研发。
    制造业人工智能智能体
    2025-10-23 17:02:07
  • 德国Neura机器人中国总部落地萧山

    姜永柱代表区委区政府对Neura机器人中国总部的正式启动及远道而来的领导嘉宾表示诚挚祝贺和热烈欢迎。他说,此次Neura机器人中国总部的落户,不仅为萧山具身智能产业注入了强劲动能和智能基因,更将带动上下游产业链集聚发展,助力萧山打造具有国际影响力的智能机器人产业高地。
    人形机器人人工智能
    2025-10-23 09:57:32
  • 未来将由“光”书写:光纤成为人工智能经济的核心支柱

    研究显示,到2030年,全球人工智能应用可能需要超过1亿英里的长途光纤和数千万英里的城域光纤。随着数据量的快速增长——预计从2020年的约64ZB增长到2030年的200ZB以上——超大规模企业正在进行创纪录的资本投入,以满足日益增长的计算和网络需求。
    光纤人工智能
    2025-10-23 09:01:55
  • 人工智能在制造业的新浪潮

    调查数据显示,95%的制造企业已经在AI/ML领域投入或计划在未来五年内进行投资。这一比例表明,人工智能应用在制造业中已趋于普及,并正由“试点探索”向“系统化整合”转变。
    人工智能AI赋能智能制造
    2025-10-21 09:25:54
  • OpenAI联合创始人:人工智能代理真正发挥作用还需10年

    OpenAI联合创始人预估,要系统解决上述所有问题,大约还需要十年时间。尽管众多投资者将2025年称为“智能体之年”,但现实发展仍面临显著挑战。广义上,AI智能体被定义为能够自主执行任务的虚拟助手,具备问题拆解、方案规划与自主实施的能力。
    OpenAI人工智能
    2025-10-20 10:58:05
  • 人工智能和物联网如何协作以实现更智能的技术

    人工智能与物联网的融合代表着科技发展的新方向。物联网通过分布在各处的传感器、设备和网络基础设施,持续生成海量的实时数据。而人工智能则通过机器学习与深度学习算法,对这些数据进行分析、建模与优化。
    人工智能物联网
    2025-10-20 10:57:54
版权与免责声明:

凡本站注明“来源:智能制造网”的所有作品,均为浙江兴旺宝明通网络有限公司-智能制造网合法拥有版权或有权使用的作品,未经本站授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:智能制造网”。违反上述声明者,本站将追究其相关法律责任。

本站转载并注明自其它来源(非智能制造网)的作品,目的在于传递更多信息,并不代表本站赞同其观点或和对其真实性负责,不承担此类作品侵权行为的直接责任及连带责任。如其他媒体、平台或个人从本站转载时,必须保留本站注明的作品第一来源,并自负版权等法律责任。如擅自篡改为“稿件来源:智能制造网”,本站将依法追究责任。

鉴于本站稿件来源广泛、数量较多,如涉及作品内容、版权等问题,请与本站联系并提供相关证明材料:联系电话:0571-89719789;邮箱:1271141964@qq.com。

不想错过行业资讯?

订阅 智能制造网APP

一键筛选来订阅

信息更丰富

推荐产品/PRODUCT 更多
智造商城:

PLC工控机嵌入式系统工业以太网工业软件金属加工机械包装机械工程机械仓储物流环保设备化工设备分析仪器工业机器人3D打印设备生物识别传感器电机电线电缆输配电设备电子元器件更多

我要投稿
  • 投稿请发送邮件至:(邮件标题请备注“投稿”)1271141964.qq.com
  • 联系电话0571-89719789
工业4.0时代智能制造领域“互联网+”服务平台
智能制造网APP

功能丰富 实时交流

智能制造网小程序

订阅获取更多服务

微信公众号

关注我们

抖音

智能制造网

抖音号:gkzhan

打开抖音 搜索页扫一扫

视频号

智能制造网

公众号:智能制造网

打开微信扫码关注视频号

快手

智能制造网

快手ID:gkzhan2006

打开快手 扫一扫关注
意见反馈
我要投稿
我知道了