超越快手腾讯!度小满NLP模型登顶CLUE榜首

news/2024/7/8 6:32:53

241fefac93582a15bb4a52d91c34176e.png


  视学算法报道  

编辑:桃子 好困

【新智元导读】要说自然语言处理最厉害的兵器,非「轩辕」剑莫属。近日,度小满金融AI-Lab研发的轩辕 (XuanYuan) 预训练模型刷榜CLUE,距离人类「表现」仅差3.38分!

自然语言处理是人工智能皇冠上的明珠,近日,度小满金融AI-Lab让人类摘得明珠的步伐又前进了一步。

据中文语言理解领域的权威测评基准官网公布,度小满金融AI-Lab研发的轩辕 (XuanYuan) 预训练模型在CLUE1.1分类任务中「力压群雄」获得了排名第一的好成绩。距离人类「表现」仅差3.38分!

777ba9bad066869553c8817abee0fb30.png

CLUE是中文语言理解领域最具权威性的测评基准之一,涵盖了文本相似度、分类、阅读理解共10项语义分析和理解类子任务。

其中,分类任务需要解决6个问题,例如传统图像分类,文本匹配,关键词分类等等,能够全方面衡量模型性能。

该榜单竞争激烈,几乎是业内兵家必争之地,例如快手搜索、优图实验室 & 腾讯云等等研究机构也都提交了比赛方案。

据悉,位居榜首的「轩辕」是基于Transformer架构的预训练语言模型,涵盖了金融、新闻、百科、网页等多领域大规模数据。因此,该模型「内含」的数据更全面,更丰富,面向的领域更加广泛。

ed2d1da211764a0184ea6c0fc724f0ba.png

传统预训练模型采取「训练-反馈」模式,度小满金融AI-Lab在训练「轩辕」的时候细化了这一过程,引入了任务相关的数据,融合不同粒度不同层级的交互信息,从而改进了传统训练模式。

模型设计思路有两点:

1.宏观角度,先从通用大规模的数据逐渐迁移到小规模的特定业务以及特定任务,然后去通过不同的阶段逐渐训练,直到满足目标任务。

2.微观角度,针对不同的下游分类任务,会相应的设计出定制化的分类模型。然后采用自监督学习、迁移学习等等提升模型的性能。

目前,「轩辕」还处于1.0的版本,更侧重于自然语言理解能力,在接下来的2.0版本中,研发人员会采用更大规模的数据,训练出更加通用的预训练模型,从而赋能更多的业务和领域。

度小满为何「看中」预训练模型?

预训练模型是一种迁移学习的应用,可以利用几乎无限的文本,学习输入句子的每一个成员的上下文相关的表示,它隐式地学习到了通用的语法语义知识。

换句话说,预训练模型把通用人类的语言知识先学会,然后再代入到某个具体任务。它可以将从开放领域学到的知识迁移到下游任务,以改善低资源任务;还可以使自然语言处理由原来的手工调参、依靠ML专家的阶段,进入到可以大规模、可复制的大工业施展的阶段。

不止是融合人类知识,预训练模型的「改善」、「大规模」、「可复制」等关键词背后意味着降成本、提效率。这和度小满金融CEO朱光「用科技服务小微企业是金融科技公司的价值和使命」的理念不谋而合。

今年5月21日,在度小满金融成立三周年之际,度小满金融CEO朱光表示,「未来三年,度小满将继续加大人工智能技术的研发投入,聚焦小微客户,持续降低小微企业主的整体融资成本,为3000万小微企业主提供值得信赖的综合金融服务。」

目前,除了预训练,度小满金融AI-Lab在文本分类、信息抽取和技术资源等方向亦有布局。在战略上会有两点侧重:首先加强自身的数据生态建设,合法合规使用用户数据,解决数据孤岛;其次通过产学研相结合,布局前沿技术,落地金融场景业务。

目前,度小满与北京大学光华管理学院成立了「金融科技联合实验室」,和西安交大成立了「西安交通大学-度小满金融人工智能联合研究中心」,并与中国科学院自动化研究所共建博士后工作站,共同开展人工智能及相关领域的博士后联合招收培养。

度小满研发人员一直相信人工智能技术势必会变革金融领域的已有研究范式。因此,连接理论前沿研究与业界的技术应用研究,推动人工智能技术在金融产业中发挥更大价值,会是度小满一直的追求。

e0980c2d908daefec60e6dcbbb45d3e5.png

outside_default.png

点个在看 paper不断!


http://lihuaxi.xjx100.cn/news/262655.html

相关文章

Java技术体系平台

实际上Java2就是java 1.2,因为相较于1.1改动比较大,所以就叫java2了。 然而我们现在很少说Java2,现在都直接称为Java。也就是Java语言。 Java2平台包括:标准版(J2SE)、企业版(J2EE)和微缩版(J2ME&#xf…

微软职位内部推荐-Sr. Dev Lead

微软近期Open的职位:JD如果你想试试这个职位,请跟我联系,我是微软的员工,可以做内部推荐。发你的中英文简历到我的邮箱:Nicholas.lu.mail(at)gmail.com转载于:https://www.cnblogs.com/DotNetNuke/p/3885283.html

MySQL太细碎了,我硬生生捋出了一条核心大主线!

前两天看到字节一个老哥写的帖子,提到高阶开发者必须掌握的技能,其中他明确提出了“精通MySQL”。为啥MySQL对开发人员如此重要?第一,不管你去面试哪家公司,数据库是必问项,而MySQL使用范围广,无…

Flask处理响应

处理响应 需求 如何在不同的场景里返回不同的响应信息&#xff1f; 1 返回模板 使用render_template方法渲染模板并返回 例如&#xff0c;新建一个模板index.html <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"…

ubuntu fctix

感觉ubuntu自在大ibus输入法用起来实在是灰常蛋痛啊&#xff0c;于是乎就换了fcitx输入法&#xff08;很多人推荐嘛&#xff09;在安装之前先说一下fcitx输入法吧。1.添加fcitx源(官方的源是旧版,不推荐使用)fcitx的ppa源&#xff0c;内含fcitx和fcitx-config,使用命令sudo ged…

《数据竞赛白皮书·下篇》发布,开源办好一场数据竞赛的实践方法论

两周前&#xff0c;我们发布了《数据竞赛白皮书上篇1000场竞赛的深度分析》&#xff0c;通过28000字的研究分析、54个高品质图表&#xff0c;讲透了数据竞赛行业发展&#xff0c;带领大家看懂了竞赛高热度背后的逻辑。上篇发布后&#xff0c;引发了广泛的讨论&#xff0c;涌进公…

1行代码消除PyTorch的CUDA内存溢出报错,这个GitHub项目刚发布就揽星600+

点击上方“视学算法”&#xff0c;选择加"星标"或“置顶”重磅干货&#xff0c;第一时间送达丰色 发自 凹非寺量子位 报道 | 公众号 QbitAICUDA error: out of memory.多少人用PyTorch“炼丹”时都会被这个bug困扰。一般情况下&#xff0c;你得找出当下占显存的没用的…

分析6千万条GitHub帖子,发现你的工作状态与表情符号强相关

作者 | 凌霄出品 | AI科技大本营&#xff08;ID:rgznai100&#xff09;新冠疫情使得远程办公的人数大幅度增加&#xff0c;然而&#xff0c;当越来越多的人远程工作时&#xff0c;人们的情绪和心理健康状态也难以通过日常面对面的交流来观察&#xff0c;雇主们也就无法获得员工…