大模子总结摘要靠谱吗？比人类写的流利，用GPT-太玄艳丽网

热点: 大模子总结摘要靠谱吗？比人类写的流利，用GPT
时间：2010-12-5 17:23:32 作者：探索来源：娱乐查看：评论：0
内容摘要：之后文本摘要总结使命，可能耽忧交给大模子了。文本摘要，作为做作语言天生NLG）中的一项使命，主要用来将一大段长文本缩短为杂乱的摘要，好比往事文章、源代码以及跨语言文本等多种内容都能用到。随着大模子LL
之后文本摘要总结使命，用GPT可能耽忧交给大模子了。大模
文本摘要，总结摘靠作为做作语言天生（NLG）中的谱比一项使命，主要用来将一大段长文本缩短为杂乱的人类摘要，好比往事文章、流利源代码以及跨语言文本等多种内容都能用到。用GPT
随着大模子（LLM）的大模泛起，传统的总结摘靠在特定数据集上妨碍微调的措施已经不在适用。
咱们不禁会问，谱比LLM 在天生摘要方面下场事实若何？
为了回覆这一下场，人类来自北京大学的流利钻研者在论文《 Su妹妹arization is (Almost) Dead 》中妨碍了深入的品评辩说。他们运用人类天生的用GPT评估数据集评估了 LLM 在种种摘要使命（单条往事、多条往事、大模对于话、总结摘靠源代码以及跨语言摘要）上的展现。
在对于 LLM 天生的摘要、家养撰写的摘要以及微调模子天生的摘要遏制定量以及定性的比力后发现，由 LLM 天生的摘要清晰受到人类评估者的喜爱。
接着该钻研在对于以前 3 年宣告在 ACL、EMNLP、NAACL 以及 COLING 上的 100 篇与摘要措施相关的论文妨碍抽样以及魔难后，他们发现约莫 70% 的论文的主要贡献是提出了一种总结摘要措施并在尺度数据集上验证了其实用性。因此，本文展现「摘要（简直）已经去世（ Su妹妹arization is (Almost) Dead ）」。
尽管如斯，钻研者展现该规模依然存在挑战，好比需要更高品质的参考数据集、改善评估措施等还需要处置。
论文地址：https://arxiv.org/pdf/2309.09558.pdf
措施及服从
该钻研运用最新的数据来构建数据集，每一个数据集由 50 个样本组成。
好比在实施单条往事、多条往事以及对于话摘要使命时，本文接管的措施模拟了 CNN/DailyMail 、Multi-News 运用的数据集构建措施。对于跨语言摘要使命，其策略与 Zhu 等人提出的措施不同。对于代码摘要使命，本文接管 Bahrami 等人提出的措施。
数据集构建实现之后，接下来便是措施了。详细来说，针对于单条往事使命本文接管 BART 以及 T5 ；多条往事使命接管 Pegasus 以及 BART；T5 以及 BART 用于对于话使命；跨语言使命运用 MT5 以及 MBART ；源代码使命运用 Codet5 。
试验中，该钻研聘用人类评估员来比力差距摘要的部份品质。服从如图 1 所示，LLM 天生的摘要在所有使掷中不断优于家养天生的摘要以及微调模子天生的摘要。
这就提出了一个下场：为甚么 LLM 可能压倒人类撰写的摘要，而传统上人们以为这些摘若是百孔千疮的。此外，经由开始的审核表明，LLM 天生的摘要展现出高度的流利性以及毗邻性。
本文进一步招募诠释者来识他人类以及 LLM 天生摘要句子中的幻觉下场，服从如表 1 所示，与 GPT-4 天生的摘要比照，家养誊写的摘要展现出相同或者更高数目的幻觉。在多条往事以及代码摘要等特界说务中，家养编写的摘要展现出清晰较差的事实不同性。
家养撰写的摘要以及 GPT-4 天生摘要中泛起幻觉的比例，如表 2 所示：
本文还发现家养编写的参考摘要存在这样一个下场，即缺少流利性。如图 2 (a) 所示，家养编写的参考摘要无意存在信息不残缺的缺陷。而且在图 2 (b) 中，一些由家养编写的参考摘要会泛起幻觉。
本文还发现微调模子天生的摘要每一每一具备牢靠且严厉的长度，而 LLM 可能凭证输入信息调解输入长度。此外，当输中计罗多个主题时，微调模子天生的摘要对于主题的拆穿困绕率较低，如图 3 所示，而 LLM 在天生摘要时可能捉拿所有主题：
由图 4 可患上，人类对于大模子的偏好分数逾越 50%，表明人们对于其摘要有强烈的偏好，并凸显了 LLM 在文本摘要方面的能耐：
体坛联播｜高亭宇速滑世界杯夺金，拜仁曼联阿森纳集体输球澎湃新闻2023-12-10 09:23澎湃新闻2023-12-10 09:23
全场8人轮换，6人得分上双！打成这样的热火，最后还是输给老冤家狂轰35+15+12！全联盟第一，NBA最强超巨诞生，MVP总冠军全都要

最近更新

2024-11-17 16:16:55
篮网赢家之路：布里奇斯绝杀老鹰，哈登逼宫将成关键
2024-11-17 16:16:55
新华全媒+丨“守护太阳的民族”欢庆“乌日贡”传承民族技艺
2024-11-17 16:16:55
“东欧”组合将继续磨合！欧文3年1.26亿续约独行侠第3年为球员选项杨丽萍被曝私生活糜乱，生活全靠男助理伺候，网友：现实版老佛爷
2024-11-17 16:16:55
无人问津，猛龙拒绝勇士揭秘，抓紧扶正他，森林狼别再糊涂官宣！3交易6签约，湖人成最大赢家，火箭连签4人，2份2.6亿顶薪
2024-11-17 16:16:55
近11场8胜防守效率第二，快船四巨头终于有了冠军相？
2024-11-17 16:16:55
2022款福特独行侠价格30万起全国可上牌
2024-11-17 16:16:55
原创 3队哄抢利拉德！热火领跑，快船队追逐，湖人退出争夺，太可惜了
2024-11-17 16:16:55
原创记者：希望山东泰山为吴兴涵报名中超，没必要为这点事废了他！

热门排行

2024-11-17 16:16:55
尘埃落定！浙江队被剥夺亚冠资格悬念揭晓，来看看名记传来的消息哥哥是皇帝，大伯是光绪，奶奶是慈禧，他却非常低调地活到2015年
2024-11-17 16:16:55
要防护更要酷-高性价比太阳镜选购指南蔡徐坤“一夜情”风波后续，女方长得白白净净，露面拿出打胎档案
2024-11-17 16:16:55
火箭送礼老鹰，将从老鹰迎回旧将卡佩拉
2024-11-17 16:16:55
CBA三消息：辽宁看中23岁外援，韩旭七数据登顶，李玮颢加盟天津
2024-11-17 16:16:55
国内首次！可复用火箭复用飞行成功马伟明说中美国超级航母痛点上百亿航母现在烂尾花费将近8600亿
2024-11-17 16:16:55
意甲豪门出售头号巨星，英超3强都想要，1.3亿英镑先难倒两家豪门张子枫未修生图流出，被网友公开批评：她的胸碍了谁的“意淫梦”？
2024-11-17 16:16:55
雄鹿这次可能被打解散了…
2024-11-17 16:16:55
含能材料︱从枪炮到火箭，承载了多少人类的野心和梦想

友情链接