文章来源 | 恒源云社区
原文地址 | 通过摘要信息问题生成改进无监督问答
原文作者 | Mathor
上海于昨日宣布要开始在全市范围内开展新一轮切块式、网格化核酸筛查!**【恒源云】**云墩墩☁️ 提醒小伙伴们,不管居家还是出门,都要注意防疫哦~
也许是居家的小html标签伙伴真的很多,也许是春天来了大家积极性增强,社区技术贴那是一个接一个的发啊!
今天呢,给大女篮潘臻琦图片家带来老朋友Mathor的文章。
正文开始
1 Abstract
问题生成(QG)是为给定的<passage,an测试手机是否被监控swer><passage,answer>pair 生成似是而非的问题的任务。基于模板的QG使html是什么意思用语言信息启发式端到端时延将陈述句转换为疑问句,对于监督QG使用现有的问答(QA)数据集来训练系统,以生成给定段落和答案的问题。
- 启发式缺点:生成的问html标签题与它们的声明性对应问题紧密相关。
- 监督方法:它们与用作训练数据的QA数据集的域/语言紧密相关。
本文提出无监督的QG方法:使用从摘要中启发式生成的问题作为QG系统的训练数据的来源。(利用启发式方法将陈述性摘要句子转化为合适的问句)
- 本文使用的启发式方法:依赖句法分析、命名实体识别、语义角色标注等。
通过无监督QG产生问题,然后将产生的算法分析的目的是问题算法设计与分析与原始文章结合,以端到端训练神经QG模型。
1 Introduct测试ion
问题生成的目的是在给定一组输入段落和相应答案的情况下产生有意义的问题。
早期QG的研究基测试抑郁程度的问卷于模板生成,但这样的问题缺乏多样性,并且能力培养与测试与相应的陈述句子有很高的词汇重叠度,例如:StephenHa那里拍婚纱照好wkingannouncedthepartyinthemorningStephen Hahtml个人网页完整代码wking announced the party in the mornin测试用例g 的句子生成的问题,以S端到端时延tephen Hawking(斯蒂芬霍金)为候选答案跨度,可能是Who announced the party in the morning?(谁在早上宣布了聚会?),可以看到生成的问题和陈述句之间有很高的词汇重叠。这在问题系统中是不可取的,因为问题中强烈的词汇线索会使它成为一种很差的真正意义上的理解。
后来神经seq2seq模型成为QG的主导,nlp通常从人类创建的QA数据集获得<passage,answer,query><passage,answer,年龄拼音query>三元组训练html标签属性大全,这种方法限制了对数据集的领域和语言的应用,并且需要大量的时间和资金。
本文提出一种新的无监督方法,将QG描述成测试仪一个摘要-提问过程(summarization-questioning)。通过使用免费获得的摘要数据,对摘要进行依存关系分析、命名实体识别和语义角色标注,然后应用启发算法的时间复杂度是指什么式方法根据解析的摘要生成问题。
图一显示了一个实例(通过使用不同候选答案span的摘要句子的语义角色标注启发式生成的示例问题):
问题要从摘要中产生而不是原始段落中,因此摘要是作为问题和段落之前的桥梁存在的,最后生成的问题和段落的词汇重叠部分也较少,这种方法是可行的,因为摘要中包含了段落中最重要的信息,在语义上也和段落接近。另外摘要数据要比QA数据集获取要容易的多,因为许多QA数据集是算法设计与分析专门为训练QA系统而创建的。
2 Realated Work
在无监督QA中,使用基于QG模型的合成数据而不是现有的QA数据集来训练QA模型。代替端到端加密求助于现有的QA数据集,测试仪采用了无监督的QG方法,例如无监HTML督的神测试你适合学心理学吗经机器翻译Unsupervised Questio算法的特性nhtml个人网页完整代码 Answering by Cloze Translation、Template-Based Question Generation from Retrieved Sentences for Improved Unsupervised Question Answering。Harvesting and Refining Quesnlption-Answer Pairs for Unsupervised QA提出了基于模板/规则的问题算法的特性生成html标签方法,并将检索到的段落和被引用的段落作为源段落,以端到端加密缓解段落和问题之间的词汇相似问题。
3 Methodology
本文提出的方法使用合成的QG数据,然后使用一些启发式方法从摘要数据创建QG数据来训练QG模型。
图2中展示了本文的模型(答案和问题是基于问题生成启发式的摘要生成的,答案与文章测试结合形成编码器的输入,问题被用作解码器输出的ground-truth):
3.1 QUESTIO算法导论N GENERATION
为了避免生成与相算法的五个特性应说明性算法设计与分析语句高度相似的琐碎问题,本文采用摘要数据作为连接生成的问题和原始文章的桥梁。
- 对摘要句进行依存分析(DP),然后是命名实体识别和语义角色分析(SRL)
- DP被用来识别主要动词(动词根)和其他成分(助动词)的一种手段。
- NER负责摘要句子中的测试抑郁程度的问卷所有实体算法的时间复杂度是指什么,以便于发现要生成的端到端最合适的问句。
- 语句分析的关键是SRL,被用来获取摘要句子的所有端到端时延语义框架,每个框架有一个动词和一组论元组成,这些论元对应于句子中的短语。
- 例如,参数可以包括AgentAgentAgent(其发起由动词描述的动作)、Patient算法的五个特性PatientPatient测试仪(其进行该动作)以及一组修饰符参数,如ARG-TMP或ARG-LOC
- 根据论元类型和NER标签从论元生成疑问句,这意味着可以共同确定w算法工程师h-word脑颅膨大的意思s
图1中的示例:给出SRL分析[U2’sleadsingerBonoARG−0U2’s lead sihtml简单网页代码nger Bono ARG-0]has [hadVERBhad VERB] [emergencyspinalsurgeryARG−1emerge脑颅膨大的意思ncy测试抑郁症 spinal surgery ARG-1] [aftersufferinganinjurywhilepreparingfortourdatesARG−TMPafter sufferi年龄拼音ng an injury while preparing for tour dates ARG-TMP]。根据这三个论点可以生成算法导论图1中所示端到端诊断有故障怎么解决的三个问题。
3.那里拍婚纱照好2 TRAINING A QUE测试你的自卑程度STION GENERATION MODEL
本文使用的摘要数据由<passage−summary><passage-summary>对组成。问题是使用3.1节中描述的启发式方法测试英文从摘要中生成的,这样就有了<passage−sumary>HTML;<html是什么意思pas端到端sage-s算法的时间复杂度取决于umary>对和<summary−question−answer><summary-question-anhtml文件怎么打开swer>三元组,然后我们将它们组合成<测试用例pass测试age−answer−question>&html标签属性大全lt;passage-answer-question>三元组,以训练QG模型。
本文训练一个端到端的seq2seq模型,而不是部署一测试你适合学心理学吗个管道,首先生成摘要,然后再生成问题,以消除生成过程中错误积累的风险。通过测试抑郁症使用这些QG数据来训练神经生成模型,期望该模型学测试抑郁程度的问卷习summary和问题生成的组合。换句话说,这样的知识可以通过Q测试仪G数据隐含地注入到神经生成模型中。
为了训练问题生成模型,本文将每个段落和答案连接起来,形成一个序列:passage<SEP>answer<SEP&能力培养与测试gt;passage<SEP>answer<S端到端诊断异常EP>,其中<SEP><SEP>是用于分隔段落和答案的特殊符号。这个序列是输入,目标输出(目标)是question。本文使用BART进行生成,通过以下负对数似然损失函数进行优化:
其中qiqhtml代码_i是question的第ii个tokeNLPn,C、AC、AC、A表示上下文和答案。
4 Experiments
4.1 EXPERIMENThtml标签 SETUP
4.1.1 Question Generation
Datasets本文使用BBC新闻网站抓取的XSUM的新闻摘要数据来测试提出的方法。XSUM包括226,711个<passage−summary><passage-summ年龄拼音ary>对,每个摘要包含一个句子。
QG De端到端诊断有故障怎么解决tails使用Allenhtml5NLP来获取摘要句女篮潘臻琦图片子的依存关系端到端加密树、命名实体和语义角色标签。
删除满足以下三个条件中能力培养与测试的三元组:
- 超过480个thtml代码oken的文章(超过最大BART输入长度);
- 文章中答案跨度中不超过55%的token端到端流程的文章(以确保答案和短文之间有足够的词汇重叠)
- 5个记号以下的问题(非常短的问题可能删除了太多的信息);
一共产生了14,830个<passage−answer−question><passage-answer-question>端到端加密是什么意思个三元组
4.1.2 Unsupervised QA
Datasets在六个抽取的问答数据集上进行了实验,分别是SQuAD1.1、Ne端到端加密wsQA、Natural Questions、TriviaQA、BioASQ和DuoRC。
本文使用SQuAD1.1、NewsQA和TriviaQA的官方数据,对于Natural Ques测试你适合学心理学吗tions、BioASQ和DuoRC,使用MRQA发算法的五个特性布的预处理数据。
Unsuperv测试你的自卑程度ised QA Training Details为了生成合成的QA训练数据,本文利用维基转端到端是哪一层储(Wikidumps),首先删除所有HTML标签和引用链接,然后提取长度超过500个字符的段落,从维基转储的所有段落中抽取60k个段落。使用Spacy和AllenNLP的NER工具包算法的五个特性来提取段落中的实体提及。
然后,删除满足以下三个条件中的一个或多个的段落,即答案对:
- 少于20个单词而超过480个单词的段落;
- 没有提取答案的段落,或者由于文本tokenization而提取脑颅膨大的意思的答案不在段落中;
- 由单个代词组成的答案。
将段落和答案连接成形式passage<SEP>answer&l端到端是什么意思t;SEP&g测试仪t;passage<SEP>answer<SEP>的html是什么意思序列,然后输入能力培养与测试到训练好的BART-Q端到端检测异常G模型中获得相应的问题。这产生了20k个合成QA对,然后将其用于训练无监督QA模型。
4.2 RESULTS
使用生成的2万个合成问答对来训练BERT QA模型,NLP并首先在基于维基百科的三个基准问答数据集SQuAD1.1、Natural Questions和TriviaQA的验证集上验证了该模型的性能。本文方法的结果如表1和表2所示。
无监督的基线:
- Unsupervised Question Answe测试英文ring by Cloze Translation采用无监督神经机器翻译训练QG模型,生成4M个合成QA实例来训练QA模型
- Harvesting and Refining Question-Answer Pairs fo测试你的自卑程度r Unsu女篮潘臻琦图片pervised QA使用依存关系树来生成问题NLP,并使用被引用的文档作为段落
4.3 EFFECT OF DIFFERENT HEURISTICS不同启发式的效果
- Naive−QGmathrm{Naive-QG}只使用摘要句作为上下文(不是原始段落 ),只用适当的问句替换答案的span。例如StephenHawkingannouncedthepartyinthemorningStephen Hawkinlpng ann测试手机是否被监控ounced the party in th算法的有穷性是指e morning的句子,以partyparty为答案span,Naive−QGmathrm{Naive-QG}产生的问题会是StephenHawkingannounc端到端流程edwhatinthemorning?Stephen Hawking announced what in the morning?。采用摘要句作为输入,问题作为目标输出,形成QG训练数据。
-
Summary−QGSummary-QG使用摘要的原文作为段落,而不是摘要句,以避免段落和问题之间的词汇测试工程师高度重叠。
- Mhtml代码ainVenlp是什么意思rbmathrm{Main Verb}主谓词nlp是什么意思:只根据摘要句依存关系树中主谓词的SRL框架生成问题,而在从句中使用动词;
- Wh−Movementmathrm{Wh-Movement}将问题词移动到句子的开头;
- Decomp−Verbmat测试仪hrm{Decomp-那里拍婚纱照好Verb端到端加密}分解动词:主要动词被分解成基本形式和助词;
- NER−Whmathrm{NER-Wh}:使用NER标签来获得更准确的问句来回答,例如,对于NBAplayerMichaelJordanNBA player Michael Jordan的答案跨度,问题词将是whichNB女篮潘臻琦图片Aplayerwhich NBA player而不是whoorwha算法twho or what。
5 启示
- 能不能根据一些描述生成问年龄拼音题呢?
- 启发式的算法可以是一些属性知识吗?