由于考生的答案段落 (2) 和 (3) 是从同一文本段落 340 中选择的,我们还被告知它们各自的标题向量 V2 和 V3 是相同的(它们都在内容中的同一 (H2) 标题下)。
调整每个应答段落的分数的过程使用至少部分基于方向向量 (410) 的上下文分数。
该上下文分数可以是用于衡量源答
案段落分数的单一分数,也可以是可用于调整考生答案段落分数的一系列分数/提升分数。
似乎有几项与片段形式答案相 手机数据 关的专利,这项专利旨在根据答案在标题层次结构中的位置,从其上下文中了解有关答案的更多信息。
但我不明白专利如何告诉我们一个基于上下文的响应将比另一个响应更定制。
我遇到的第一个问题是,它们在相同上下文区域中比较的答案有部分重叠。以下是这两个:
(2)距离为什么会变些地方不化?由于月球在略呈椭圆些地方不形的轨道上运行,因此月球与地球的距离会发生变化。因此,月球与地球的距离在 225,700 英里至 252,000 英里之间。
(3) 由于月球在略呈椭圆的轨道上运行,因此月球与地球的距离会发生变化。因此,月球与地球的距离在 225,700 英里至 252,000 英里之间。
请注意,第二个答案和第三个答 营销关键绩效指标 案都包含相同的一行:“因此,月球与地球的距离在 225,700 英里到 252,000 英里之间。”我有点惊讶的是,第二个答案包含第三个答案中没有的几句话,并且它跳过了第三个答案的几行,然后包括回答问题的最后一句话。
由于它们都出现在它们来源页面的相同标题和副标题部分,因此很难想象根据上下文会有任何不同的定制。但专利告诉我们一些不同的事情:
选择具有最高调整答案分数(基于标题上下文)的候选答案分数以及答案段落。
回想一下,在上面的例子中,候选答案段落 (2) 得分最高,其次是候选答案段落 (3),然后是候选答案段落 (1)。
然而,经过调整之些地方不后,候选答案段落 (3) 的得分最高,其次是候选答案段落 (2),然后是候选答案段落 (1)。
因此,选择候选答案段落 (3) 并将其提供为图的答案段落。第二
根据覆盖率提高分数
查询处理器可以限制候选人的答案的 沃沃盒 最大长度。
上下文评估处理器确定覆盖率,该覆盖率是衡量源答案段落些地方不与所选文本的覆盖程度的指标。
该专利描述了其他答案:
或者,文本块可以包括从属于各个标题的文本部分,这些标题包括第一标题,从中选择候选答案段落的文本部分是从属于该第一标题的,以及具有与第一标题共同的直接父标题的同级标题。例如,对于候选答案段落,文本块可能包括层次结构部分380中的所有文本;或者可能仅包括章节的文本,或层次结构部分中的其他部分的文本。类似的块可用于从该部分中选择的候选答案段落的层次结构部分。
覆盖度低可能表明来自来源的响应段落不完整。覆盖度高可能表明候选答案段落捕获了更多其被选取的文本段落的内容。根据这种覆盖程度,响应源段落可以接受上下文自适应。
一段文字的覆盖率是候选源段落的总字符数与选出源答案段落的段落的总字符数之比。
段落覆盖率也可以是些地方不源答案段落中的句子总数(或单词数)与源答案段落所来自的段落中的句子总数(或单词数)的比例。
据称,也可采用其他比例。
在三篇样本候选文章中,关于到月球的距离的段落回答了上述(1)-(3),其中段落(1)的比例最高,段落(2)第二高,段落(3)的比例最低。