我最近写了一篇关于精选片段答案分数的评级信号的文章。在这篇文章中,我描述了 Google 如何使用依赖查询和独立于查询的排名信号来创建精选摘要结果。
本文这项专利的发明人段答案是如之一是史蒂文·贝克(Steven Baker)。我查看了他撰写的其他专利,发现其中一项是关于上下文,作为精选片段答案的查询独立排名信号的一部分。
当我记起这项谈论问题、答案和背
景的专利时段答案是如,我认为回顾这项专利并撰写相关文章会很有用。
该专利涉及处理请求文本答 电报数据 案的搜索查询以及如何选择这些答案。
这是一项复杂的专利,其背后的描述一度看起来有点不清楚,但我会描述一下这种情况。我认为其他细节可以很好地了解 Google 如何评估所提供的精选摘要。还有另一个类似的专利,我将从这里链接到它。
首先,该专利段答案是如告诉我们,搜索引擎可以识段答案是如别回答用户搜索查询的来源,并以对用户有用的方式提供来自该来源的信息。
上下文评分如何对精选摘要发挥作用
搜索引擎用户通段答案是如常寻找的是特定问题的答案,而不是结果列表,如专利中的这张图所示,其中的结果以框的形式呈现:
例如,用户想要了解某个地点的天气情况、股票的当前价格、某个国家的首都等等。
当搜索查询以问题的形式出现时,某些搜索引擎可以针对明确的问题执行专门的输出。
例如,一些搜索引擎可能会以具体的“答案”的段答案是如形式提供对此类搜索查询的响应信息,如以“一站式”形式在SERP中直接提供答案的信息。
某些搜索查询段答案是如更适合 和整体业务增长的潜在影响相比如何? 使用解释性文字段落,也称为“长答案”或“答案段落”。
例如,对于这个问题[为什么天空是蓝色的],解释光在大气中的运动的答案是有帮助的。
可以从包含与搜索查询和答案相关的文本(例如段落)的来源段答案是如中选择此类答案段落。
文本的各个部分都会被评分,得分最高的部分将被选为答案。
一般而言,专利反映了段答案是如其在以下过程中所涵盖内容的一个方面:
- 收到需要直接回答的明 沃沃盒 确问题的搜索查询
- 从选定的来源接收响应段落,每段均由从属于来源标题的文本部分中选择的文本组成,并具有相应的评估分数。
- 确定页面上的标题层次结构,具有两个或多个按父子关系分层排列的标题级别,其中每个标题级别具有一个或多个标题,各个标题的子标题是父子关系中的子标题,各个标题是该关系中的父标题,并且标题层次结构包括与根标题相对应的根级别(针对每个答案候选段落)
- 确定一个标题向量,该向量描述标题层次结构中从根标题到候选人答案段落所属的各个标题的路径,至少部分地基于标题向量确定上下文分数,至少部分地根据上下文分数调整所选来源的每个答案的评级分数,以形成调整后的评级分数
- 根据调整后的评估分数,从考生的答案段落中选择一个答案段落。
专利中程序的优点
可以部分地基于表示与问题相关的答案的上下文信号来选择长查询响应。上下文信号可以部分地独立于搜索查询(即,它们可以独立于其与搜索查询中的术语的关系进行评估。
评分过程的这一部分考虑了响应文本所在文档(“源”)的上下文,并考虑到在基于查询的评分中可能被遗漏的相关性信号。
按照这种方法,会出现长答案来满足搜索者对信息的需求,而不是精选的片段。7
您可以在以下位置找到该专利:
概括:
用于对候选答案段落进行上下文评分调整的方法、系统和装置,包括编码在计算机存储介质上的计算机程序。
在一个方面,方法包括对候选答案段落进行评分。对于每个候选答案段落,系统确定一个标题向量,该标题向量描述标题层次结构中从根标题到该候选答案段落所属的相应标题的路径;至少部分地基于方向向量确定上下文分数;并至少部分地根据上下文分数调整候选答案段落的答案分数,以形成调整后的答案分数。
然后系统根据调整后的答案分数从候选答案段落中选择一个答案段落。
使用上下文分数调段答案是如整精选摘要答案分数
专利中的一张插图显示了各种层次标题,可用于确定答案段落的上下文,并可用于调整精选片段的评估分数: