YATI 基于变压器神经网络。这就是为什么它被称为:又一个改进的变压器——源自英语“另一个改进的变压器(变压器)”。 Transformer 是一个用于自然语言处理的超大型、超复杂的神经网络。她可以轻松应对文本分析、翻译和创作。这种效率的背后是巨大的计算能力。 该算法最引人注目的例子是当用户在不知道电影名称的情况下找到一部电影。他输入描述或其本质,然后系统准确地确定它的内容。 YATI 相当于 Google 的 BERT。它还分析整个文本,而不仅仅是关键短语。 Yandex表示,国内产品优于国外产品。这一优势仅在俄语市场中较为明显。
和以前一样 现代算法使用机
器学习。但情况并不总是这样。 2016 年之前,相关性是由关键词决定的。它们在请求和页面上的一致性越多,该网站就越有可能位于顶部。机器人不仅受文本引导,还受到其体积、行为因素等的引导。它查找用户输入的单词,但从未深入到文档的底部。 然后,相差一年,出现了两个使用神经网络的机器人: 帕莱赫。学会回答复杂的请求。我没有严格按照它们来搜索,而是关注短语和页面标题的本质。这是按含义搜索而不仅仅是按键的出现搜索的第一步。产量明显提高。含有无意义文本但含有大量关键词的资源已经失去了顶级位置。独特、有能力、有用的文章开始受到重视。但由于复杂性,该算法并未应用于整个索引,而是应用于大约前 150 页; 科罗廖夫。
帕莱赫的改进我不仅分
析了标题,还分析了文本重要部分的内容。考虑了 Yandex.Toloka 服务的评估员、访客和用户的统计数据和意见。因此,搜索变得更加准确。系统找到了以对话格式提出的查询的答案。结果生成速度更快,搜索本身也更深入(20 万个文档)。 Palekh 和 Korolev 并不是 Yandex 首次尝试提高搜索结果的质量。在他们之前还有其他机器人。他们依赖的不是神经网络,而是数学计算。我们建议阅读文章“什么是搜索引擎排名算法以及为什么了解它很重要”。在其中,我们详细介绍了 Yandex 和 Google 的主题。 雅蒂如何运作 从软件和技术的角度来看,YATI 都是一个复杂的工程开发。为了实现这一目标,需要将大约一百个超强大的人工智能加速器整合到一个网络中。它由迄今为止技术最先进的 GPU – NVIDIA Tesla V100 组成。感谢他们,科学家和研究人员可以解决以前认为不可能的问题。 YATI 是一个转换神经网络。她需要接受培训。在标准方法中,变压器会显示隐藏一些单词的文本。他需要找到含义并猜测缺失的地方。 Yandex 的算法使这项任务变得更加困难。 YATI 显示了真实的搜索查询和相应的结果。他需要确定哪些页面对用户有帮助,哪些页面对用户没有帮助。 以人类专家的评估为标准。他们使用复杂的尺度来评估页面的相关性。
本质上该算法被训练来猜
测专家的评估并根据它生成结果。这种方法极大地提高了搜索质量。 雅蒂的特点 新算法的主要任务是回答任何复杂的问题。他成功地应对了这个问题。为什么需要变压器?以前的机器人是否也不需要输入密钥就能找到答案?是的,他们找到了,但结果并不总是正确的。因为Palekh和Korolev预测了用户的点击,YATI预测了专家的评估。 更新后的搜索有哪些优点: 不仅分析关键词和标题,还分析整个文本,包括大量文本; 查找文本中可能对用户特别有用的重要部分; 考虑了上下文、词序及其关系,也就是说,它决定了语义负载。 该算法处理文本的效果比之前的算法要好得多。他们浏览的文本不超过 10%,而且只浏览有标题或关键词及其同义词的地方。他处理大量的文章,并且完全理解包含不超过 10 个句子的文章。 为什么要实施YATI? 它旨在使用语义分析来搜索准确的信息。选择越精确,内容操纵的机会就越少。最重要的不是页面上按键的数量,而是内容的专业性。这对于白帽 SEO来说是个好消息。 什么可以帮助您保持领先地位: 对用户请求的详细响应。这篇文章应该尽可能有用。有必要充分披露该主题。最小字数 – 3000 个字符; 网站上的长时间会话。从搜索引擎的角度来看,访问者在页面上停留的时间越长,该页面就越有用。长文章和嵌入视频会增加这个数字; 遵循内部链接。如果访问者浏览资源,那么这对机器人来说是一个好兆头。其他文章的链接将鼓励您这样做。
例如,如果材料由多个部分
连接您终极电话号码目录是企业和个人寻找联系信息的理想解决方案 手机号码数据 此目录提供全 手机号码数据 面的电话号码列表,便于快速查找和连接。无论是寻找商家、服务提供商,还是朋友和家人,使用我们的目录可以节省时间,提升沟通效率。让“连接您”帮助您轻松建立联系,拓展社交网络。
组成。 Yandex 专家声称新机器人将搜索质量提高了 96%。这是近10年来最强劲的突破。 如何为新规则准备内容 YATI 专注于文本。为了达到顶峰,您需要针对新的要 IT 和技术领域的潜在客户开发:实现有效营销的 5 个技巧和策略 求对其进行优化。该怎么办: 写得简单明了。短句和最少术语。信息应该从第一次阅读中就被感知; 将文本分成块。以 2-3 段为一组。 4-5 行段落。每个块都有自己的副标题。这样读者就能更快地找到并吸收信息; 突出显示标题和副标题。以前,需要在文本中标记关键短语。这已经不再重要了; 制作项目符号和编号列表。机器人欢迎结构化文本。文章中必须包含列表(至少一个); 添加来自 Yandex 高亮显示的键、同义词和短语。
这些是用户最常输入的
短语。可以在关键词之间插入其他词,使查询多样化; 在搜索表单中使用低频和中频短语。这增加了到达顶峰的可能性; 将关键字插入标题和副标题。该算法可以理解文本,但标题和副标题仍然是优先考虑的。 大多数规则适用于长文章。如果文本包含不超过10个句子,则无需使用段落和列表进行格式化。 如何格式化 YATI 的商业文本 商业文章是对商品和服务的描述。它们的特点是体积小、关键词丰富。该算法可能会将它们误认为垃圾邮 搜索引擎优化美国 件并降低网站的排名。对于新资源尤其如此。 为了避免这种情况,您需要正确撰写商业文本:进行完整的描述,表明特征,添加照片和视频,包括评论和用户评分。另一个优势是产品评论。这种设计将同时吸引搜索引擎和客户。