石家庄网站建设 > 博客教程 > 网络营销知识 >

石家庄网站建设制作公司seo新算法

发布时间:2020-06-10

石家庄网站建设制作公司seo最新算法 尽管我们有很多方法可以尝试和破译这种联系,但是词语共享的关系有时会让人感到困惑。一种这样的方法称为TF-IDF,它可以让您确定所选主题中特定单词之间的连接强度(相关性)。我打算在这里做的是教你更多关于TD-IDF是什么以及它的计算方式,以及为什么在SEO文章优化和数字营销方面首先值得关注的。

什么是TF-IDF算法(术语频率 - 逆文档频率)?

简单地说; 这是一种根据单词发生频率计算单词重量的方法。获得更多技术,它属于一组特定的算法,用于计算某个术语的统计权重。这可能听起来有点混乱,但不要让它阻止你阅读,它听起来比实际更难。

分析过程本身基于文档中单词的出现频率,以及指定文档集合中单词的反向频率。这意味着TF-IDF可以向您显示在提供的文本中哪些词最重要。我们还能够参考您的利基市场中的十大网站,因此,我们可以使用高频词语全面优化您的网站。

TF - 术语频率

一个单词出现的次数除以文章长度

术语频率检查术语在文档中出现的频率与其中的内容量有关。

IDF - 反向文档频率

逆文档频率idf =语料库中文档数量的对数除以术语出现计数的集合中的文档

它计算出现单词的文档数量的反比,并将其与集合中的所有文档进行比较。最好的部分是,它可以确定主题中的流行词,因此结果适合您正在使用的区域。类似的语料库用于自然语言处理。

TF * IDF =单词出现的次数除以与反向文档频率相乘的文章长度

SEO为什么有趣?

“TF-IDF分析允许您根据算法已经显示的内容优化内容中的术语平衡。” - Matt Diggity

感谢TF-IDF,我们能够发现与特定表达的上下文相关的单词。这非常适合完全优化页面,以及构建相关主题以获得更好的SEO结果。它还允许您按顺序对单词进行排序,从最重要到最不重要,这意味着您可以清楚地了解所选主题的单词范围。了解您对博客,本地新闻或利基文章的竞争将指导您完成目标关键字密度和其他排名因素。

TF-IDF效率

您正在使用的文档集合或语料库是计算IDF时影响单个单词的最终权重的基本变量。这些集合的问题在于需要为文档中出现的每个单词重新计算IDF,这是最有效和最有效的方法。

所讨论的数据集越大,转换所需的数据就越多。这可能导致基础设施问题以及与确定集合大小有关的问题。但是,最终,设置越大,您将获得的结果越准确。

TD-IDF计算系统效率的一些问题如下:

  • 指定一组文档的大小。
  • 照顾集合的公正性。
  • 由创建新单词产生的循环更新。
  • 需要为不同语言提供单独的集合。
  • 由两个或多个单词组成的表达式的极其昂贵的TF-IDF计算。

尽管如此,TD-IDF(术语加权)在创建和优化文章时仍然是一种非常有效且有用的算法。没有SEO工具是完美的,而且这个工具非常有效,可以让你更清楚。您可以通过Matt Diggity了解有关TF-IDF的SEO指南中排名结果的更多信息:https://diggitymarketing.com/tfidf-for-seo/ 和Authority Hacker:https:  //www.authorityhacker.com/tf-idf/ 

关于TF-IDF,我们还不知道什么?

当然,我们也不了解TF-IDF,这也是它如此有趣的一部分。我们不知道谷歌或其他搜索引擎是否使用TF-IDF,即使它确实如此,我们也不知道是什么形式。它是最基本的问题之一,因为它在很大程度上依赖于对集合或语料库文档的分析。

如果该组不匹配或不完整,则也会使整体术语权重的判断发生偏差。例如,将维基百科用作IDF工具的一组文档不一定能很好地工作,因为每个集合都会在某种程度上存在偏差。

 

但是,如果谷歌或其他搜索引擎实际上使用TF-IF,它的位置比市场上任何其他工具都要好,因为它的主体由网络上的每一个内容组成。因此,结果将是公正的,可用于比较。根据Matt Diggity的说法,有一些私人数据相关性研究表明它很有可能。

有效的TF-IDF分析要求

为了从TF-IDF分析中获得最佳和最有效的结果,需要以下内容:

  • 集合或语料库中的大量文档,用于有价值的分析。 
  • 为每个术语预先计算IDF的数据库,以便快速获得有价值的结果。

在Surfer,我们意识到如何使用不正确的数据集很容易模糊整个图片,并且定义最佳数据集也很困难。我们决定最好将此决定留给搜索引擎算法,因此它可以分析前十个排名页面的语义特征。

据谷歌称,我们认为前十大竞争对手是最相关网站的代表。Surfer致力于查找这些网站的常用词和短语,并且在许多情况下,结果与其他工具使用的TD-IDF非常相似。在此之后,Surfer收集第二组关键词; 十大网站中最受欢迎的单词和短语。

然后,在选择最有意义的关键字之前,它将交叉检查两个数据集(常见和流行)。那些不太重要的(认为隐私政策和条款和条件)被拒绝并被搁置。由于这些操作,我们得到了最突出的词,就像TD-IDF一样,但我们也更容易抵抗潜在的错误。

值得注意的是,即使搜索引擎能够使用许多不同的算法,TF-IDF也可以成为排名因子。突出的单词和短语功能无论使用何种方法都可以使用,而TF-IDF仅在我们假设Google使用此(或类似)技术时才有效。

如何计算突出的单词和短语

确定突出单词和短语的过程以与标准TF-IDF相同的方式开始。也就是说,从计算关键词出现的频率来看。然后以表格的形式提供该算法的结果; 一个用于流行的单词,一个用于流行的短语。它出现在这里是前30名之一,它必须至少出现在文章中两次。

这个过程的第二部分被称为常用词和表达式的计算,它是出现在前十名结果中的竞争者。我们直接依赖于Google(或其他搜索引擎)算法提供的当前页面集,如果它出现在前十名的至少四个页面上,则列出该单词或短语。

然后剪切两个集合,结果包含在两个集合中找到的单词和短语。以这种方式获得的短语描绘了搜索引擎当前正在推广的文章的准确和清晰的图像。这与所述内容的分析方式无关。

为什么我们决定采用Prominent而不是TF-IDF分析

TF-IDF的结果非常有价值,但它们只包含单词。表达式是区分文档的方式,由于涉及的计算次数,几乎不可能对大型数据库中的表达式进行TF-IDF分析。我们在很大程度上依赖于突出分析有两个原因:

  • 我们可以分析对SEO有更大差异化价值的表达。
  • 我们不是要重新创建Google算法; 我们分析其结果。由于这个原因,突出的单词和短语与Google如何(以及如果)使用TF-IDF无关。

SEO工具结果比较

我们进行了一项关于TF-IDF和突出单词和短语分析的实验。我们使用的短语是美国的SEO服务。当我们运行算法并检查最终结果时,我们得出以下结论:

  • 在Prominent中发现了更多的词语和表达。
  • 有更高的准确性,而不是SEO这个词,我们收到了十几个变种。

有关使用中的相关性和关键字的见解

作为旁注,作为TD-IDF工具,我们使用了SEObility。有很多工具可以提供自然语言分析。

结论

TF-IDF是针对目标关键字优化文章的有效且有价值的方式。但是,我们认为我们自己的解决方案将是最好的前进方式。突出的单词和短语能够提供更多数据,并且直接基于Google算法提供的结果。您可以在我们的软件中找到TF-IDF,如果它为每个术语提供了更好的指导,如关键字密度。

真密度

所有这些计算现在都有很好的结果,即真密度特征。它为所有突出的术语提供关键字密度,并为您提供简单的建议,以摆脱过度和低优化。市场上没有这样的关键字密度工具可以考虑您和您的竞争对手的文档长度。 

使用真实的关键字密度提高搜索结果的排名

在这里阅读更多关于真密度的信息!

在许多方面,Prominent与TF-IDF非常相似,第一部分在整个过程中保持不变。第二部分是不同的部分(正如我们已经解释过的那样),但即使如此,它也不是特别复杂,并且与标准TD-IDF一样快。根据结果​​,您会发现它们比平时更清晰,更详细,这要归功于基于公式的Prominent列表对每个竞争对手文章分析的要求。这是一个非常值得用于SEO的系统,用于创建和优化针对英语和任何其他语言的特定查询的文档。节省时间并在流程中添加突出的单词和短语


网站建设
Website
客户案例
Customer case
关于展为
About ZHANWEI
展为致力于网站建设与网络营销,微信营销,专业领域包括网站建设、网站seo优化推广、移动互联网营销、三网合一网站建设,微信营销小程序开发,与其他网站建设及系统开发公司不同,我们的整合解决方案结合了展为网络建设经验和互联网整合营销的理念,并将策略和执行紧密结合,且不断评估并优化我们的方案,为客户提供一体化全方位的互联网品牌整合方案!

扫码咨询

Copyright © 石家庄展为网络有限公司. 冀ICP备14018173号-6 Copyright 2010-2020版权所有
展为网络
网站建设
客户案例