我们如何确定单词何时组合在一起
Posted: Sat Feb 22, 2025 3:20 am
这是一个尺寸非常重要的地方。 Moz 拥有超过 20 亿个关键词的庞大关键词库,其中我们从 Google 收集了数亿个关键词。因此,我们可以识别出两个关键词具有相似搜索数据历史(相似的每次点击费用、竞争、数量等)的罕见情况。有时两个词恰好具有相同的历史,因此我们会使用各种 NLP 和字符串相似性指标,包括由 Matt Peters 博士构建的令人难以置信的深度学习模型来确定关键词是否彼此相关。使用多种方法非常重要,因为字符串匹配方法非常慢。一旦我们将这些不同的字符串相似度指标应用于一组具有相似指标的关键词,我们就可以识别出那些由关键词规划师分组的关键词。
2. 一旦我们知道哪些单词被组合在一起,我们如何确定每个单词的音量?
一旦我们有了一组相关术语,我们就会应用基于来自 Google 和点击 阿富汗数字数据 流源的数据的预测模型来确定应分配给每个单词或短语的适当流量百分比。再次,这就是拥有庞大数据集的真正优势所在。如果没有关于组成短语的详细数据,我们就不得不对如何划分分组卷做出不必要的假设。幸运的是,这种情况很少发生,当我们没有足够的数据来做出预测时,我们会选择向用户明确说明“没有数据”。
3. 当我们没有 Google 关键字规划师数据时,如何确定关键字量?
幸运的是,我们可以依靠广泛的点击流数据来进行这一计算。点击流数据本质上是有噪声和偏差的,因此我们的模型足够全面,可以消除随机事件,消除样本数据中的偏差,并根据一般 Google 语料库对呈现的流量进行建模。这里有点像先有鸡还是先有蛋的问题,因为如果 Google 数据有分组关键词问题,我们就无法针对 Google 数据进行建模,但如果没有点击流数据,我们就无法解决所有分组关键词问题。但是,只要我们有理由相信点击流数据在内部是一致的,那么我们就可以依靠它首先解决分组问题,然后使用未分组的关键字规划师数据将其与正常的点击流数据进行比较。这是一个复杂的过程,但最终我们可以在没有 Google 数据的情况下对每月搜索量做出合理的预测。
让我给你举个例子。紫心勋章获得者胡马雍汗上尉的父亲希兹尔汗在民主党全国代表大会上发表演讲,引起了不小的政治轰动。他的故事代表了关键词数据中的一个常见问题:在他演讲之前,从来没有人搜索过他的名字。演讲结束后,他的名字出现在了谷歌趋势 (Google Trends) 上,但尽管如此,谷歌关键词规划师 (Google Keyword Planner) 的数据发布还是落后了,因为数据发布延迟了几个月。由于我们的点击流数据可以捕捉到不断增长的趋势,因此我们无需 Google 关键字规划师数据即可估算 Google 流量。
2. 一旦我们知道哪些单词被组合在一起,我们如何确定每个单词的音量?
一旦我们有了一组相关术语,我们就会应用基于来自 Google 和点击 阿富汗数字数据 流源的数据的预测模型来确定应分配给每个单词或短语的适当流量百分比。再次,这就是拥有庞大数据集的真正优势所在。如果没有关于组成短语的详细数据,我们就不得不对如何划分分组卷做出不必要的假设。幸运的是,这种情况很少发生,当我们没有足够的数据来做出预测时,我们会选择向用户明确说明“没有数据”。
3. 当我们没有 Google 关键字规划师数据时,如何确定关键字量?
幸运的是,我们可以依靠广泛的点击流数据来进行这一计算。点击流数据本质上是有噪声和偏差的,因此我们的模型足够全面,可以消除随机事件,消除样本数据中的偏差,并根据一般 Google 语料库对呈现的流量进行建模。这里有点像先有鸡还是先有蛋的问题,因为如果 Google 数据有分组关键词问题,我们就无法针对 Google 数据进行建模,但如果没有点击流数据,我们就无法解决所有分组关键词问题。但是,只要我们有理由相信点击流数据在内部是一致的,那么我们就可以依靠它首先解决分组问题,然后使用未分组的关键字规划师数据将其与正常的点击流数据进行比较。这是一个复杂的过程,但最终我们可以在没有 Google 数据的情况下对每月搜索量做出合理的预测。
让我给你举个例子。紫心勋章获得者胡马雍汗上尉的父亲希兹尔汗在民主党全国代表大会上发表演讲,引起了不小的政治轰动。他的故事代表了关键词数据中的一个常见问题:在他演讲之前,从来没有人搜索过他的名字。演讲结束后,他的名字出现在了谷歌趋势 (Google Trends) 上,但尽管如此,谷歌关键词规划师 (Google Keyword Planner) 的数据发布还是落后了,因为数据发布延迟了几个月。由于我们的点击流数据可以捕捉到不断增长的趋势,因此我们无需 Google 关键字规划师数据即可估算 Google 流量。