搜索引擎在营销中的位置
看到/听到→想到→搜索
了解→对比→购买→转告
搜索引擎是营销的重要收入
什么是搜索引擎营销
利用人们对搜索引擎的依赖和使用习惯,在人们检索信息时将企业信息传递给目标用户
搜索引擎营销=SEM
SEM=SEO+PPC
搜索引擎优化=SEO 通过免费的手段做排名 自然排名
点击付费广告=PPC 竞价排名
按点击付费=CPC 竞价排名
工作原理
用户搜索→返回结果→查看结果→浏览网站→咨询搜索→用户搜索
返回结果:排名展示,可以争取的宣传位
查看结果:获取自己想要的信息(标题描述)
浏览网站:选择吸引自己的信息
咨询搜索:决策并采取相应行动
SEO与PPC的优缺点
分类 难度 引入流量 引入速度 成本
SEO 高 高 慢 低
PPC 低 低 快 高
基本流程
商业分析(目的方向)
市场调研(用户常用关键词,对手如何做)
搜索引擎优化(站内关键词、站外标签的设置)
实时连接策略
网站提交
付费收录排名
管理搜索引擎(跟踪目标关键词的排名,观察主要用户来源,有针对性的去做)
对营销带来的改变
企业营销行动 消费者行动
传统 推渠道、拉品牌 无(被动接受,给什么看什么)
搜索引擎 送文字、图片、视频 找(主动搜索)
让营销更精准
工作原理
爬行和抓取→预处理→排名
第一步:爬行和抓取:互联网上发现搜集网页信息同时提取建立索引库。
蜘蛛→跟踪链接→吸引蜘蛛→地址库→文件存储→爬行时检测内容
蜘蛛:一种程序,浏览各种页面提取有用信息
跟踪链接:从一个页面到另一个页面(深度优先,广度优先)
吸引蜘蛛:1.网站和页面权重。2.页面的更新频率。3.网站的原创内容。4.网站地图
地址库:为了避免重复爬行。1.人工录入种子网站。2.蜘蛛从HTML中解析出的新链接。3.站长向搜索引擎提交的网址。4.站长通过网站地图提交的网址。
文件存储:对每个URL都有一个独特的文件编号,每一个网站对应一个内容
爬行时检测内容:检测是否有相同内容
第二部:预处理
提取文字→中文分词→去停止词→消除噪音→去重→正向索引→倒排索引→链接关系计算→特殊文件处理
提取文字:针对抓取HTML去除标签和程序提取出用于排名处理的内容
中文分词:词典匹配,基于统计,首先分辨那几个字是组成一个词的,那几个字本身就是一个词
去停止词:出现频率高,但无影响的词
消除噪音:去除广告、导航
去重:去除重复页面
正向索引:从文章中提取出的词
倒排索引:根据关键词给文章
特殊文件处理:带有相应格式后缀
第三部:排名
1.对提交的搜索请求进行分析
中文分词→去停止此→指令处理→拼死矫正→整合搜索触发
2.文件匹配
3.初始子集筛选
4.想关性计算
关键词常用度→链接的权重→关键词的出现位置→关键词的密度和字频→关键词距离
关键词常用度:常用价值小,不常用价值大
关键词出现的位置:与靠左越有利于排名,正文首段出现
5.排名过滤及调整
6.排名显示