加载中…

加载中...

正文 字体大小:

5000万元就能搞掉google

(2006-11-29 14:57:26)
分类: 搜索引擎
  昨天看到google研究员吴军写的“数学之美 系列十七 闪光的不一定是金子 谈谈搜索引擎作弊问题”(http://googlechinablog.com/2006/11/search-engine-anti-spam.html)里有这样的话“Google基本做到了对于任何已知的作弊方法,在一定时间内发现并清除它,从而总是将作弊的网站的数量控制在一个很小的比例范围。”忍不住打了个大大的喷嚏,好大的牛皮啊!
  亏我在“google的平衡之道”(http://blog.sina.com.cn/u/59191ea6010005yk)一文里还夸google呢!别说现在做SEO的都是首先就做网站内容改善建议(毕竟对于用户来说,面向目标受众传播率高更有价值,所以现在很多网站更关注MSN和QQ里链接带来的访问量,并重点分析这些被传播页面内容),我在怎样通过google提升网站访问量一文(http://blog.sina.com.cn/u/59191ea6010004c9)里也说了做SEO首先要做的是提升网站内容对用户价值,毕竟SEO只是手段,带来更多忠诚用户才是网站目标。
  就拿吴军自己文章里的例子来说,那个去除汽车引擎声的例子,应基于通话时长远大于分析时长的条件吧,如果通话时长本身很小,而分析所需取样本的时长与其接近,去噪还有意义吗?
  google现在每天落到某个关键字上的搜索量有多大?
  使用我在“怎样才能黑掉google”一文(http://blog.sina.com.cn/u/59191ea6010005n1)中冒充合法用户,多大代价可以黑掉google?两千万用于组织团队,三千万用于租肉机,按目前行情,一台肉机一天十块钱租金,六十天,每天五十万元,可以租五万台,上面少创建点帐号,每台肉机上跑一万个帐号吧(一般测试用电脑可以同时运行十几万帐号,考虑到肉机上还有人家正常应用,就少跑点吧),可以模拟五亿用户,足以把正常用户对优质网站的选择行为淹没了,如果按吴军文章里例子,等于是把他从汽车里换到纺织厂的织布车间,两月用户不能找到新鲜网站或者只能找到google利用人工筛选出来的网页,用户疯了之前,估计google就疯了。
  而且很多时候,网站排在前面并不取决于网站内容是否丰富或网页是否好看,而是受其他一些因素影响,比如说,线下的一些新闻,或者公司的市场影响力,google凭什么判断那些与真人行为模式一模一样的机器人就是SEO公司的,而不是真人呢?
  记得在以前公司的时候,讨论用户在网页上的行为模式分析,产品经理当时说从哪儿哪儿开始跟踪起,然后归纳用户主要行为模式,我鄙视地看看他,说到这个网页的人总共有多少?每步几十个分支,几步之后每条分支上还有多少人?一算数量级,他脸红了。
  记得有个物理学家举例说有个孩子去杂货店问老板,水果糖多少钱一磅,奶糖多少钱一磅,杂拌糖多少钱一磅,老板回答后,孩子拿出五便士要买杂拌糖,老板给他一颗水果糖一颗奶糖,让他自己杂拌。
  回到主题上来,如果google不想被竞争对手用五千万就搞死(那太丢人了),现在应该是做分类索引的时候了,由于现在用户量已经很大,导入一部分到分类索引里可以对目前的不足起一定补充作用,用户在分类索引里的选择行为与搜索框索引页的选择行为起相互约束作用,为了防止用户使用带识别的机器人程序来破坏,分类索引应该与搜索框索引所使用数据有一个时间差,并且使用小猩猩提供的代码随机化方案,让用户不能使用机器人识别并投票。

0

阅读 评论 收藏 转载 喜欢 打印举报
  • 评论加载中,请稍候...
发评论

    发评论

    以上网友发言只代表其个人观点,不代表新浪网的观点或立场。

      

    新浪BLOG意见反馈留言板 不良信息反馈 电话:4006900000 提示音后按1键(按当地市话标准计费) 欢迎批评指正

    新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

    新浪公司 版权所有