『转』新版谷歌Sitemap生成器

2009年2月12日

    2005年6月我们推出了Python Sitemap 生成器,距今已经三年有余了。在此期间,许多网络爱好者自己开发了第三方的Sitemap生成器,这些都有助于网站管理员们创建更好的Sitemap文件。大多数现有的Sitemap生成器要么依靠爬行相应的网站,要么是把一个服务器上的文件都列出来,而我们开发的Sitemap生成器不同于这些现有的Sitemap生成器,谷歌Sitemap生成器能采用多种方式搜寻您网站上的URL,并允许您自动创建和维护多种不同类型的Sitemap文件。

关于谷歌Sitemap生成器

新的谷歌Sitemap生成器是完全开放源代码的,通过分析您网站服务器的访问、日志文件和服务器上存在的文件,谷歌Sitemap生成器可以发现新的URL和最近发生过变动的URL。综合这些手段,谷歌Sitemap生成器能够迅速找到这些URL,统计相应的元数据,从而使您的sitemap文件能尽快生效。一旦谷歌Sitemap生成器成功采集到这些URL,它就能为您生成以下Sitemap文件:

不仅如此,谷歌Sitemap生成器还能通知谷歌博客搜索,您的网站有了新的或更新过的URL。您还可以把Sitemap文件的URL地址放在您的robots.txt文件中,并通知其他支持sitemaps.org 标准的搜索引擎。

之所以能够把URL发送给正确的Sitemap,要归功于基于网络的管理控制系统,这种控制系统使您能够利用各种各样的功能轻松管理您的网站,同时还能确保高度的安全性。

现在就开始使用吧

谷歌Sitemap生成器是一个服务器端的插件,既可以安装在基于Linux/Apache的服务器上,也可以安装在基于微软 IIS 视窗系统的服务器上。像其他的服务器端插件一样,您需要有该服务器的管理权限才能安装。您可以在谷歌Sitemap生成器帮助文档(英文)里找到更多有关安装的信息。

我们很高兴能够发布开源版的谷歌Sitemap生成器,我们希望籍此能够鼓励更多的主机服务提供商将此工具或类似的Sitemap工具加入自己的主机软件包里!

您还有与之相关的其它问题么?请访问我们的谷歌Sitemap生成器支持论坛 (英文)或在我们的网站管理员支持论坛中提出您的问题。

winzeng 转自 Google中文管理员博客 http://www.googlechinawebmaster.com/2009/01/sitemap.html

SEO工具, SEO(搜索引擎优化) ,

骗子年年有,今年特别多!

2009年1月4日

               骗子年年有,今年特别多,现在的手段也很多,稍不留意就会中招。尤其是以短信、电话诈骗居多,下面简单介绍几种我遇到过,实际听到的几个诈骗手法。

 短信诈骗:

       “爸妈,我和朋友同居被公安抓住,请速去建行打30000元到XX警官(或是朋友)的建设银行卡上62290103259000408595,姓名XX,不让打电话,手机被扣了,详情出来再说。”

        此类受骗对象主要是农村的老人,有子女在外打工,农村地理位置偏远信息滞后闭塞,对这类骗术防范意识不强,害怕自己孩子受罪,人生地不熟的,又没有可靠的信息确定;无法判断信息真实,父母或亲人可能宁可信其有,不可信其无,花钱消灾…..  

电话欠费

主要对象是固话用户,手机用户的欠费通知都以短信为主。当你收到一个电话欠费的电话,其声音很像电信的语音提示,说你的固定电话已经欠费,如不缴费即将停机。如需人工帮助请按0  。 这些电话来电时间一般选择在你交电话费的时间点上,稍不留意就可会上当,可能会收取一定的信息费或开通某些声讯服务。当然这也是有破绽的,来电显示的电话号码为非常规号码,可能是1008xxx开头 或者 —–P—–  或者其它位数的号码,类似这些电话千万不要按键或回拨。即使需要查询,你可以通过你的服务商指定的查询平台查询你的花费,按照正常的手续缴纳花费。

业务洽谈,回拨受骗

主要对象是公司企业。大概的伎俩是:打电话给你 假装需要你公司的某种产品或服务,数量或总额比较可观,然后让你和他们所谓的领导主管联系,给你一个电话号码,一不留神你拨打过去了,就可能会收取一些信息费,或开通什么声讯服务。

大概的对话:“喂,你好 我在那那看到贵公司可以做XX,我们公司想做一些,请问您这边是怎么操作的,流程和价格是怎么样的呢…..” 当问到具体细节时,骗子可能就答不上来了 ,于是找借口转移“这些我不懂,要不您和我们主管联系一下,我只负责联系的,电话是:95…..   分机号 1 ”

异地合作,蹭吃蹭喝

主要对象也是公司企业,大多以异地合作为主。和上面的境况类似,同样是需要你的某种产品或服务,然后让你上门洽谈,带上具体产品和解决方案。上门洽谈,对方很有诚意的和你谈得差不多的时候,吃饭的时间到了,骗子可能会以请你吃饭为由(或者是大老远的来了还没吃饭,去吃吃地方小吃特色等等),当在饭店吃完后买单的时候,这个时侯毕竟对方是客户,这又是一个维护关系,有助于业务成交的机会,可能会想订单成交后,获得的利润肯定不在乎这点投入吧,于是乎按照常理你应该买单了。吃饱喝足了,头一次肯定签不下,还得等某某确定了,过几天给你消息。(也可能不是吃饭或是买烟等等)

        对于骗取资讯费,开通服务,虽然金额不是很多,但一天之中有几中招了,对于全国而言受骗的数目就可想而知了。特别是包月开通服务的,你很难办,电话是你自己拨过去的,电话单上有记录,你只能取消,当月费用已经收取了,无奈。

         对于以上的几种骗术,千万不要按键,更不要回拨。这时候完全可以发挥搜索引擎的作用,查查他的老底 1.在网上查询对方电话号码。获取相关信息,可能有人已经爆出来避免再次上当;查询号码的归属地,是否和实际相符等等; 2.查询对方公司名称、具体地址的真实,电子邮件,公司电话的真假,或直接打电话查询等等。主要还在于自己多留心,要有一定的防范意识,多查询辨别真伪。

           至于垃圾短信或诈骗信息,很多人都会遇到,对于这些我们可以向运营商或12321举报受理中心举报受理,具体方法如下:

中国移动用户,具体的举报方式是:将垃圾短信发送者的号码置于垃圾短信内容前面,并用星号隔开,然后转发至“10086999”;随后中移动会向用户回复一条短信,表示已收到举报的不良信息,会做出相应处理。

中国联通用户,具体的举报方式是:将垃圾短信发送者号码与垃圾短信内容一起,发送到“10010”;在接到用户举报后,中国联通会回复短信提示用户,已经收到用户的举报,并对短信进行核查。

12321举报受理中心

中国移动、中国联通原有的举报号码,用户在收到垃圾短信时,可以直接转至12321进行举报。同时,用户仍然可以通过移动联通原有平台进行投诉。中国移动用户可以转发至“10086999”,或拨打“10086”举报;中国联通用户如果收到垃圾短信,可以转发至“10010”短信投诉举报平台

原载:winzeng@北京SEO优化博客

原文地址:http://www.winzeng.org.cn/seo/pianzi/
版权所有,转载时必须以链接形式注明作者和原始出处、并保留本声明

SEO(搜索引擎优化), 域外之谈 ,

2008年Google PR最后一次更新

2008年12月31日

           2008年传说中的Google PR最后一次更新,慢慢的觉得Google很本地化,很有趣。一次是五一,另一次是十一国庆又是Google十岁生日,这次是2008年最后一天,元旦的前一天。Google一直在节日给我们喜悦:-) 很体谅人心-站长们&搞网站的弟兄们都不容易啊元旦快乐!Happy   牛 year! 在此祝各位朋友在牛年牛起来,牛气冲天!牛X….. 

google

           小站的PR这次是2,一步一个脚印,稳打稳扎。

PS: 在Google管理员账号中查看链接的时候,发现了几个投机者,对于那些图小利,事后撤去链接的人们,我也不想浪费时间听你的理由或解释,这些玩意你是防不了的,我不可能隔段时间去检查。在此我也悄无声息的去掉你的links,就这样悄无声息的game over吧!出来混的迟早是要还的!

winzeng @ 北京SEO

域外之谈, 计算机&互联网

外公一路走好!

2008年12月31日

           2008.12.28 记下这个日子,此时此刻外公在我我的记忆中涌现了几个片段,您曾经是一位老师,一位村干部,严肃慈祥,在那个年代您是个知识分子,一手好字特别是毛笔字-每年春节您都会帮我们写春联,在一旁看着您边读边写,那是一种享受。拿回您的春联慢慢品读,我在思考哪一副适合贴在门前,哪一副贴在窗前…..在我记忆里最为深刻的是您的微笑,含蓄、淡淡的浅笑、很亲切、迷人。岁月无情,自前年您病了,慢慢的硬朗的身板开始一天不如一天了,慢慢衰退了…… 听说是老年痴呆症,最近两年去看您的时候,依然是那副微笑,最令人很吃惊的是:您依然还记得我,很清楚的认出我来了,说出我的名字!当看到您的样子,非常的心酸,曾经多么硬朗坚定的人,现在蜷缩在床上……马上年底了,本想着为您和外婆带点礼物回去,如今….. 珍惜现在的,您的那一份送给外婆了,相信您不会介意吧。思绪很乱,写不下去了,后期补上。希望您带着微笑,快乐并微笑着,您的微笑永远留在我的心中!

           外公一路走好!               _外甥 朝        2008.12.28

域外之谈

看电视用电脑太久,易致耳鸣

2008年12月12日

          突发性耳聋的病因很多,如病毒感染、迷路水肿,内耳微循环障碍、循环系统疾病和迷路窗膜破裂、生气、坐飞机、过度疲劳、精神紧张、强噪音等。近20年来发病率明显上升。据统计,来我院就诊的突发性耳聋患者中有一部分患者就是因为长时间看电视,使用电脑所致。
          长时间看电视,使用电脑,由于显示器热温过高,就会有相当多的电磁辐射,它会使空气发生电离作用,不断产生正电荷(正离子),并不断与空气中的负离子的含量几乎为零。
        长期处于正离子过多的环境中,它们通过呼吸进入肺,然后随血液、体液呈酸性,延缓身体正常的代谢功能,使毒素囤积在体内,造成人身免疫下降、失眠、女性内分泌  乱皮肤过敏、干眼病、脑功能减弱、耳鸣、  严重者导致听力下降。
         所以长时间看电视,使用电脑的人们一定注意适时适度。工作1小时应 远离电脑15-20分钟,做一些有氧运动,勤洗脸,尽量使用液晶显示器。已经有耳鸣和听力下降的同志看电视每天最好半小时左右,使用电脑半小时到1小时。
        如突然出现听力下降、耳鸣,该及时治疗,治疗方法是中西医结合治疗,治疗方法是中西医结合治疗家针灸配合输液治疗,一般1周康复痊愈便可  。此外,专家建议,耳鸣耳聋患者在治疗过程中每天看电视半小时左右,使用电脑1小时左右。

         健康很重要,身体是革命的本钱!

winzeng @ 北京SEO

SEO(搜索引擎优化), 域外之谈 ,

wordpress 2.7正式发布

2008年12月12日

         WordPress2.7发布了,注意这是正式版,万众瞩目的正式版。其过程还不好意思说,雷声大雨点小,经历了3个beta版本外带两个RC版本,吊足了胃口,真有你的WordPress!

         WordPress2.7结合用户调查和投票的结果,开发团队的精心制作,2.7版拥有全新的个性化用户界面,增加增强了很多功能,是WordPress发展的又一里程。wordpress2.7很好很强大,谁用谁知道!

          WordPress2.7在后台个性化设定、留言、自动更新等等。最大的亮点就是自身集合很多插件功能,这样是WordPress的自身功能更加强大,免除了插件安装、更新、兼容等问题,更大的提升了网页的反应速度,值得提出的是本次2.7版提到了官方中文版,WordPress更进一步的走向中国用户,这也是趋势所在,从WordCamp China 的几场集会就可以看出,WordPress成为世界上最大的blog开源程序,中国用户是不可忽视的。

        WordPress2.7的上线,意味这众多的WordPress插件,WordPress主题将面临更新或遗弃,WordPress之所以受人喜爱,最大的魅力在于全民分享、网聚全民的智慧、思维。在此感谢所有插件、主题的作者,那些乐于分享,默默奉献的人儿!因为分享而快乐。
下载英文版WordPress 2.7:http://wordpress.org/download/

下载中文版WordPress 2.7:http://cn.wordpress.org/download/

winzeng@北京seo  

原文地址: http://www.winzeng.org.cn/seo/wordpress-27/
版权所有,转载时必须以链接形式注明作者和原始出处、并保留本声明

域外之谈, 计算机&互联网

动态网址与静态网址-Google官方建议

2008年11月29日

在跟网络管理员沟通时经常会出现这种情形,一些广为传播的理念可能在过去是正确的,但是可能已不再切合目前的情况了。当我们最近在跟几个朋友谈及关于网址的结构时就碰到这种情况。其中一个朋友很担心动态网址的使用,甚至认为”搜索引擎无法处理动态网址”。另外一个朋友觉得动态网址对搜索引擎来说完全不是问题,那些都是过去的事了。还有一个甚至说他从来都搞不懂动态网址和静态网址相比有什么区别。对于我们来说,这一刻使我们决定要好好研究一下动态网址和静态网址这个话题。首先,让我们来界定一下我们要谈论的主题:

什么是静态网址?
一个静态网址,顾名思义,就是一个不会发生变化的网址,它通常不包含任何网址参数。例如:http://www.example.com/archive/january.htm。您可以在搜索框里输入 filetype:html 在谷歌上搜索静态网址。更新此种类型网址的页面会比较耗费时间,尤其是当信息量增长很快时,因为每一个单独的页面都必须更改编译代码。这也是为什么网站管理员们在处理大型的、经常更新的网站,像在线购物网站、论坛社区、博客或者是内容管理系统时,会使用动态网址的原因。

什么是动态网址?
如果一个网站的内容存储于一个数据库,并且根据要求来显示页面,这时就可以使用动态网址。在这种情况下,网站提供的内容基本上是基于模板形式的。通常情况下,一个动态网址看起来像这样:http://code.google.com/p/google-checkout-php-sample-code/issues/detail?id=31。您可以通过寻找像? = & 这样的符号识别出动态网址。动态网址有一个缺陷是不同的网址可以拥有相同的内容。这样导致不同的用户可能链向含有不同参数的网址,但是这些网址却都含有相同的内容。这也是为什么网络管理员有时候想要将这些动态网址重写成静态网址的原因之一。

我是不是应该让我的动态网址看起来是静态的呢?
在处理动态网址时,希望您能了解以下几点事实:

  1. 要正确地生成和维护从动态网址到静态化网址的重写转变实际上是一件很难的事情。
  2. 将原始的动态网址提供给我们会比较安全,请让我们来处理诸如探测和避开那些有问题的参数的事情。
  3. 如果您想重写网址,请去掉那些不必要的参数,同时请保持它动态网址的样子。
  4. 如果您想提供一个静态网址代替动态网址,那么您应该切实地生成相应的静态内容。

静态和动态网址,Googlebot 对于哪一个识别得更好呢?
我们碰到过很多网站管理员,像我们的朋友那样,认为静态或者看起来是静态的网址对于网站的索引和排名是有优势的。这种看法是基于这样一个假设,即认为搜索引擎在抓取和分析含有会话标识 (session ID) 和来源追踪器 (source tracker) 的网址时是有问题的。然而,事实是,谷歌在这两个方面都有了相当的进展。就点击率来说,静态网址可能略微有些优势,因为用户可以很容易地读懂这个网址。但是,就索引和排名来说,使用数据库驱动网站并不意味着明显的劣势。相比较将参数隐藏以使他们看起来是静态的网址来说,我们更希望网站将动态的网址直接提供给搜索引擎。

现在,让我们来看一些有关动态网址的广为传播的看法,并且来纠正一些蒙蔽网站管理员的假说。:)

传说:”动态网址不能被抓取。”
事实:我们可以抓取动态网址并且解释不同的参数。如果您为了让网址看起来像是静态的,而隐藏那些可以给谷歌提供有价值信息的参数,这样做反而会给该网址的抓取和排名带来麻烦。我们的建议是:请不要将一个动态网址改换格式以使其看起来是静态的。尽可能地使用静态网址来显示静态内容是可取的,但在您决定展示动态内容的情况下,请不要将参数隐藏起来从而使他们看起来像是静态的,因为这样做会删除掉那些有助于我们分析网址的有用信息。

传说:”动态网址的参数要少于3个。”
事实:对于参数的数量是没有限制的。但是,一个好的经验是不要让您的网址太长(这个适用于所有的网址,不论是静态的还是动态的)。您可以去掉一些对于 Googlebot 来说不重要的参数,给用户一个好看一点的动态网址。如果您不能确定可以去掉哪些参数,我们建议您将动态网址中所有的参数都提供给我们,我们的系统会弄明白哪一些是不重要的。将参数隐藏起来会影响我们正确地分析您的网址,我们也就不能识别这些参数,一些重要信息可能也因此丢失了。

下面一些是我们认为您可能会存在疑问的一些问题。

这是否意味着我应该完全避免重写动态网址?
这是我们的建议,除非您能确保您只是去掉多余的参数,或能够把所有有可能有不良影响的参数完整地删除。如果您把自己的动态网址任意修改使其看起来像是静态的,您要清楚这样做是有风险的,有可能会导致有些信息不能被正常地编译和识别。如果您想给您的网站再增加一个静态的版本,请您一定要提供一个真正意义上的静态的内容,比如生成那些可以通过网站相应路径而获取的文件。如果您仅仅是修改了动态网址的表现形式,而没有真正提供静态的内容,那么您有可能适得其反。请直接把标准的动态URL提供给我们,我们会自动找出那些冗余的参数。

你能给我举一个例子么?
如果您有一个像下面这样标准格式的动态网址:foo?key1=value&key2=value2,我们建议您不用改动它,谷歌会决定哪些参数可以去掉;或者您可以为用户去掉那些不必要的参数。不过要慎重,仅仅去掉那些不重要的参数。这里有一个含有多个参数的动态网址的例子:

www.example.com/article/bin/answer.foo?language=en&answer=3&sid=98971298178906&query=URL

  • language=en – 标明这篇文章的语言
  • answer=3 – 这篇文章含有数字3
  • sid=8971298178906 – 会话标识代码是8971298178906
  • query=URL – 使这篇文章被找到的查询是[URL]

并不是所有的参数都提供额外的信息。所以将这个网址重写为www.example.com/article/bin/answer.foo?language=en&answer=3 可能不会引起任何问题,因为所有不相关的参数都去掉了。

下面是一些经过认为修改而看起来像是静态网址的例子。相比较没有重写、直接提供动态网址来说,这些网址可能会引起更多抓取方面的问题。

  • www.example.com/article/bin/answer.foo/en/3/98971298178906/URL
  • www.example.com/article/bin/answer.foo/language=en/answer=3/ sid=98971298178906/query=URL
  • www.example.com/article/bin/answer.foo/language/en/answer/3/sid/ 98971298178906/query/URL
  • www.example.com/article/bin/answer.foo/en,3,98971298178906,URL

如果您将动态网址重写成如上所述的示例的话,可能会导致我们很多不必要的抓取,因为这些网址中都含有会话标识 (sid) 和查询 (query) 参数的可变值,这无形中生成了很多看起来不同的 URL ,而他们包含的内容却是相同的。这些格式让我们很难理解通过这个网址返回的实际内容和参数URL以及98971298178906是无关的。不过,下面这个重写的例子却将所有无关的参数都去掉了:

  • www.example.com/article/bin/answer.foo/en/3

尽管我们可以正确地处理这个网址,我们还是不鼓励您使用这样的重写。因为它很难维护,而且一旦一个新的参数被加到原始的动态网址,那么这个网址就需要马上更新。不这样做的话就会再次导致生成一个隐藏了参数的貌似静态网址的 URL 。所以最好的解决方法是通常将动态网址保持他们原来的样子。或者,如果您去掉不相关的参数,请记住一定要保持这个网址是动态的:

  • www.example.com/article/bin/answer.foo?language=en&answer=3

我们希望这篇文章能够对您和我们的朋友有帮助,使围绕动态网址的各种推测清晰化。如果您有更多的问题的话,欢迎加入我们的网站管理员支持论坛进行讨论。

winzeng@北京seo转自 Google黑板报 原文:动态网址与静态网址

SEO(搜索引擎优化) ,

『转』云计算(cloud computing)10问

2008年11月29日

            云计算这个新名词最近甚嚣尘上,最近周围不少朋友都在谈,有必要写一个关于云计算的科普了。

 

         一般的业界比较喜欢用一些新名词来体现自己的战略眼光和与对手的区隔。当几个月前google提出云计算的概念的时候,amazon说自己做的事情就是云计算,IBM、intel、sun都声称自己在云计算领域有深刻的计划。只可惜大家听了半天仍然不知道什么是云计算,依旧云里雾里知道这个与计算有关,干脆就叫“云计算”吧。

到底云计算是什么呢?

        这个问题不好回答,专业一点的回答是:云计算是依靠强大的计算能力,使得成千上万的终端用户不担心所使用的计算技术和接入的方式等都能够进行有效的依靠网络连接起来的硬件平台的计算能力来实施多种应用。

        非专业一点的回答就是,一堆你不需要搞清楚的硬件、软件在服务你。这堆硬件和软件构成的东东大的像朵云彩,又拥有极强的计算能力,这就叫云计算。

那么云计算是怎么来的?我们为什么又需要云计算?

1. 云计算的前身是grid computing ,说起grid computing 可能知道的人就很多了,就是传统的网格计算。网格计算就是将一个计算分割成片段,提交到网络系统上的各个计算机上(格点),工作做好进行汇总完成。比较流行的软件例如globe bus + afs(提供存储映射服务)。不过grid一般都是用在学术界,例如cern的几个实验都采用了大规模的grid计算,例如进行新粒子的发现,需要处理t级别的数据,单台计算机的运算和存储显然是不可能完成的,因此就必须使用网格计算了。

2. 云计算有实实在在的例子么?很幸运,我们还可以找到几个:google appengine,Amazon的S3+EC2系统都是云计算的雏形。

3. 云计算的基础是什么?最基本的需求:存储+处理器,当然,要支持无数的应用请求并负责保证存储和计算的性能,这两方面都是挑战。

4. 我自己能够搭建一个云计算环境么?当然可以,我们可以利用开源的项目来搭建一个云计算环境:你可以利用hadoop+hbase+php(包装API)也许就实现一个简单的云计算环境。

5. 有没有更简单的例子?也许一个分布式的邮件系统就是一个云计算的雏形:计算分布在各个节点上,应用(邮件收发)通过一个统一的平台来处理,也算是符合云计算的定义了,不过只能支持最简单的一种固定应用。

6. 有没有复杂一点的例子?google的云计算的逻辑关系:gfs 实现存储,bigtable 实现结构化、半结构化数据存储,map/reduce 实现将分布在各个节点上的计算和merage起来,剩下的就是进行job的管理器,管理工作的提交和触发,然后就是我们看到的appengine了。

7. 应该关注哪些软件?hadoop 项目应该是一个比较有前途的一个,当然powerset在hadoop之上的Hbase应该是一个更接近能够替代简单database的应用。

8.我们为什么需要云计算?很简单,企业的雄心+个人电脑性能进展缓慢+我们处在数据指数膨胀的年代。当我们在google上提交一个搜索的时候,会有成千上万的计算机被卷入这一个简单的一个查询过程中,未来的计算越来越庞大,到了我们干脆说“云”来替代其中的一切细节的时候。

9. 云计算平台的下一步呢?云计算api的标准化也许是一个最需要进行竞争的,可惜基础的技术平台的完善还需要时日,而且云计算未来也许会是免费的,这个遵从“竞争导致利润下降”的原则,难度不是么?当更多的云计算平台出现的时候,然而跑在云上的应用却没有那么多,当然免费的午餐就会来。

10. 还有更有趣的么?当然,你可以提供一个云计算,利用google,amazon的云计算包含在你自己的云计算里,然后提供一个统一的api,或者也许未来的云计算会整合在一个,云里雾里,成为一个超大的云计算平台,那个时候,也许自己家的电脑也可以接入云计算平台成为其中的一个计算的提供者。这个听起来很有意思,不过13年前就已经存在了,那个分布在全球电脑上的寻找外星et的屏保就是一个云计算的平台,如果他们该行做云计算的话,估计能够盖过google和amazon。

winzeng转自 搜索引擎研究 Life or Data原文: http://www.wespoke.com/2008/05/cloud-computing10.html

域外之谈, 计算机&互联网