Posts Tagged ‘web20’

浅谈中国Web2.0网站萧条

星期天, 九月 7th, 2008

写这篇文章的时候之前,正巧赶上我博客所用的两个Web2.0服务:Clicki的统计和Feedsky的订阅双双出现服务器问题,登陆Feedsky,首页居然还提示Mysql连接错误,过了好久还没有修复好。

中国的Web2.0的网站本来就比较少,特别是原创型的,像一大批基于Ucenter构建的SNS网站就不纳入讨论范围内了。讲一讲我认为好的Web2.0网站,关键在于有创意,想法好。我的博客好友趣站酷软,一直在推荐一些有创意的Web2.0类型的网站,这些网站共有的特点就是你平时想不到还有这样的网站,但一旦用起来也算比较有趣的。

我看过的国内Web2.0网站数量极为有限,豆瓣,芝麻,百度知道,Clicki,Feedsky,鲜果等RSS阅读器,土豆等视频网站。当然还有好大一部分是跟风国外的网站建起来的,像校内网,整个就是Facebook的中文版,最近改版也是担心版权问题。

国内的Web2.0网站生存得并不好(这里指真正意义上的Web2.0网站),这是由于中国特定的市场环境所决定的。中国人缺乏创新意识,抄袭能力强,所以国内的网站多垃圾站,我曾经说过,三大门户是中国最大的垃圾站。再说技术性的网站CSDN.net,我在百度中搜索某个问题的时候,往往出现了一排标题都是相同的,点进去内容也完全相同,不同的是垃圾站的广告是满天飞,CSDN的略微好点,也是到处飘。Google的搜索结果也类似。这里不说搜索引擎辨别镜像的能力差,单说那么多的“镜像”网站就可以看出我们的市场环境。

再说说中国的网民结构,大家都清楚,中国人最喜欢上的网站是百度,因为那里搜索八卦新闻比较容易,中国人最喜欢的博客是QQ空间,因为那里的人物衣服、场 景很炫,中国最流行的CMS系统里就看谁的采集能力强,美国人利用互联网办公,看新闻。中国的网民素质略低,从各个论坛不绝于耳的国骂、问候他娘的留言也 可以看出的,虽然我不敢说美国人素质有多高。什么样的网民素质决定了互联网发展的潜力。纵然中国互联网网民超过了美国,但各个都只懂得开QQ,上百度,中 国的互联网水平能超过美国吗?我记得以前的初中的计算机教材里有提及,互联网上的中文网站、中文资源仅占1%,而英文资源占了90%,所以我们要学好计算 机……我现在倒觉得这是应该的,要是某一天中文资源超过了英文资源那才是可悲的事。

广告市场是网站赖以生存的基础。国内的广告市场大家都很了解,很多“弹窗联盟”,“挂马联盟”,依靠点击广告的联盟也就是这一两年才兴起的阿里妈妈,看看 美国的广告市场,多的是“优雅”的点击广告、文字链接广告,极少有“弹窗联盟”之类的广告联盟。当然,这是我们的消费习惯决定的,网民对互联网广告的不信 任以及浏览习惯等决定了中国网民不喜欢点击文字的广告,而喜欢被弹窗广告QJ。

扯远了,回到Web2.0网站,Web2.0网站不同于以往的垃圾站的模式,在盈利方面有许多的限制,Web2.0网站的广告不能多,否则对于网站的推广是极为不利的。试想一下,某个Web2.0网站,虽然它的服务很实用,但广告绝不亚于三大门户首页的广告,有网友会接受吗?

Web2.0本身的特点限制了Web2.0的发展,所以有专家说,Web2.0网站的最好结局就是被大公司收购,比如被Google收购的Feedburner,被雅虎收购的Delicious。中国缺少这样的大公司,如果提到能上台面的收购,百度收购Hao123可以算一个,可惜,Hao123真的不能算Web2.0网站。而且,相比国外盛行的收购,国内大型网站要是看到某个网站有前途,首先想到的是自己也模仿一个,而不是花高价去收购。国内做模仿不需要有法律代价,而美国不同。

中国Web2.0网站的萧条是由这个整体决定的,网民的素质、广告市场的成熟、行业领导者的素质(比如百度、QQ、三大门户,他们的素质怎样大家都清楚)都是决定者,可以说,Web2.0的命运还不是把握在自己手中。

Technorati API教程

星期三, 七月 23rd, 2008

最近在做一个WP插件,需要用到一些博客的排名等信息,ALEXA也提供,Technorati也有,但权衡一下,还是决定用Technorati的数据更好。Technorati是一家比较专注于WEB2.0的博客网站,它提供了博客搜索、博客排名、反向链接搜索、TAG归类搜索等服务。相比Alexa的工具条统计,它依据博客的反向链接等数据进行排名,数据更加客观。

选择Technorati更重要的是Technorati提供了完整的API接口以供应用,虽然ALEXA也提供了接口,却是要收费的,似乎是千次查询$0.1,这让大多数非商业应用的人无法接受。当然Alexa也有几个工具栏的接口被破解后可以盗用,不过个人认为Technorati的数据质量要好于Alexa,决定在插件中使用Technorati的数据。

使用Technorati,先要注册一个Technorati账户,接着访问http://technorati.com/developers/apikey.html,免费获取一个API KEY 如 dfe71294d89ebbca982c98ecd73c96d5 ,正常情况下,一个API KEY每天可以查询500次,这对于一个WP插件应该是足够应用了。


API KEY

如何应用?Technorati提供了包括博客信息,博客搜索,博客反向链接在内的多种搜索服务的接口,可以访问这里获得更多信息。


Technorati提供的接口类型

以我需要用到的博客信息为例

访问http://api.technorati.com/bloginfo?key=[apikey]&url=[blog url],其中[apikey]替换为API KEY,[blog url]就是要查询的博客URL,如 http://photozero.net (http:// 可省略),在PHP文件中用 file_get_contents() 或 fsockopen() 等方式访问,获取返回内容如:

  1. <?xml version="1.0" encoding="utf-8"?>
  2. <!-- generator="Technorati API version 1.0" -->
  3. <!DOCTYPE tapi PUBLIC "-//Technorati, Inc.//DTD TAPI 0.02//EN" "http://api.technorati.com/dtd/tapi-002.xml">
  4. <tapi version="1.0">
  5. <document>
  6. <result>
  7. <url>http://photozero.net</url>
  8. <weblog>
  9. <name>零号相册</name>
  10. <url>http://photozero.net</url>
  11.  
  12. <rssurl>http://photozero.net/feed/rss/</rssurl>
  13. <atomurl>http://photozero.net/feed/</atomurl>
  14. <inboundblogs>16</inboundblogs>
  15. <inboundlinks>23</inboundlinks>
  16. <lastupdate>2008-07-20 03:52:34 GMT</lastupdate>
  17. <rank>446726</rank>
  18.  
  19. <authors>
  20. </authors>
  21. </weblog>
  22. <inboundblogs>16</inboundblogs>
  23. <inboundlinks>23</inboundlinks>
  24. </result>
  25. </document>
  26. </tapi>

这里面包括了博客名,博客URL,博客排名,博客RSS地址,反向链接等多种信息,是不是很齐全?

再来一个博客TAG搜索的示范,显示你的博客里有哪些热门TAG,访问
http://api.technorati.com/blogposttags?key=[apikey]&url=[blog URL]
照例把[apikey]替换为API KEY,把[blog URL]替换为 http://photozero.net,就会返回我的博客中的TAG(分类也算在TAG里面了)

  1. <?xml version="1.0" encoding="utf-8"?>
  2. <!-- generator="Technorati API version 1.0 /blogposttags" -->
  3. <!DOCTYPE tapi PUBLIC "-//Technorati, Inc.//DTD TAPI 0.02//EN" "http://api.technorati.com/dtd/tapi-002.xml">
  4. <tapi version="1.0">
  5. <document>
  6. <result>
  7. <querycount>20</querycount>
  8. </result>
  9. <item>
  10. <tag>Free Talk</tag>
  11. <posts>17</posts>
  12. </item>
  13. <item>
  14. <tag>wordpress</tag>
  15.  
  16. <posts>13</posts>
  17. </item>
  18. <item>
  19. <tag>Free_talk</tag>
  20. <posts>9</posts>
  21. </item>
  22. <item>
  23. <tag>Plugin</tag>
  24. <posts>7</posts>
  25. </item>
  26. <item>
  27. <tag>WAP</tag>
  28.  
  29. <posts>6</posts>
  30. </item>
  31. <item>
  32. <tag>PHP</tag>
  33. <posts>5</posts>
  34. </item>
  35. <item>
  36. <tag>Server</tag>
  37. <posts>4</posts>
  38. </item>
  39. <item>
  40. <tag>Mobile</tag>
  41.  
  42. <posts>3</posts>
  43. </item>
  44. <item>
  45. <tag>Baidu</tag>
  46. <posts>2</posts>
  47. </item>
  48. <item>
  49. <tag>Blog</tag>
  50. <posts>2</posts>
  51. </item>
  52. <item>
  53. <tag>Google</tag>
  54.  
  55. <posts>2</posts>
  56. </item>
  57. <item>
  58. <tag>Javascript</tag>
  59. <posts>2</posts>
  60. </item>
  61. <item>
  62. <tag>Yahoo</tag>
  63. <posts>2</posts>
  64. </item>
  65. <item>
  66. <tag>chinese</tag>
  67.  
  68. <posts>2</posts>
  69. </item>
  70. <item>
  71. <tag>DreamHost</tag>
  72. <posts>2</posts>
  73. </item>
  74. <item>
  75. <tag>web20</tag>
  76. <posts>1</posts>
  77. </item>
  78. <item>
  79. <tag>Ajax</tag>
  80.  
  81. <posts>1</posts>
  82. </item>
  83. <item>
  84. <tag>Apple</tag>
  85. <posts>1</posts>
  86. </item>
  87. <item>
  88. <tag>iPhone</tag>
  89. <posts>1</posts>
  90. </item>
  91. <item>
  92. <tag>IP</tag>
  93.  
  94. <posts>1</posts>
  95. </item>
  96. </document>
  97. </tapi>

好了,其他几种应用就不多介绍了,如果有需要应用相关服务的不妨一试。这里推荐一个老外Kailash Nadh写的Technorati API应用的PHP类——Duck Soup,到他主页下载这个库,里面包含了一个应用范本,用这个代码就可以轻松应用Technorati服务了,不用再自己弄一些fsockopen的下载类了。

PHP识别Robot(Spider,机器人,搜索引擎)函数

星期三, 七月 16th, 2008

最近有想做一些有趣的网站的想法,但由于时间不充足,只是光想,没有去做,但部分所需的函数还是利用课余时间想好了,也顺便分享出来,方便大家使用。

很多Web2.0网站采用了AJAX构造,这样对搜索引擎不是很友好,这里就提供一个识别各个搜索引擎的函数,在判断是搜索引擎后转入专门为搜索引擎提供的页面,方便搜索引擎收录。

  1. function is_bot(){
  2.     $ua = strtolower($_SERVER['HTTP_USER_AGENT']);
  3.     $botchar = "/(bot|crawl|spider|slurp|yahoo|sohu-search|lycos|robozilla)/i";
  4.     if(preg_match($botchar, $ua)) {
  5.         return true;
  6.     }else{
  7.         return false;
  8.     }
  9. }

这是利用了搜索引擎的USER_AGENT进行判断,像Google的UA为GoogleBot,百度的为Baiduspider,基本上所有的搜索引擎都会增加这些字符以表明Robot的身份。

  1. if(is_bot()){
  2.     readfile('for-robot.html');
  3. }else{
  4.     include('index2.php');
  5. }

在使用时,判断是否机器人进行不同操作。

UIMARK 开发进度

星期天, 十一月 11th, 2007

Uimark.com Alpha2 版正在开发中,这个版本对原来的 www.uimark.com 做了很大的调整,主要在于用户界面更清爽了,更加Web2.0一些,用户体验也会更好一些。尚未登录的时候要添加书签,就会自动弹出一个登陆框,但不是在用户的浏览器上弹出,而是借助于页面的JavaScript+CSS控制层弹出,QQ书签,百度搜藏等也是用这种方法的,但这样做很大的问题就是不可能兼容所有的浏览器,比如百度搜藏的,在IE7下惨不忍睹,而QQ搜藏的比较不错,当然,我的也还行啦,做这个很辛苦,要在IE6,IE7,Firefox等主流浏览器下都适应才行,发个截图先:

ie6.jpg

下次有空再把部分代码贴出来讲解。