<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>听者有心 &#187; SEO</title>
	<atom:link href="http://www.nupt.org/category/seo/feed" rel="self" type="application/rss+xml" />
	<link>http://www.nupt.org</link>
	<description>Soz @ Nupt</description>
	<lastBuildDate>Fri, 20 Feb 2009 11:32:09 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.8.4</generator>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>免费获得英文原创：免费重写英文文章</title>
		<link>http://www.nupt.org/181</link>
		<comments>http://www.nupt.org/181#comments</comments>
		<pubDate>Thu, 14 Aug 2008 08:22:58 +0000</pubDate>
		<dc:creator>Soz</dc:creator>
				<category><![CDATA[SEO]]></category>
		<category><![CDATA[英文原创]]></category>
		<category><![CDATA[原创工具]]></category>

		<guid isPermaLink="false">http://www.nupt.org/181</guid>
		<description><![CDATA[为什么这么说呢？因为，使用这个工具制作出来的内容完全是不适合人类阅读的。说白了，就了为了获得搜索引擎认为的爬虫。就是与机器程序玩迷惑的工具。]]></description>
			<content:encoded><![CDATA[<p>首先，必须注明：使用此工具，完全是最后的选择。</p>
<p>为什么这么说呢？因为，使用这个工具制作出来的内容完全是不适合人类阅读的。说白了，就了为了获得搜索引擎认为的爬虫。就是与机器程序玩迷惑的工具。</p>
<p>说了这么多，就把资源公布出来吧。BadArticle Article Rewrite就是今天要介绍的工具。</p>
<p>为了使用这个工具，要求你必须使用IE浏览器，还有，你的电脑上必须装有MS的Word。</p>
<p>地址是：三大不留点badarticle点com。 <img src='http://www.nupt.org/wp-includes/images/smilies/icon_smile.gif' alt=':-)' class='wp-smiley' /> </p>
<p>这里再次提醒大家，如果你的英文站是垃圾站，那即可大胆的使用此工具，如果你不想制作垃圾站，那就不要管这个工具了。</p>
<h3  class="related_post_title">读过此篇文章的读者也读过：</h3><ul class="related_post"><li><a href="http://www.nupt.org/154" title="2008欧洲杯预测">2008欧洲杯预测</a></li><li><a href="http://www.nupt.org/22" title="Google Adesnes 新功能预告">Google Adesnes 新功能预告</a></li><li><a href="http://www.nupt.org/152" title="高考和端午节">高考和端午节</a></li><li><a href="http://www.nupt.org/82" title="推荐一个WP的投票插件：WP-PostRating">推荐一个WP的投票插件：WP-PostRating</a></li><li><a href="http://www.nupt.org/31" title="Gmail升级">Gmail升级</a></li><li><a href="http://www.nupt.org/64" title="完成了两个网页">完成了两个网页</a></li><li><a href="http://www.nupt.org/196" title="CSSmania开放API">CSSmania开放API</a></li><li><a href="http://www.nupt.org/13" title="FLEAshop程序分析(一)">FLEAshop程序分析(一)</a></li><li><a href="http://www.nupt.org/86" title="谷歌热榜推出免费发送拜年短信">谷歌热榜推出免费发送拜年短信</a></li><li><a href="http://www.nupt.org/159" title="Joomla插件管理">Joomla插件管理</a></li></ul>]]></content:encoded>
			<wfw:commentRss>http://www.nupt.org/181/feed</wfw:commentRss>
		<slash:comments>5</slash:comments>
		</item>
		<item>
		<title>关于关键词密度</title>
		<link>http://www.nupt.org/98</link>
		<comments>http://www.nupt.org/98#comments</comments>
		<pubDate>Tue, 26 Feb 2008 15:20:36 +0000</pubDate>
		<dc:creator>Soz</dc:creator>
				<category><![CDATA[SEO]]></category>
		<category><![CDATA[关键词密度]]></category>

		<guid isPermaLink="false">http://www.nupt.org/98</guid>
		<description><![CDATA[很多人都在讨论关键词密度应该维持在什么范围之内比较好，甚至还有人特意的开发出来的检查关键词密度工具，也有人说关键词密度应该从2%-8%之内比较正常，还有人特意的利用工具检查每个页面的关键词密度。]]></description>
			<content:encoded><![CDATA[<p>很多人都在讨论关键词密度应该维持在什么范围之内比较好，甚至还有人特意的开发出来的检查关键词密度工具，也有人说关键词密度应该从2%-8%之内比较正常，还有人特意的利用工具检查每个页面的关键词密度。<strong>问题是：有必要吗？</strong></p>
<p><strong>答案是：没必要。</strong></p>
<p><img src="http://pic.yupoo.com/dxlk/631695242b80/medium.jpg"/> </p>
<p>让我们来想想，为什么我会说没有必要。</p>
<p>我想解释一下为什么会有2%-8%这个数据。如果没有搜索引擎，那我们肯定会全心全意的为用户体验去写一篇文章（其实有搜索引擎，我们也应该这样做）。于是，关于文章的话题，肯定就会有关键词的重复出现。搜索引擎就是根据我们的正常写作，利用大量的研究成果，得到正常写作关于主题的关键词的密度，然后，才把这个密度数值作为搜索引擎算法中的一部分。</p>
<p>所以，回归到正常的写作，回归到用户良好的体验写作，就不用去考虑关键词密度了。</p>
<p>但是，知道关键词密度也是有好处的，因为这可以避免你不会因关键词密度过高而被搜索引擎处罚。</p>
<h3  class="related_post_title">相关文章：</h3><ul class="related_post"><li><a href="http://www.nupt.org/211" title="欢迎你，2009">欢迎你，2009</a></li><li><a href="http://www.nupt.org/185" title="好书推荐:解密SEO,搜索引擎优化">好书推荐:解密SEO,搜索引擎优化</a></li><li><a href="http://www.nupt.org/84" title="外链建设（二）">外链建设（二）</a></li><li><a href="http://www.nupt.org/74" title="推荐5个英文SEO博客">推荐5个英文SEO博客</a></li><li><a href="http://www.nupt.org/72" title="南京点石茶话会有感">南京点石茶话会有感</a></li><li><a href="http://www.nupt.org/32" title="SEO之目的">SEO之目的</a></li><li><a href="http://www.nupt.org/25" title="驳：一种网站的新形式？">驳：一种网站的新形式？</a></li><li><a href="http://www.nupt.org/21" title="翻译《The Art of the Content Site》第五波">翻译《The Art of the Content Site》第五波</a></li><li><a href="http://www.nupt.org/20" title="翻译《The Art of the Content Site》第四波">翻译《The Art of the Content Site》第四波</a></li><li><a href="http://www.nupt.org/19" title="翻译《The Art of the Content Site》第三波">翻译《The Art of the Content Site》第三波</a></li></ul>]]></content:encoded>
			<wfw:commentRss>http://www.nupt.org/98/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>关于删除最新的两篇文章的说明</title>
		<link>http://www.nupt.org/85</link>
		<comments>http://www.nupt.org/85#comments</comments>
		<pubDate>Sun, 27 Jan 2008 08:26:27 +0000</pubDate>
		<dc:creator>Soz</dc:creator>
				<category><![CDATA[SEO]]></category>
		<category><![CDATA[google]]></category>
		<category><![CDATA[收录]]></category>

		<guid isPermaLink="false">http://www.nupt.org/85</guid>
		<description><![CDATA[为什么要删除前两篇文章，因为Google拒绝收录！]]></description>
			<content:encoded><![CDATA[<p>大家好，最近 <a href="http://www.nupt.org">Soz</a> 翻译了一篇关于外链建设的文章，但是迟迟不见对其进行Google收录。更令听者有心不安的是，本博客的PR值瞬间降为0。</p>
<p>在查看了服务器日志之后，Soz确认Google的爬虫应该是来到过本站的。因此</p>
<p>，Soz就怀疑是这两篇日志的作用。</p>
<p>现在，Soz怀疑是不是因为日志中出现了大量的外链网站，从而使Google不收录这两篇文章呢？还是有别的原因？</p>
<p>目前Soz正在观察中，希望这篇文章能够被收录！</p>
<h3  class="related_post_title">相关文章：</h3><ul class="related_post"><li><a href="http://www.nupt.org/69" title="巧用Google地图展示公司形象">巧用Google地图展示公司形象</a></li><li><a href="http://www.nupt.org/36" title="谷歌的域名情况">谷歌的域名情况</a></li><li><a href="http://www.nupt.org/33" title="google.cat？">google.cat？</a></li><li><a href="http://www.nupt.org/31" title="Gmail升级">Gmail升级</a></li><li><a href="http://www.nupt.org/29" title="Gmail向全体用户推出了IMAP！">Gmail向全体用户推出了IMAP！</a></li></ul>]]></content:encoded>
			<wfw:commentRss>http://www.nupt.org/85/feed</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
		<item>
		<title>外链建设（二）</title>
		<link>http://www.nupt.org/84</link>
		<comments>http://www.nupt.org/84#comments</comments>
		<pubDate>Sat, 26 Jan 2008 18:16:33 +0000</pubDate>
		<dc:creator>Soz</dc:creator>
				<category><![CDATA[SEO]]></category>
		<category><![CDATA[链接建设]]></category>
		<category><![CDATA[外链]]></category>

		<guid isPermaLink="false">http://www.nupt.org/84</guid>
		<description><![CDATA[外链建设之二，主要设计到提交到新闻源,提交到社会网络,参加链接项目,获得edu和org的链接,论坛和博客的链接,提交到社会化书签。希望这些对你的外链建设有所帮助。]]></description>
			<content:encoded><![CDATA[<p>上篇日志讲的是外链建设（一），现在继续翻译第二部分。</p>
<p>作者：Dan08    <br />
来源：<a href="http://www.blackhatworld.com/blackhat-seo/white-hat-seo/3391-link-building-tips.html">http://www.blackhatworld.com/blackhat-seo/white-hat-seo/3391-link-building-tips.html</a></p>
<p><strong>提交到新闻源</strong></p>
<p>在新闻源网站上写上你网站的文章，或者就写某些部分。然后提交到新闻源服务商。（这一点，大家可以想到百度新闻）</p>
<p><strong>社会网络</strong></p>
<p>像<a href="http://www.myspace.com">www.myspace.com</a>就是非常有用的，它不仅可以得到链接，更可以获得巨大的流量。还有一个好处就是，你在上面交到了成千上百个朋友，然后你就有机会使他们成为你的顾客。</p>
<p>参加社交网络在今天被证实是很有好处的一件事情。现在就有很多这样的网站。例如国内的<a href="http://www.nupt.org/59">校内网</a>等。</p>
<p><strong>参加链接项目（不是买卖链接）</strong></p>
<p>再次强调：这里说的不是买卖链接！</p>
<p>比如，你帮助了别的站长获得了一个对他来说相关性非常高的链接（原因就是很有可能你认识这个相关性非常高的站的站长），这样，那个站长为了感谢你，就会帮助你！这听起来非常不错，对吧！</p>
<p><strong>从 .edu 和 .org 的网站获得链接</strong></p>
<p>教育网站和公益性的组织网站通常被认为有比较高的权重。为了得到这些宝贵的链接，你有必要搜索他们。</p>
<p><strong>论坛和博客的链接</strong></p>
<p>找到一些很你网站相关的论坛或者博客。留一些评论，当然前提是你要认真的看完文章，不要让主人以为你是在SPAM。</p>
<p>有些时候一些论坛会有一些很火的帖子。如果你能抢到沙发，甚至你就是发帖的人，那就更好了。在论坛的签名处留下自己的网站。</p>
<p>努力吧，你会获得很多有价值的链接的！</p>
<p><strong>提交到社会化书签网站</strong></p>
<p>现在大家都热衷于社会化书签（说到这里，作者调侃说要做社会化书签服务&hellip;&hellip;<a href="http://www.nupt.org">Soz</a>注）</p>
<p>对于社会化书签网站，是用户共同存贮了一个互联网的资源库，而这些资源都是对用户有用的。提交到社会化书签已经成了<a href="http://www.nupt.org/category/seo">SEO</a>的一种新方法。</p>
<p>好了，一些国外的网站列表还没有列出来，就翻译到这里，希望对你有所帮助：）</p>
<h3  class="related_post_title">相关文章：</h3><ul class="related_post"><li><a href="http://www.nupt.org/211" title="欢迎你，2009">欢迎你，2009</a></li><li><a href="http://www.nupt.org/185" title="好书推荐:解密SEO,搜索引擎优化">好书推荐:解密SEO,搜索引擎优化</a></li><li><a href="http://www.nupt.org/175" title="回馈读者：送PR4外链">回馈读者：送PR4外链</a></li><li><a href="http://www.nupt.org/98" title="关于关键词密度">关于关键词密度</a></li><li><a href="http://www.nupt.org/74" title="推荐5个英文SEO博客">推荐5个英文SEO博客</a></li><li><a href="http://www.nupt.org/72" title="南京点石茶话会有感">南京点石茶话会有感</a></li><li><a href="http://www.nupt.org/32" title="SEO之目的">SEO之目的</a></li><li><a href="http://www.nupt.org/25" title="驳：一种网站的新形式？">驳：一种网站的新形式？</a></li><li><a href="http://www.nupt.org/21" title="翻译《The Art of the Content Site》第五波">翻译《The Art of the Content Site》第五波</a></li><li><a href="http://www.nupt.org/20" title="翻译《The Art of the Content Site》第四波">翻译《The Art of the Content Site》第四波</a></li></ul>]]></content:encoded>
			<wfw:commentRss>http://www.nupt.org/84/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>外链的建设（一）</title>
		<link>http://www.nupt.org/83</link>
		<comments>http://www.nupt.org/83#comments</comments>
		<pubDate>Sat, 26 Jan 2008 09:18:13 +0000</pubDate>
		<dc:creator>Soz</dc:creator>
				<category><![CDATA[SEO]]></category>
		<category><![CDATA[链接]]></category>
		<category><![CDATA[外链建设]]></category>

		<guid isPermaLink="false">http://www.nupt.org/83</guid>
		<description><![CDATA[外链建设如何进行？外链建设有哪些方法？在这篇文章中，都将一一为你揭开。]]></description>
			<content:encoded><![CDATA[<p>想想这几天为了别的项目，也有几天没有更新<a href="http://www.nupt.org">听者有心</a>了。所以，Soz找了一篇<strong>外链建设</strong>的文章，并做了大意翻译。</p>
<p>作者：Dan08   <br />
来源：<a title="http://www.blackhatworld.com/blackhat-seo/white-hat-seo/3391-link-building-tips.html" href="http://www.blackhatworld.com/blackhat-seo/white-hat-seo/3391-link-building-tips.html">http://www.blackhatworld.com/blackhat-seo/white-hat-seo/3391-link-building-tips.html</a></p>
<p>众所周知，如果一一的去跟别的站交换链接，那么链接的建设是非常累的。这里，我将说几个链接建设的技巧和介绍几个资源，希望能让你有所收获。</p>
<p><strong>提交到目录网站</strong></p>
<p>慢慢的长期的把你的网站提交到目录网站，这是任何一个网站都必须做的一个长期的任务。在你的网站推出之后的第一天，就必须开始这项任务。这里有一些免费，单向的目录网址（Soz注：这些都是国外的）：</p>
<blockquote>
<p><a href="http://www.dmoz.org">http://www.dmoz.org</a> 9      <br />
<a href="http://www.lii.org/pub/htdocs/home.htm">http://www.lii.org/pub/htdocs/home.htm</a> 8      <br />
<a href="http://www.femina.com">http://www.femina.com</a> 7      <br />
<a href="http://www.gogreece.com">http://www.gogreece.com</a> 7      <br />
<a href="http://www.sacentral.sa.gov.au/site/page.cfm">http://www.sacentral.sa.gov.au/site/page.cfm</a> 7      <br />
<a href="http://www.worldhot.com/">http://www.worldhot.com/</a> 7      <br />
<a href="http://www.123india.com/">http://www.123india.com/</a> 7      <br />
<a href="http://www.elib.org/">http://www.elib.org/</a> 7      <br />
<a href="http://www.ezilon.com/">http://www.ezilon.com/</a> 6      <br />
<a href="http://www.epooch.com/">http://www.epooch.com/</a> 6      <br />
<a href="http://www.christiansunite.com/">http://www.christiansunite.com/</a> 6      <br />
<a href="http://www.toronto1.biz/">http://www.toronto1.biz/</a> 6      <br />
<a href="http://www.canadianeh.com">http://www.canadianeh.com</a> 6      <br />
<a href="http://www.aardvark.co.za">http://www.aardvark.co.za</a> 6      <br />
<a href="http://www.nzs.com/">http://www.nzs.com/</a> 6      <br />
<a href="http://www.aigam.com">http://www.aigam.com</a> 6</p>
</blockquote>
<p>这里为了考虑到文章的长度，只列出了这么些目录网站。</p>
<p><strong>互惠链接建设</strong></p>
<p>联系相关网站的站长，请求他们跟你做友情链接。E-mail的格式要写的人性化（Soz注：不要让邮件看起来跟SPAM似的）。如果能在信中说一些交换链接的好处，成功的可能性会更高，提及好的质量和好的PR，总是有好处的。</p>
<p><u>不要忘记链接的三个要素</u>：（1）URL （2）Title（3）Descripton</p>
<p>现在，主要的任务就是去好的网站了。方法：在<a href="http://www.nupt.org/tag/google">Google</a>或者百度上搜索 关键字 友情链接；关键字 申请友情链接 之类的话。</p>
<p><strong>软文</strong></p>
<p>直接说成是软文了，呵呵。写有质量的文章，内容要对读者有用。然后发表到相关的权重高的网站。</p>
<p>软文当然要加网站的链接进去了。这样可以：（1）带来一定的流量 （2）外链的建设。   <br />
坦白的说，只要软文的质量可以，效果在一两天就可以看得出来，而且非常好。</p>
<p>有些时候提交软文就跟提交到目录网站一样，需要频繁操作。甚至有的时候你需要联系一些你提交软文的网站站长，你有必要告诉他为什么他的网站需要放你的文章。</p>
<p>这里，Soz也考虑到文章的长度，把标题改成之一了，第二部分就放在下篇文章发表好了。</p>
<h3  class="related_post_title">读过此篇文章的读者也读过：</h3><ul class="related_post"><li><a href="http://www.nupt.org/215" title="使用ScribeFire离线撰写博客">使用ScribeFire离线撰写博客</a></li><li><a href="http://www.nupt.org/20" title="翻译《The Art of the Content Site》第四波">翻译《The Art of the Content Site》第四波</a></li><li><a href="http://www.nupt.org/3" title="Blog搭好了,膝盖也受伤了">Blog搭好了,膝盖也受伤了</a></li><li><a href="http://www.nupt.org/92" title="drupal6.0正式版释出">drupal6.0正式版释出</a></li><li><a href="http://www.nupt.org/67" title="听者有心加入FeedSky的博客圈&#8211;SEO博客圈">听者有心加入FeedSky的博客圈&#8211;SEO博客圈</a></li><li><a href="http://www.nupt.org/56" title="SEO知识：中文分词 一篇关于中文分词算法的SEO必看文章">SEO知识：中文分词 一篇关于中文分词算法的SEO必看文章</a></li><li><a href="http://www.nupt.org/118" title="Joomla广告管理">Joomla广告管理</a></li><li><a href="http://www.nupt.org/187" title="线下的生意">线下的生意</a></li><li><a href="http://www.nupt.org/200" title="1个多月没有更新博客">1个多月没有更新博客</a></li><li><a href="http://www.nupt.org/40" title="记本团第一届全会盛况">记本团第一届全会盛况</a></li></ul>]]></content:encoded>
			<wfw:commentRss>http://www.nupt.org/83/feed</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>推荐5个英文SEO博客</title>
		<link>http://www.nupt.org/74</link>
		<comments>http://www.nupt.org/74#comments</comments>
		<pubDate>Wed, 26 Dec 2007 09:09:51 +0000</pubDate>
		<dc:creator>Soz</dc:creator>
				<category><![CDATA[SEO]]></category>
		<category><![CDATA[SEOBlog]]></category>

		<guid isPermaLink="false">http://www.nupt.org/74</guid>
		<description><![CDATA[按照周总的看法，中国目前的SEO成熟还有待时日。所以，他觉得现在把SEO服务到外贸，是很好的一条路。那么，众所周知，做国外的SEO与国内的SEO有很大的不同。而且，国外的SEO行业已经成熟。下面，Soz给大家推荐5个顶级的英文SEO博客。]]></description>
			<content:encoded><![CDATA[<p>按照<a href="http://www.51submit.com">周总</a>的看法，中国目前的SEO成熟还有待时日。所以，他觉得现在把<a href="http://www.nupt.org">SEO</a>服务到外贸，是很好的一条路。</p>
<p>众所周知，国外的SEO与国内的SEO有很大的不同。国外的SEO行业已经成熟。</p>
<p>同时，做国外的SEO还需要跨越语言这道坎。这是一道比较难过的关卡，不仅仅是单词方面，<strong>更是文化方面</strong>。当然，这没有别的方法，只能靠大家自己慢慢的摸索，慢慢的适应。</p>
<p>下面，<a href="http://www.nupt.org">Soz</a>给大家推荐5个顶级的英文SEO博客。（其实不是Soz推荐的，是<a href="http://ditoweb.com/blog/2007/12/12/5-great-seo-blogs/">Dito</a>推荐的）</p>
<ul>
<li><a href="http://www.mattcutts.com/blog/">Matt Cutts Blog</a> Matt从2000年就在Google当了软件工程师。他是Google Webspam小组的头，同时，他在SEO社区也十分的活跃。Matt在Google好像有比较大的影响力，他所涉及的一些决定也影响着SEO商业界。</li>
<li><a href="http://www.seomoz.org/blog">SEOmoz Blog</a> Rank Fishkin给了SEO界极深的印象。特别是最近，&ldquo;SEO Blog&rdquo;这个关键词在Google中排到了第一。之前的几年，排在第一的都是Matt的博客。（刚刚Soz Google了一下，发现Matt排到第三了，第二是<a href="http://www.wolf-howl.com/">GrayWolf</a>）这个博客的信息非常好，而且给出了如何成功的SEO/SEM的洞察力（这几句比较绕，没有翻译好，大家可以看原文）</li>
<li><a href="http://www.seobook.com/blog">SEOBook</a> Aaron Wall是另一个非常好的SEO消息和建议源。他提供了一本SEOBook，一些内容可以免费看。他的站点也提供了非常好的SEO工具。Aaron给出了SEO的独特观点，他的博客是必读的。</li>
<li><a href="http://www.shoemoney.com/">ShoeMoney</a> ShoeMoney has the skills to pay the bills，这个博客比起SEO来，更多的是网络营销。ShoeMoney 给SEOs 提供不同的ideas，还有提高网络营销效果的方法。这个博客还提供了online opportunities 的 ideas，以让其对市场战略有利。</li>
<li><a href="http://searchengineland.com/">SearchEngineLand</a> Danny Sullivan 和 Vanessa Fox 是SearchEngineLand.com 的两位编辑员。这个两个名字在SEO界是公认的。这个博客提供了各个主流搜索引擎的最新新闻，是每个专业SEO必读的。他们还组织搜索引擎会议，<a href="http://searchengineland.com/events.php">SMX</a>(<a href="http://searchmarketingexpo.com/">Search Marketing Expo</a>)在世界大部分都有场所。</li>
</ul>
<p>好了，估计这5个博客够大家消化一阵子了。Soz也是这五个SEO博客的订阅者（还要加上<a href="http://ditoweb.com/blog/">Dito</a>的博客）和学习者。</p>
<p>在国外的SEO方面，Soz才是刚刚起步，将来要学习的还有很多很多&hellip;&hellip;</p>
<h3  class="related_post_title">相关文章：</h3><ul class="related_post"><li><a href="http://www.nupt.org/211" title="欢迎你，2009">欢迎你，2009</a></li><li><a href="http://www.nupt.org/185" title="好书推荐:解密SEO,搜索引擎优化">好书推荐:解密SEO,搜索引擎优化</a></li><li><a href="http://www.nupt.org/98" title="关于关键词密度">关于关键词密度</a></li><li><a href="http://www.nupt.org/84" title="外链建设（二）">外链建设（二）</a></li><li><a href="http://www.nupt.org/72" title="南京点石茶话会有感">南京点石茶话会有感</a></li><li><a href="http://www.nupt.org/32" title="SEO之目的">SEO之目的</a></li><li><a href="http://www.nupt.org/25" title="驳：一种网站的新形式？">驳：一种网站的新形式？</a></li><li><a href="http://www.nupt.org/21" title="翻译《The Art of the Content Site》第五波">翻译《The Art of the Content Site》第五波</a></li><li><a href="http://www.nupt.org/20" title="翻译《The Art of the Content Site》第四波">翻译《The Art of the Content Site》第四波</a></li><li><a href="http://www.nupt.org/19" title="翻译《The Art of the Content Site》第三波">翻译《The Art of the Content Site》第三波</a></li></ul>]]></content:encoded>
			<wfw:commentRss>http://www.nupt.org/74/feed</wfw:commentRss>
		<slash:comments>7</slash:comments>
		</item>
		<item>
		<title>南京点石茶话会有感</title>
		<link>http://www.nupt.org/72</link>
		<comments>http://www.nupt.org/72#comments</comments>
		<pubDate>Sun, 23 Dec 2007 05:24:07 +0000</pubDate>
		<dc:creator>Soz</dc:creator>
				<category><![CDATA[SEO]]></category>
		<category><![CDATA[点石]]></category>

		<guid isPermaLink="false">http://www.nupt.org/72</guid>
		<description><![CDATA[昨天，Soz 有幸参加了南京点石茶话会。
昨晚回到宿舍已经10点多了，打开电脑，看了几个博客，就睡觉了。今天，Soz 就按照会议的时间顺序写写感想。
Robin
在经过了严重的堵车和红灯之后，Soz幸运的赶在会议开始前签到。当然，在签名的时候，看到第一个名字就是Robin的大名了。这个点石论坛的管理员非常亲切，会议主持的也是非常成功。还有，Soz 亲眼见到 Robin，还是很激动的：）
乐思蜀
乐思蜀专程从西安赶到南京，可见他对这次茶话会的重视。并且，此次他带来了关于SEO软件IBP的演讲。令 Soz 惊喜的是，乐思蜀这次带来的是一个框架，一种思想。晚宴后，Soz 找到了乐思蜀，并跟他谈起我是他博客的忠实读者。他很高兴，而且让人感觉很亲切。Soz说他前几期的几个理论应用到SEO方面很不错，乐思蜀说：&#8220;现在技术不是瓶颈了，主要还是思想。&#8221; 一句话，让Soz一下子就感受到了他的高层次。
之后，我邀请乐思蜀合照一张，乐思蜀愉快的接受，我们愉快地合照，Soz感觉比较幸运：）
周宁
周总现在是南京科泰信息科技有限公司总经理，他是站在一个管理者/运营者的角度来进行演讲。
茶话会一下子就提高了档次。
周总客观的从市场需求角度和行业状态分析了SEO在国内的前景。得出国内SEO行业须在3-5年内才趋于成熟。最后再导出，目前SEO方面适合往外贸发展。
曹艳华
能有Charles这位老乡，Soz 感到很荣幸。Charles 现任南京科泰信息科技有限公司首席工程师，对海外推广的经验和理解也是一流水平。
Charles此次演讲的题目：通过SEO高效进行海外推广。
最后一点SMO 引起了 Soz 的兴趣，在 Charles 看来，SMO 是一种趋势，利用Web2.0社区来推广，是潮流。当然，Charles 肯定在这方面积累了丰富的经验了！
晚宴后，我也跟 Charles 合照。而且Charles十分愉快的跟同事介绍我们是老乡，呵呵，让Soz 十分的荣幸。
Charles 对 Soz 也很关心，他表扬 Soz的博客做的不错，同时，Charles也鼓励Soz要多实践。
在这里，Soz要衷心的感谢Charles的鼓励！
丁秋林
教授级人物，不过在 Soz 看来，应该要比一般教授的境界要高很多层次！
丁老前辈演讲了他对互联网的思考，很有见地。
他教导，要认清互联网。使用互联网，可以上天堂，也可以下地狱。
Soz很敬佩丁老前辈，而且也相信昨天在座的90多人也十分的敬佩。
在这里，Soz祝丁老前辈：身体健康，鹤发童颜！
这四个演讲十分精彩，会场上气氛也很友好，大家尽情的享受着此次茶话会所带来的快乐。Soz能去参加此次茶花会，感到十分荣幸。下次如果还有机会，一定还去参加点石的线下活动！
相关文章：欢迎你，2009好书推荐:解密SEO,搜索引擎优化点石的高手真的很多关于关键词密度外链建设（二）推荐5个英文SEO博客SEO之目的驳：一种网站的新形式？翻译《The Art of the Content Site》第五波翻译《The Art of the Content Site》第四波]]></description>
			<content:encoded><![CDATA[<p>昨天，Soz 有幸参加了<a href="http://www.dunsh.org/2007/12/23/dunsh-nanjing-22th-dec-2007-ppt/">南京点石茶话会</a>。</p>
<p>昨晚回到宿舍已经10点多了，打开电脑，看了几个博客，就睡觉了。今天，Soz 就按照会议的时间顺序写写感想。</p>
<p><strong>Robin</strong></p>
<p>在经过了严重的堵车和红灯之后，Soz幸运的赶在会议开始前签到。当然，在签名的时候，看到第一个名字就是<a href="http://www.seovip.cn/blog/post/dunsh-22th-dec-2007.html">Robin</a>的大名了。这个<a href="http://www.dunsh.org/forums/">点石论坛</a>的管理员非常亲切，会议主持的也是非常成功。还有，Soz 亲眼见到 Robin，还是很激动的：）</p>
<p><strong>乐思蜀</strong></p>
<p><a href="http://www.lesishu.cn/">乐思蜀</a>专程从西安赶到南京，可见他对这次茶话会的重视。并且，此次他带来了关于SEO软件IBP的演讲。令 Soz 惊喜的是，乐思蜀这次带来的是一个框架，一种思想。晚宴后，Soz 找到了乐思蜀，并跟他谈起我是他博客的忠实读者。他很高兴，而且让人感觉很亲切。Soz说他前几期的<a href="http://www.lesishu.cn/tag/seo%e7%90%86%e5%bf%b5/">几个理论</a>应用到<a href="http://www.nupt.org/category/seo">SEO</a>方面很不错，乐思蜀说：&ldquo;现在技术不是瓶颈了，主要还是思想。&rdquo; 一句话，让Soz一下子就感受到了他的高层次。<br />
之后，我邀请乐思蜀合照一张，乐思蜀愉快的接受，我们愉快地合照，Soz感觉比较幸运：）</p>
<p><strong>周宁</strong></p>
<p>周总现在是<a href="http://www.51submit.com">南京科泰信息科技有限公司</a>总经理，他是站在一个管理者/运营者的角度来进行演讲。<br />
茶话会一下子就提高了档次。<br />
周总客观的从市场需求角度和行业状态分析了SEO在国内的前景。得出国内SEO行业须在3-5年内才趋于成熟。最后再导出，目前SEO方面适合往外贸发展。</p>
<p><strong>曹艳华</strong></p>
<p>能有<a href="http://www.kseo.cn">Charles</a>这位老乡，Soz 感到很荣幸。Charles 现任<a href="http://www.51submit.com">南京科泰信息科技有限公司</a>首席工程师，对海外推广的经验和理解也是一流水平。<br />
Charles此次演讲的题目：通过SEO高效进行海外推广。<br />
最后一点SMO 引起了 Soz 的兴趣，在 Charles 看来，SMO 是一种趋势，利用Web2.0社区来推广，是潮流。当然，Charles 肯定在这方面积累了丰富的经验了！<br />
晚宴后，我也跟 Charles 合照。而且Charles十分愉快的跟同事介绍我们是老乡，呵呵，让Soz 十分的荣幸。<br />
Charles 对 Soz 也很关心，他表扬 <a href="http://www.nupt.org">Soz的博客</a>做的不错，同时，Charles也鼓励Soz要多实践。<br />
在这里，Soz要衷心的感谢Charles的鼓励！</p>
<p><strong>丁秋林</strong></p>
<p>教授级人物，不过在<a href="http://www.nupt.org"> Soz</a> 看来，应该要比一般教授的境界要高很多层次！<br />
丁老前辈演讲了他对互联网的思考，很有见地。<br />
他教导，要认清互联网。使用互联网，可以上天堂，也可以下地狱。<br />
Soz很敬佩丁老前辈，而且也相信昨天在座的90多人也十分的敬佩。<br />
在这里，Soz祝丁老前辈：身体健康，鹤发童颜！</p>
<p>这四个演讲十分精彩，会场上气氛也很友好，大家尽情的享受着此次茶话会所带来的快乐。Soz能去参加此次茶花会，感到十分荣幸。下次如果还有机会，一定还去参加<a href="http://www.dunsh.org">点石</a>的线下活动！</p>
<h3  class="related_post_title">相关文章：</h3><ul class="related_post"><li><a href="http://www.nupt.org/211" title="欢迎你，2009">欢迎你，2009</a></li><li><a href="http://www.nupt.org/185" title="好书推荐:解密SEO,搜索引擎优化">好书推荐:解密SEO,搜索引擎优化</a></li><li><a href="http://www.nupt.org/164" title="点石的高手真的很多">点石的高手真的很多</a></li><li><a href="http://www.nupt.org/98" title="关于关键词密度">关于关键词密度</a></li><li><a href="http://www.nupt.org/84" title="外链建设（二）">外链建设（二）</a></li><li><a href="http://www.nupt.org/74" title="推荐5个英文SEO博客">推荐5个英文SEO博客</a></li><li><a href="http://www.nupt.org/32" title="SEO之目的">SEO之目的</a></li><li><a href="http://www.nupt.org/25" title="驳：一种网站的新形式？">驳：一种网站的新形式？</a></li><li><a href="http://www.nupt.org/21" title="翻译《The Art of the Content Site》第五波">翻译《The Art of the Content Site》第五波</a></li><li><a href="http://www.nupt.org/20" title="翻译《The Art of the Content Site》第四波">翻译《The Art of the Content Site》第四波</a></li></ul>]]></content:encoded>
			<wfw:commentRss>http://www.nupt.org/72/feed</wfw:commentRss>
		<slash:comments>9</slash:comments>
		</item>
		<item>
		<title>社会化网络书签集合</title>
		<link>http://www.nupt.org/65</link>
		<comments>http://www.nupt.org/65#comments</comments>
		<pubDate>Sun, 16 Dec 2007 13:38:00 +0000</pubDate>
		<dc:creator>Soz</dc:creator>
				<category><![CDATA[SEO]]></category>
		<category><![CDATA[团队]]></category>

		<guid isPermaLink="false">http://www.nupt.org/65</guid>
		<description><![CDATA[今天，跟团队讨论到QQ书签和Del.icio.us这两个社会化书签的时候，队友们说很少接触这些书签。
正好，今天上Google Reader，发现天涯海角正好发了这篇关于社会化书签集合的文章。
下面，我先适当的转载一下什么是社会化书签（来自百度百科）：
Social Bookmark，社会化书签，可以将网站随时加入自己的网络书签中；用多个关键词标示和整理书签，并与人共享。2004年起Web出现的一种新的内容标引方法。相对于专业的编目和用户提供元数据的现行方式，社会书签以其方便实用而备受人们的关注和喜爱，被认为是下一代的Web信息基础设施。
同时，再转载一下天涯海角的这篇文章，让大家知道现在一些知名度很大的社会化书签网站
1.del.icio.us 很多人也喜欢称之为美味书签，应该是目前使用人数多的服务，以tag为书签分类个人认为它是目前网络上最好的社会性网络书签工具。
2.Spurl ：Spurl.net的特点：书签+资源价值的评判+自动的分析和呈现。用户把有用的资源作为自己的书签，同时给出等级用户社会性的评判，这些数据会被分析，当用户登陆到spurl.net的时候，你所兴趣的来自整个社群过滤的书签资源就自动呈现。
3.Furl :个人比较喜欢的一个，Furl 采用的“topics（分类）+ keywords（关键字）”标识系统不错。
4.Blinklist ：界面感觉很不错，采用了prototype等优秀的javascript特效库，Ajax技术运用的恰到好处（很多细节处理很好，比如打分和收藏、翻页等操作）。
5.Diigo：Diigo是“Digest of Internet Information, Groups and Other stuff”的缩写，当你在网上浏览的时候，你可以对你认为重要的信息和文章段落进行高亮标注甚至对其增加一个你的批注。个人觉得做的很不错。
6.Otavo :来自于加拿大的社会性书签网站, Otavo 包括两层含义。它是组织 Organizing 文本Text、音频 Audio、视频对象 Video Object 的首字母省略语。它也是一个世界语言（Esperanto 世界语）单词表示渥太华 Ottawa，也就是公司创办所在地。Otavo 用户可以提问回答问题，组织评论书签，还可以在社会背景下分享他们的目标。有点象把del.icio.us+ask.metafilter+ 43Things 全部打包到一个友好用户界面，参与打分和为最积极用户的奖励。
7.StumbleUpon :让用户选择自己的兴趣，然后提供给用户一个可以随手点击的工具条，用它来保存URL并对此页面评判和推荐，这些评判被汇总后，会根据用户自身的兴趣喜 好，呈现给用户，用户能够浏览到整个社群共同筛选出来的有价值的资源。这个站点允许用户之间建立个人关系，彼此分享各自的评判和推荐。
8.Blummy:界面很漂亮.Blummy具有很强的可定制性，可以把多个 网络服 务的书签(Bookmarklet)集合成一个图形化的书签来方便使用。注册并登录Blummy后，会在屏幕左侧显示一个可以改变大小的方框，这就是 Blummy所提供的一体化Bookmark。而右侧则是可加入Blummy的网络服务书签Blummlet列表。只要把右侧列表中所需要的 Blummlet条目拖曳到左侧的方框中，就可以在Blummy书签中方便的调用相应的网络服务。
9.Blogmarks :Blogmarks 和 del.icio.us 相比，最大的不同是，blogmarks具有网页截图功能。此外，网页标签的显示，做得很有特色。
10.365key:国内的社会性网络书签。
11.Plum:与其他书签网站将书签存于网络不同, 该网站允许用户将书签存放在电脑本机。详细介绍。
12.Favorites:国内做的不错的一个，可以保存收藏喜欢的信息，让你随时随地就能够找到它们共享与家人、朋友、同学一同分享你的收藏。
13.Folkd ：是一个对网站，新闻，音频，日志和评论注释等收藏及分享的社会化服务，详细介绍。
14.Librarious ：是一个在线收藏书籍，DVD，音乐，游戏等的媒体社会化书签，或者可以称之为一个书籍，DVD，音乐，游戏的在线目录。详细介绍。
15.央库：是国内一家提供在线网络收藏服务的网站。具有快速收藏，管理便捷，批量数据，权限灵活，多种API等功能。详细介绍。
16.Fungow：不是通过tag来给书签分类，而是通过书签文件夹来对书签进行分类，即你在收藏书签的时候直接建立相应的文件夹，将不同类型的书签通过文件夹来进行分类。详细介绍。
17.Stylehive：一个专注于购物领域里的社会化书签网站。
18.Only2clicks：是一个提供视觉化网络书签服务的网站。之所以说Only2clicks是“社会化书签+个性化主页”的综合体是因为Only2clicks不仅有社会化网络书签的功能，而且其收藏的书签可以如PageFlakes等个性化主页的形式展现出来。 详细介绍。
19. Shouker（收客网）：是一个提供新型网络收藏服务的网站，和一般的网络书签不同的是， Shouker不仅提供了收藏网站地址的功能，而且还能够保存网页，即使保存的网页不再存在，你也能够查看相应的收藏的网页 。详细介绍。
20.百度搜藏： 百度推出的社会化书签工具。
21.Google Bookmarks: Google 的社会化书签收藏服务，尽管使用不多，不过可以firefox书签同步备份的工具还是不错的。
22.Yahoo Bookmarks: Yahoo的社会化网络书签。
23.Yahoo收藏：Yahoo的又一个社会化网络书签，不过感觉功能比较弱。
24.QQ书签：腾讯QQ推出的社会化网络书签。
25.Mister-Wong:其收藏部分支持网页截图，同 时也可以设置书签是否公开，这点还是比较有用。另外Mister-Wong还包括了好友系统、群组功能、消息系统等模块。 Mister-Wong提供的工具也不少，包括Bookmarklet、IE和Firefox的插件、Firefox搜索插件、页面按钮、WP及 [...]]]></description>
			<content:encoded><![CDATA[<p>今天，跟<a href="http://www.nupt.org/category/team">团队</a>讨论到<a href="http://shuqian.qq.com">QQ书签</a>和<a href="http://Del.icio.us">Del.icio.us</a>这两个社会化书签的时候，队友们说很少接触这些书签。</p>
<p>正好，今天上Google Reader，发现<a href="http://www.web20share.com">天涯海角</a>正好发了这篇关于<a href="http://www.nupt.org/65">社会化书签集合</a>的文章。</p>
<p>下面，我先适当的转载一下什么是社会化书签（来自<a href="http://baike.baidu.com/view/227995.html?wtp=tt">百度百科</a>）：</p>
<p><font color="#999999">Social Bookmark，社会化书签，可以将网站随时加入自己的网络书签中；用多个关键词标示和整理书签，并与人共享。2004年起Web出现的一种新的内容标引方法。相对于专业的编目和用户提供元数据的现行方式，社会书签以其方便实用而备受人们的关注和喜爱，被认为是下一代的Web信息基础设施。</font></p>
<p>同时，再转载一下天涯海角的这篇文章，让大家知道现在一些知名度很大的社会化书签网站</p>
<p><font color="#999999">1.<a href="http://del.icio.us/" target="_blank">del.icio.us</a> 很多人也喜欢称之为美味书签，应该是目前使用人数多的服务，以tag为书签分类个人认为它是目前网络上最好的社会性网络书签工具。</font></p>
<p><font color="#999999">2.<a href="http://www.spurl.net/" target="_blank">Spurl</a> ：Spurl.net的特点：书签+资源价值的评判+自动的分析和呈现。用户把有用的资源作为自己的书签，同时给出等级用户社会性的评判，这些数据会被分析，当用户登陆到spurl.net的时候，你所兴趣的来自整个社群过滤的书签资源就自动呈现。</font></p>
<p><font color="#999999">3.<a href="http://www.furl.net/" target="_blank">Furl</a> :个人比较喜欢的一个，Furl 采用的“topics（分类）+ keywords（关键字）”标识系统不错。</font></p>
<p><font color="#999999">4.<a href="http://www.blinklist.com/" target="_blank">Blinklist</a> ：界面感觉很不错，采用了prototype等优秀的javascript特效库，Ajax技术运用的恰到好处（很多细节处理很好，比如打分和收藏、翻页等操作）。</font></p>
<p><font color="#999999">5.<a href="http://www.diigo.com/">Diigo</a>：Diigo是“Digest of Internet Information, Groups and Other stuff”的缩写，当你在网上浏览的时候，你可以对你认为重要的信息和文章段落进行高亮标注甚至对其增加一个你的批注。个人觉得做的很不错。</font></p>
<p><font color="#999999">6.<a href="http://otavo.com/" target="_blank">Otavo</a> :来自于加拿大的社会性书签网站, Otavo 包括两层含义。它是组织 Organizing 文本Text、音频 Audio、视频对象 Video Object 的首字母省略语。它也是一个世界语言（Esperanto 世界语）单词表示渥太华 Ottawa，也就是公司创办所在地。Otavo 用户可以提问回答问题，组织评论书签，还可以在社会背景下分享他们的目标。有点象把del.icio.us+ask.metafilter+ 43Things 全部打包到一个友好用户界面，参与打分和为最积极用户的奖励。</font></p>
<p><font color="#999999">7.<a href="http://www.stumbleupon.com/">StumbleUpon</a> :让用户选择自己的兴趣，然后提供给用户一个可以随手点击的工具条，用它来保存URL并对此页面评判和推荐，这些评判被汇总后，会根据用户自身的兴趣喜 好，呈现给用户，用户能够浏览到整个社群共同筛选出来的有价值的资源。这个站点允许用户之间建立个人关系，彼此分享各自的评判和推荐。</font></p>
<p><font color="#999999">8.<a href="http://blummy.com/">Blummy</a>:界面很漂亮.Blummy具有很强的可定制性，可以把多个 网络服 务的书签(Bookmarklet)集合成一个图形化的书签来方便使用。注册并登录Blummy后，会在屏幕左侧显示一个可以改变大小的方框，这就是 Blummy所提供的一体化Bookmark。而右侧则是可加入Blummy的网络服务书签Blummlet列表。只要把右侧列表中所需要的 Blummlet条目拖曳到左侧的方框中，就可以在Blummy书签中方便的调用相应的网络服务。</font></p>
<p><font color="#999999">9.<a href="http://blogmarks.net/" target="_blank">Blogmarks</a> :Blogmarks 和 del.icio.us 相比，最大的不同是，blogmarks具有网页截图功能。此外，网页标签的显示，做得很有特色。</font></p>
<p><font color="#999999">10.<a href="http://www.365key.com/">365key</a>:国内的社会性网络书签。</font></p>
<p><font color="#999999">11.<a href="http://www.plum.com/">Plum</a>:与其他书签网站将书签存于网络不同, 该网站允许用户将书签存放在电脑本机。<a href="http://www.web20share.com/2006/09/plum.html">详细介绍</a>。</font></p>
<p><font color="#999999">12.<a href="http://www.favorites.com.cn/">Favorites</a>:国内做的不错的一个，可以保存收藏喜欢的信息，让你随时随地就能够找到它们共享与家人、朋友、同学一同分享你的收藏。</font></p>
<p><font color="#999999">13.<a href="http://www.folkd.com/">Folkd</a> ：是一个对网站，新闻，音频，日志和评论注释等收藏及分享的社会化服务，<a href="http://www.web20share.com/2006/08/folkd.html">详细介绍</a>。</font></p>
<p><font color="#999999">14.<a href="http://lib.rario.us/">Librarious</a> ：是一个在线收藏书籍，DVD，音乐，游戏等的媒体社会化书签，或者可以称之为一个书籍，DVD，音乐，游戏的在线目录。<a href="http://www.web20share.com/2006/11/librarious.html">详细介绍</a>。</font></p>
<p><font color="#999999">15.<a href="http://www.yangku.com/">央库</a>：是国内一家提供在线网络收藏服务的网站。具有快速收藏，管理便捷，批量数据，权限灵活，多种API等功能。<a href="http://www.web20share.com/2007/01/blog-post.html">详细介绍</a>。</font></p>
<p><font color="#999999">16.<a href="http://www.fungow.com/">Fungow</a>：不是通过tag来给书签分类，而是通过书签文件夹来对书签进行分类，即你在收藏书签的时候直接建立相应的文件夹，将不同类型的书签通过文件夹来进行分类。<a href="http://www.web20share.com/2006/10/fungow.html">详细介绍</a>。</font></p>
<p><font color="#999999">17.<a href="http://www.stylehive.com/">Stylehive</a>：一个专注于购物领域里的社会化书签网站。</font></p>
<p><font color="#999999">18.<a href="http://www.only2clicks.com/">Only2clicks</a>：是一个提供视觉化网络书签服务的网站。之所以说<a href="http://www.only2clicks.com/">Only2clicks</a>是“社会化书签+个性化主页”的综合体是因为<a href="http://www.only2clicks.com/">Only2clicks</a>不仅有社会化网络书签的功能，而且其收藏的书签可以如<a href="http://www.pageflakes.com/?source=55e54333-9239-45f8-a454-9eb3b887dd43">PageFlakes</a>等个性化主页的形式展现出来。 <a href="http://www.web20share.com/2007/10/only2clicks.html">详细介绍</a>。</font></p>
<p><font color="#999999">19.<a href="http://www.shouker.com/"> Shouker</a>（收客网）：是一个提供新型网络收藏服务的网站，和<a href="http://www.web20share.com/2006/08/web20_24.html">一般的网络书签</a>不同的是，<a href="http://www.shouker.com/"> Shouker</a>不仅提供了收藏网站地址的功能，而且还能够保存网页，即使保存的网页不再存在，你也能够查看相应的收藏的网页 。<a href="http://www.web20share.com/2007/10/shouker.html">详细介绍</a>。</font></p>
<p><font color="#999999">20.<a href="http://cang.baidu.com/">百度搜藏</a>： 百度推出的社会化书签工具。</font></p>
<p><font color="#999999">21.<a href="http://www.google.com/bookmarks/">Google Bookmarks</a>: Google 的社会化书签收藏服务，尽管使用不多，不过可以firefox书签同步备份的工具还是不错的。</font></p>
<p><font color="#999999">22.<a href="http://bookmarks.yahoo.com/">Yahoo Bookmarks</a>: Yahoo的社会化网络书签。</font></p>
<p><font color="#999999">23.<a href="http://myweb.cn.yahoo.com/">Yahoo收藏</a>：Yahoo的又一个社会化网络书签，不过感觉功能比较弱。</font></p>
<p><font color="#999999">24.<a href="http://shuqian.qq.com/">QQ书签</a>：腾讯QQ推出的社会化网络书签。</font></p>
<p><font color="#999999">25.<a href="http://www.mister-wong.cn/">Mister-Wong</a>:其收藏部分支持网页截图，同 时也可以设置书签是否公开，这点还是比较有用。另外Mister-Wong还包括了好友系统、群组功能、消息系统等模块。 Mister-Wong提供的工具也不少，包括Bookmarklet、IE和Firefox的插件、Firefox搜索插件、页面按钮、WP及 Textpattern插件。另外它也支持书签Roll及标签云的输出。<a href="http://webleon.org/2007/04/mister-wong.html">详细介绍</a>。</font></p>
<p><font color="#999999">26.<a href="http://www.9fav.com/">9Fav</a>:国内的一个社会化网络书签服务，其特色是将通讯工具和社会化网络服务相结合，目前支持MSN，QQ，Gtalk。</font></p>
<p><font color="#999999">27.<a href="http://www.myurlworld.com:8080/">Myurlworld</a>：具备基本的网络收藏服务的元素（导入，导出，bookmarket等）；活泼，轻快的风格设计；支持对图片，视频等活泼元素的收藏；支持对美味书签 （del.icio.us）的导入和同步功能；融入了活泼的web2.0元素，如： 好友，视频等。</font></p>
<p><font color="#999999">28.<a href="http://www.chouti.com/">抽屉</a>： 国内的一个比较有特色的社会化网络书签，支持收藏夹上传，可以打造私人的网址导航站点。抽屉书签<a href="http://img.chouti.com/videodemo.html">视频介绍</a>。</font></p>
<p><font color="#999999">29.<a href="http://www.inu.cc/">易游</a>： 国内做的不错的一个社会化书签服务网站，页面比较整洁，支持网页缩略图收藏，支持OPenID登录。</font></p>
<p><font color="#999999">30.<a href="http://www.hemidemi.com/">黑米共享书签</a>： 台湾很受欢迎的社会化网络书签。</font></p>
<p><font color="#999999">31.<a href="http://lib.rario.us/" target="_blank">Lib.rario.us</a>：是一个在线收藏书籍，DVD，音乐，游戏等的媒体社会化书签，或者可以称之为一个书籍，DVD，音乐，游戏的在线目录。感觉和<a href="http://www.web20share.com/2006/09/librarything.html" target="_blank">我前面介绍的librarything</a>比较相似，不过<a href="http://lib.rario.us/" target="_blank">Lib.rario.us</a>收集的内容更广一些包括DVD，音乐，游戏。<a href="http://www.web20share.com/2006/11/librarious.html">详细介绍</a>。</font></p>
<p><font color="#999999">32.<a href="http://dabble.com/">Dabble</a>：是一个提供在线视频分享服务的网站。除了和一般的提供视频分享服务的网站相比，除了视频的上传和分享之外，<a href="http://dabble.com/">Dabble</a>还提供了视频书签收藏服务，即提供了一种视频类的<a href="http://www.web20share.com/2007/12/dabble.html">社会化网络书签</a>服务。你可以很方便的收藏自己喜欢的视频，制作自己的视频播放列表等等。 <a href="http://www.web20share.com/2007/12/dabble.html">详细介绍</a>。</font></p>
<p>其实，利用社会化书签可以用来做网络推广的，当然，这属于<strong>社会化搜索优化</strong>的范围了。</p>
<h3  class="related_post_title">读过此篇文章的读者也读过：</h3><ul class="related_post"><li><a href="http://www.nupt.org/194" title="听者有心祝各位中秋快乐">听者有心祝各位中秋快乐</a></li><li><a href="http://www.nupt.org/204" title="关于Joomla自定义模板的教程">关于Joomla自定义模板的教程</a></li><li><a href="http://www.nupt.org/52" title="初步测评dedecms2007测试版">初步测评dedecms2007测试版</a></li><li><a href="http://www.nupt.org/148" title="是谁占用了80端口">是谁占用了80端口</a></li><li><a href="http://www.nupt.org/177" title="如何提交WordPress主题到其官方网站">如何提交WordPress主题到其官方网站</a></li><li><a href="http://www.nupt.org/213" title="春节快乐">春节快乐</a></li><li><a href="http://www.nupt.org/49" title="关于建行e路通杯的规则疑虑">关于建行e路通杯的规则疑虑</a></li><li><a href="http://www.nupt.org/99" title="新用户：10种最简单的方法提高你的社会媒体可信性">新用户：10种最简单的方法提高你的社会媒体可信性</a></li><li><a href="http://www.nupt.org/114" title="Joomla分类管理">Joomla分类管理</a></li><li><a href="http://www.nupt.org/188" title="一周碎碎念">一周碎碎念</a></li></ul>]]></content:encoded>
			<wfw:commentRss>http://www.nupt.org/65/feed</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>关于网页信噪比和相关度计算</title>
		<link>http://www.nupt.org/57</link>
		<comments>http://www.nupt.org/57#comments</comments>
		<pubDate>Fri, 14 Dec 2007 02:12:38 +0000</pubDate>
		<dc:creator>Soz</dc:creator>
				<category><![CDATA[SEO]]></category>

		<guid isPermaLink="false">http://www.nupt.org/57</guid>
		<description><![CDATA[看到飘渺蝶舞这篇文章的时候，真是很惊喜，这应该是在网上为数不多的SEO技术的量化帖子了。
一般我们查相关关键词可能会通过两个方式，一个是查看百度相关搜索，另外一个是通过目测，看看两个词汇之间是否具有相关度，实际上后面一种办法是相当不科学和不准确的。
还记得小达哥做163邮箱这个词的时候，在百度搜索“163邮箱”出现“丘仕达”这个关键词吗？当时很多人开始研究相关关键词，前段时间我也做过类似实验，搜索SEO出现“飘渺蝶舞”。那么这究竟是如何出现的呢？
举个例子，我们现在有两个网页
A网页的内容是手机描述，出现最高频率的关键词是：手机，蓝牙，彩屏
B网页的内容是手机服务，出现最高频率的关键词是：中国移动，彩铃，短信
如果我们仅仅按照目测的话，我们会得出以下的结果
A网页和B网页是不相关的
搜索A的词不会出现B，而搜索B的词，不会出现A
这是明显有错误的，我们在查看网页词汇的相关度的时候，如果仅仅看到的是网页表面的词汇，我们无法把握很多相关长尾词汇，我们要看到的是这个词后面隐含更深的意义。
我们在搜索“手机”这个关键词的时候，搜索引擎返回的数据往往有可能会是以下这样
{彩屏*彩屏在文章中的权重，蓝牙*蓝牙在文章中的权重，彩铃*彩铃在文章中的权重，……}
按照这样的算法，我们就可以将一篇文章中的关键词拓展出多个相关词汇，也可以将其他相关词汇所对应的向量拓展更多的词汇。
这样我们就需要计算一个相关词汇的矩阵M。
假如现在有a词和b词
那么M(a,b) = {关键词a,b的相关度}
这样以来，两篇文章的相关度的计算公式就变成了R= Sigma Vi*M(a,b)*Vj
那么相关度到底如何计算呢？
举个例子，手机和蓝牙，我们用以下方式计算
一个文章集合 {W}，总文章数目为N，其中含有单词A的文章总数为N1，含有单词B的文章总数是N2，含有｛A+B｝的文章总数是 N12，那么相关性这么计算
CorrAB= N12/(N1+N2-N12)-(N1*N2)/(N*N)
注意，这里计算的结果有可能会变成负值，如果A和B都是小量的
CorrAB= N12/(N1+N2-N12)
这样就可以算出两篇文章中的相关度了
现在让百度来告诉我们手机和蓝牙之间到底会被百度认为有多少相关度
搜索手机：百度一下，找到相关网页约100,000,000篇
搜索蓝牙：百度一下，找到相关网页约28,000,000篇
搜索手机+蓝牙：百度一下，找到相关网页约22,400,000篇
Corr{手机，蓝牙}=22,400,000/(100,000,000+28,000,000-22,400,000)=0.21 也就是21%
利用这个办法计算网页信噪比，是衡量一个网页关键词的最准确的，当然也是最核心的算法。呵呵，看明白了吗？没有的话多看几次，这些都是一个seoer所必须拥有的哦~
转自：飘渺蝶舞
读过此篇文章的读者也读过：Gmail向全体用户推出了IMAP！谷歌热榜推出免费发送拜年短信9个技巧：更好的开始博客之旅！好书推荐:解密SEO,搜索引擎优化翻译《The Art of the Content Site》第三波Joomla联系管理网站的艺术(Art of the Content Site)博客大变样是谁占用了80端口FLEAshop程序分析(一)]]></description>
			<content:encoded><![CDATA[<p>看到飘渺蝶舞这篇文章的时候，真是很惊喜，这应该是在网上为数不多的SEO技术的量化帖子了。</p>
<p>一般我们查相关关键词可能会通过两个方式，一个是查看百度相关搜索，另外一个是通过目测，看看两个词汇之间是否具有相关度，实际上后面一种办法是相当不科学和不准确的。</p>
<p>还记得小达哥做163邮箱这个词的时候，在百度搜索“163邮箱”出现“丘仕达”这个关键词吗？当时很多人开始研究相关关键词，前段时间我也做过类似实验，搜索SEO出现“飘渺蝶舞”。那么这究竟是如何出现的呢？</p>
<p>举个例子，我们现在有两个网页</p>
<p>A网页的内容是手机描述，出现最高频率的关键词是：手机，蓝牙，彩屏</p>
<p>B网页的内容是手机服务，出现最高频率的关键词是：中国移动，彩铃，短信</p>
<p>如果我们仅仅按照目测的话，我们会得出以下的结果</p>
<p>A网页和B网页是不相关的</p>
<p>搜索A的词不会出现B，而搜索B的词，不会出现A</p>
<p>这是明显有错误的，我们在查看网页词汇的相关度的时候，如果仅仅看到的是网页表面的词汇，我们无法把握很多相关长尾词汇，我们要看到的是这个词后面隐含更深的意义。</p>
<p>我们在搜索“手机”这个关键词的时候，搜索引擎返回的数据往往有可能会是以下这样</p>
<p>{彩屏*彩屏在文章中的权重，蓝牙*蓝牙在文章中的权重，彩铃*彩铃在文章中的权重，……}</p>
<p>按照这样的算法，我们就可以将一篇文章中的关键词拓展出多个相关词汇，也可以将其他相关词汇所对应的向量拓展更多的词汇。</p>
<p>这样我们就需要计算一个相关词汇的矩阵M。</p>
<p>假如现在有a词和b词</p>
<p>那么M(a,b) = {关键词a,b的相关度}</p>
<p>这样以来，两篇文章的相关度的计算公式就变成了R= Sigma Vi*M(a,b)*Vj</p>
<p>那么相关度到底如何计算呢？</p>
<p>举个例子，手机和蓝牙，我们用以下方式计算</p>
<p>一个文章集合 {W}，总文章数目为N，其中含有单词A的文章总数为N1，含有单词B的文章总数是N2，含有｛A+B｝的文章总数是 N12，那么相关性这么计算</p>
<p>CorrAB= N12/(N1+N2-N12)-(N1*N2)/(N*N)</p>
<p>注意，这里计算的结果有可能会变成负值，如果A和B都是小量的</p>
<p>CorrAB= N12/(N1+N2-N12)</p>
<p>这样就可以算出两篇文章中的相关度了</p>
<p>现在让百度来告诉我们手机和蓝牙之间到底会被百度认为有多少相关度</p>
<p>搜索手机：百度一下，找到相关网页约100,000,000篇</p>
<p>搜索蓝牙：百度一下，找到相关网页约28,000,000篇</p>
<p>搜索手机+蓝牙：百度一下，找到相关网页约22,400,000篇</p>
<p>Corr{手机，蓝牙}=22,400,000/(100,000,000+28,000,000-22,400,000)=0.21 也就是21%</p>
<p>利用这个办法计算网页信噪比，是衡量一个网页关键词的最准确的，当然也是最核心的算法。呵呵，看明白了吗？没有的话多看几次，这些都是一个seoer所必须拥有的哦~</p>
<p>转自：<a href="http://www.piaomiaodiewu.cn">飘渺蝶舞</a></p>
<h3  class="related_post_title">读过此篇文章的读者也读过：</h3><ul class="related_post"><li><a href="http://www.nupt.org/96" title="21个免费获得流量的方法">21个免费获得流量的方法</a></li><li><a href="http://www.nupt.org/87" title="8个重要步骤：提高博客流量">8个重要步骤：提高博客流量</a></li><li><a href="http://www.nupt.org/17" title="翻译《The Art of the Content Site》第一波">翻译《The Art of the Content Site》第一波</a></li><li><a href="http://www.nupt.org/20" title="翻译《The Art of the Content Site》第四波">翻译《The Art of the Content Site》第四波</a></li><li><a href="http://www.nupt.org/3" title="Blog搭好了,膝盖也受伤了">Blog搭好了,膝盖也受伤了</a></li><li><a href="http://www.nupt.org/40" title="记本团第一届全会盛况">记本团第一届全会盛况</a></li><li><a href="http://www.nupt.org/14" title="DedeCMS如何SEO的探索(3)">DedeCMS如何SEO的探索(3)</a></li><li><a href="http://www.nupt.org/49" title="关于建行e路通杯的规则疑虑">关于建行e路通杯的规则疑虑</a></li><li><a href="http://www.nupt.org/34" title="DeDeCMS将于月底发布">DeDeCMS将于月底发布</a></li><li><a href="http://www.nupt.org/102" title="Yahoo! Buzz">Yahoo! Buzz</a></li></ul>]]></content:encoded>
			<wfw:commentRss>http://www.nupt.org/57/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>SEO知识：中文分词 一篇关于中文分词算法的SEO必看文章</title>
		<link>http://www.nupt.org/56</link>
		<comments>http://www.nupt.org/56#comments</comments>
		<pubDate>Thu, 06 Dec 2007 14:02:57 +0000</pubDate>
		<dc:creator>Soz</dc:creator>
				<category><![CDATA[SEO]]></category>

		<guid isPermaLink="false">http://www.nupt.org/56</guid>
		<description><![CDATA[搜索引擎技术的研究，国外比中国要早近十年，从最早的Archie，到后来的Excite，以及altvista、overture、google 等搜索引擎面世，搜索引擎发展至今，已经有十几年的历史，而国内开始研究搜索引擎是在上世纪末本世纪初。在许多领域，都是国外的产品和技术一统天下，特别 是当某种技术在国外研究多年而国内才开始的情况下。例如操作系统、字处理软件、浏览器等等，但搜索引擎却是个例外。虽然在国外搜索引擎技术早就开始研究， 但在国内还是陆续涌现出优秀的搜索引擎，像百度（http://www.baidu.com）、中搜（http://www.zhongsou.com）等。目前在中文搜索引擎领域，国内的搜索引擎已经和国外的搜索引擎效果上相差不远。之所以能形成这样的局面，有一个重要的原因就在于中文和英文两种语言自身的书写方式不同，这其中对于计算机涉及的技术就是中文分词。
什么是中文分词
众 所周知，英文是以词为单位的，词和词之间是靠空格隔开，而中文是以字为单位，句子中所有的字连起来才能描述一个意思。例如，英文句子I am a student，用中文则为：“我是一个学生”。计算机可以很简单通过空格知道student是一个单词，但是不能很容易明白“学”、“生”两个字合起来 才表示一个词。把中文的汉字序列切分成有意义的词，就是中文分词，有些人也称为切词。我是一个学生，分词的结果是：我 是 一个 学生。
中文分词和搜索引擎
中文分词到底对搜索引擎有多大影响？对于搜索引擎来说，最重要的并不是找到所有结果，因为在上百亿的网页中找到所有结果没有太多的意义，没有人能看得完， 最重要的是把最相关的结果排在最前面，这也称为相关度排序。中文分词的准确与否，常常直接影响到对搜索结果的相关度排序。笔者最近替朋友找一些关于日本和 服的资料，在搜索引擎上输入“和服”，得到的结果就发现了很多问题。下面就以这个例子来说明分词对搜索结果的影响，在现有三个中文搜索引擎上做测试，测试 方法是直接在Google（http://www.google.com）、百度（http://www.baidu.com）、中搜（http://www.zhongsou.com）上以“和服”为关键词进行搜索：
在Google上输入“和服”搜索所有中文简体网页，总共结果507,000条，前20条结果中有14条与和服一点关系都没有。在第一页就有以下错误：
    “通信信息报：瑞星以技术和服务开拓网络安全市场”
“使用纯HTML的通用数据管理和服务- 开发者- ZDNet &#8230;”
“陈慧琳《心口不一》化妆和服装自己包办”
“::外交部：中国境外领事保护和服务指南(2003年版) &#8230;”
“产品和服务”
等等。第一页只有三篇是真正在讲“和服”的结果。
在百度上输入“和服”搜索网页，总共结果为287,000条，前20条结果中有6条与和服一点关系都没有。在第一页有以下错误：
    “福建省晋江市恒和服装有限公司系独资企业”
“关于商品和服务实行明码标价的规定”
“青岛东和服装设备”
在中搜上输入“和服”搜索网页，总共结果为26,917条，前20条结果都是与和服相关的网页。
这次搜索引擎结果中的错误，就是由于分词的不准确所造成的。通过笔者的了解，Google的中文分词技术采用的是美国一家名叫Basis Technology（http://www.basistech.com）的公司提供的中文分词技术，百度使用的是自己公司开发的分词技术，中搜使用的是国内海量科技（http://www.hylanda.com）提供的分词技术。由此可见，中文分词的准确度，对搜索引擎结果相关性和准确性有相当大的关系。
中文分词技术
中文分词技术属于自然语言处理技术范畴，对于一句话，人可以通过自己的知识来明白哪些是词，哪些不是词，但如何让计算机也能理解？其处理过程就是分词算法。
现有的分词算法可分为三大类：基于字符串匹配的分词方法、基于理解的分词方法和基于统计的分词方法。
1、基于字符串匹配的分词方法
这种方法又叫做机械分词方法，它是按照一定的策略将待分析的汉字串与一个“充分大的”机器词典中的词条进行配，若在词典中找到某个字符串，则匹配成功（识 别出一个词）。按照扫描方向的不同，串匹配分词方法可以分为正向匹配和逆向匹配；按照不同长度优先匹配的情况，可以分为最大（最长）匹配和最小（最短）匹 配；按照是否与词性标注过程相结合，又可以分为单纯分词方法和分词与标注相结合的一体化方法。常用的几种机械分词方法如下：
1）正向最大匹配法（由左到右的方向）；
2）逆向最大匹配法（由右到左的方向）；
3）最少切分（使每一句中切出的词数最小）。
还可以将上述各种方法相互组合，例如，可以将正向最大匹配方法和逆向最大匹配方法结合起来构成双向匹配法。由于汉语单字成词的特点，正向最小匹配和逆向最 小匹配一般很少使用。一般说来，逆向匹配的切分精度略高于正向匹配，遇到的歧义现象也较少。统计结果表明，单纯使用正向最大匹配的错误率为1/169，单 纯使用逆向最大匹配的错误率为1/245。但这种精度还远远不能满足实际的需要。实际使用的分词系统，都是把机械分词作为一种初分手段，还需通过利用各种 其它的语言信息来进一步提高切分的准确率。
一种方法是改进扫描方式，称为特征扫描或标志切分，优先在待分析字符串中识别和切分出一些带有明显特征的词，以这些词作为断点，可将原字符串分为较小的串 再来进机械分词，从而减少匹配的错误率。另一种方法是将分词和词类标注结合起来，利用丰富的词类信息对分词决策提供帮助，并且在标注过程中又反过来对分词 结果进行检验、调整，从而极大地提高切分的准确率。
对于机械分词方法，可以建立一个一般的模型，在这方面有专业的学术论文，这里不做详细论述。
2、基于理解的分词方法
这种分词方法是通过让计算机模拟人对句子的理解，达到识别词的效果。其基本思想就是在分词的同时进行句法、语义分析，利用句法信息和语义信息来处理歧义现 象。它通常包括三个部分：分词子系统、句法语义子系统、总控部分。在总控部分的协调下，分词子系统可以获得有关词、句子等的句法和语义信息来对分词歧义进 行判断，即它模拟了人对句子的理解过程。这种分词方法需要使用大量的语言知识和信息。由于汉语语言知识的笼统、复杂性，难以将各种语言信息组织成机器可直 接读取的形式，因此目前基于理解的分词系统还处在试验阶段。
3、基于统计的分词方法
从形式上看，词是稳定的字的组合，因此在上下文中，相邻的字同时出现的次数越多，就越有可能构成一个词。因此字与字相邻共现的频率或概率能够较好的反映成 词的可信度。可以对语料中相邻共现的各个字的组合的频度进行统计，计算它们的互现信息。定义两个字的互现信息，计算两个汉字X、Y的相邻共现概率。互现信 息体现了汉字之间结合关系的紧密程度。当紧密程度高于某一个阈值时，便可认为此字组可能构成了一个词。这种方法只需对语料中的字组频度进行统计，不需要切 分词典，因而又叫做无词典分词法或统计取词方法。但这种方法也有一定的局限性，会经常抽出一些共现频度高、但并不是词的常用字组，例如“这一”、“之 一”、“有的”、“我的”、“许多的”等，并且对常用词的识别精度差，时空开销大。实际应用的统计分词系统都要使用一部基本的分词词典（常用词词典）进行 串匹配分词，同时使用统计方法识别一些新的词，即将串频统计和串匹配结合起来，既发挥匹配分词切分速度快、效率高的特点，又利用了无词典分词结合上下文识 别生词、自动消除歧义的优点。
到底哪种分词算法的准确度更高，目前并无定论。对于任何一个成熟的分词系统来说，不可能单独依靠某一种算法来实现，都需要综合不同的算法。笔者了解，海量 科技的分词算法就采用“复方分词法”，所谓复方，相当于用中药中的复方概念，即用不同的药才综合起来去医治疾病，同样，对于中文词的识别，需要多种算法来 处理不同的问题。
分词中的难题
有了成熟的分词算法，是否就能容易的解决中文分词的问题呢？事实远非如此。中文是一种十分复杂的语言，让计算机理解中文语言更是困难。在中文分词过程中，有两大难题一直没有完全突破。
1、歧义识别
歧义是指同样的一句话，可能有两种或者更多的切分方法。例如：表面的，因为“表面”和“面的”都是词，那么这个短语就可以分成“表面 的”和“表 面的”。这种称为交叉歧义。像这种交叉歧义十分常见，前面举的“和服”的例子，其实就是因为交叉歧义引起的错误。“化妆和服装”可以分成“化妆 和 服装”或者“化妆 和服 装”。由于没有人的知识去理解，计算机很难知道到底哪个方案正确。
交叉歧义相对组合歧义来说是还算比较容易处理，组合歧义就必需根据整个句子来判断了。例如，在句子“这个门把手坏了”中，“把手”是个词，但在句子“请把 手拿开”中，“把手”就不是一个词；在句子“将军任命了一名中将”中，“中将”是个词，但在句子“产量三年中将增长两倍”中，“中将”就不再是词。这些词 计算机又如何去识别?
如果交叉歧义和组合歧义计算机都能解决的话，在歧义中还有一个难题，是真歧义。真歧义意思是给出一句话，由人去判断也不知道哪个应该是词，哪个应该不是 词。例如：“乒乓球拍卖完了”，可以切分成“乒乓 球拍 卖 完 了”、也可切分成“乒乓球 拍卖 完 [...]]]></description>
			<content:encoded><![CDATA[<p>搜索引擎技术的研究，国外比中国要早近十年，从最早的Archie，到后来的Excite，以及altvista、overture、google 等搜索引擎面世，搜索引擎发展至今，已经有十几年的历史，而国内开始研究搜索引擎是在上世纪末本世纪初。在许多领域，都是国外的产品和技术一统天下，特别 是当某种技术在国外研究多年而国内才开始的情况下。例如操作系统、字处理软件、浏览器等等，但搜索引擎却是个例外。虽然在国外搜索引擎技术早就开始研究， 但在国内还是陆续涌现出优秀的搜索引擎，像百度（<a href="http://www.baidu.com/" target="_blank"><font color="#800080">http://www.baidu.com</font></a>）、中搜（<a href="http://www.zhongsou.com/" target="_blank"><font color="#800080">http://www.zhongsou.com</font></a>）等。目前在中文搜索引擎领域，国内的搜索引擎已经和国外的搜索引擎效果上相差不远。之所以能形成这样的局面，有一个重要的原因就在于中文和英文两种语言自身的书写方式不同，这其中对于计算机涉及的技术就是中文分词。</p>
<p><strong>什么是中文分词</strong></p>
<p>众 所周知，英文是以词为单位的，词和词之间是靠空格隔开，而中文是以字为单位，句子中所有的字连起来才能描述一个意思。例如，英文句子I am a student，用中文则为：“我是一个学生”。计算机可以很简单通过空格知道student是一个单词，但是不能很容易明白“学”、“生”两个字合起来 才表示一个词。把中文的汉字序列切分成有意义的词，就是中文分词，有些人也称为切词。我是一个学生，分词的结果是：我 是 一个 学生。</p>
<p><strong>中文分词和搜索引擎</strong></p>
<p>中文分词到底对搜索引擎有多大影响？对于搜索引擎来说，最重要的并不是找到所有结果，因为在上百亿的网页中找到所有结果没有太多的意义，没有人能看得完， 最重要的是把最相关的结果排在最前面，这也称为相关度排序。中文分词的准确与否，常常直接影响到对搜索结果的相关度排序。笔者最近替朋友找一些关于日本和 服的资料，在搜索引擎上输入“和服”，得到的结果就发现了很多问题。下面就以这个例子来说明分词对搜索结果的影响，在现有三个中文搜索引擎上做测试，测试 方法是直接在Google（<a href="http://www.google.com/" target="_top"><font color="#800080">http://www.google.com</font></a>）、百度（<a href="http://www.baidu.com/" target="_blank"><font color="#800080">http://www.baidu.com</font></a>）、中搜（<a href="http://www.zhongsou.com/" target="_blank"><font color="#800080">http://www.zhongsou.com</font></a>）上以“和服”为关键词进行搜索：</p>
<p><u>在Google上输入“和服”搜索所有中文简体网页，总共结果507,000条，前20条结果中有14条与和服一点关系都没有。在第一页就有以下错误：</u></p>
<p style="border: 1px solid #cccccc; margin: 5px 20px; padding: 5px; background: #f3f3f3 none repeat scroll 0% 50%; -moz-background-clip: -moz-initial; -moz-background-origin: -moz-initial; -moz-background-inline-policy: -moz-initial">    “通信信息报：瑞星以技术和服务开拓网络安全市场”</p>
<p>“使用纯HTML的通用数据管理和服务- 开发者- ZDNet &#8230;”</p>
<p>“陈慧琳《心口不一》化妆和服装自己包办”</p>
<p>“::外交部：中国境外领事保护和服务指南(2003年版) &#8230;”</p>
<p>“产品和服务”</p>
<p>等等。第一页只有三篇是真正在讲“和服”的结果。</p>
<p><u>在百度上输入“和服”搜索网页，总共结果为287,000条，前20条结果中有6条与和服一点关系都没有。在第一页有以下错误：</u></p>
<p style="border: 1px solid #cccccc; margin: 5px 20px; padding: 5px; background: #f3f3f3 none repeat scroll 0% 50%; -moz-background-clip: -moz-initial; -moz-background-origin: -moz-initial; -moz-background-inline-policy: -moz-initial">    “福建省晋江市恒和服装有限公司系独资企业”</p>
<p>“关于商品和服务实行明码标价的规定”</p>
<p>“青岛东和服装设备”</p>
<p><u>在中搜上输入“和服”搜索网页，总共结果为26,917条，前20条结果都是与和服相关的网页。</u></p>
<p>这次搜索引擎结果中的错误，就是由于分词的不准确所造成的。通过笔者的了解，Google的中文分词技术采用的是美国一家名叫Basis Technology（<a href="http://www.basistech.com/" target="_blank">http://www.basistech.com</a>）的公司提供的中文分词技术，百度使用的是自己公司开发的分词技术，中搜使用的是国内海量科技（<a href="http://www.hylanda.com/" target="_blank">http://www.hylanda.com</a>）提供的分词技术。由此可见，中文分词的准确度，对搜索引擎结果相关性和准确性有相当大的关系。</p>
<p><strong>中文分词技术</strong></p>
<p>中文分词技术属于自然语言处理技术范畴，对于一句话，人可以通过自己的知识来明白哪些是词，哪些不是词，但如何让计算机也能理解？其处理过程就是分词算法。</p>
<p>现有的分词算法可分为三大类：基于字符串匹配的分词方法、基于理解的分词方法和基于统计的分词方法。</p>
<p><u>1、基于字符串匹配的分词方法</u></p>
<p>这种方法又叫做机械分词方法，它是按照一定的策略将待分析的汉字串与一个“充分大的”机器词典中的词条进行配，若在词典中找到某个字符串，则匹配成功（识 别出一个词）。按照扫描方向的不同，串匹配分词方法可以分为正向匹配和逆向匹配；按照不同长度优先匹配的情况，可以分为最大（最长）匹配和最小（最短）匹 配；按照是否与词性标注过程相结合，又可以分为单纯分词方法和分词与标注相结合的一体化方法。常用的几种机械分词方法如下：</p>
<p>1）正向最大匹配法（由左到右的方向）；</p>
<p>2）逆向最大匹配法（由右到左的方向）；</p>
<p>3）最少切分（使每一句中切出的词数最小）。</p>
<p>还可以将上述各种方法相互组合，例如，可以将正向最大匹配方法和逆向最大匹配方法结合起来构成双向匹配法。由于汉语单字成词的特点，正向最小匹配和逆向最 小匹配一般很少使用。一般说来，逆向匹配的切分精度略高于正向匹配，遇到的歧义现象也较少。统计结果表明，单纯使用正向最大匹配的错误率为1/169，单 纯使用逆向最大匹配的错误率为1/245。但这种精度还远远不能满足实际的需要。实际使用的分词系统，都是把机械分词作为一种初分手段，还需通过利用各种 其它的语言信息来进一步提高切分的准确率。</p>
<p>一种方法是改进扫描方式，称为特征扫描或标志切分，优先在待分析字符串中识别和切分出一些带有明显特征的词，以这些词作为断点，可将原字符串分为较小的串 再来进机械分词，从而减少匹配的错误率。另一种方法是将分词和词类标注结合起来，利用丰富的词类信息对分词决策提供帮助，并且在标注过程中又反过来对分词 结果进行检验、调整，从而极大地提高切分的准确率。</p>
<p>对于机械分词方法，可以建立一个一般的模型，在这方面有专业的学术论文，这里不做详细论述。</p>
<p><u>2、基于理解的分词方法</u></p>
<p>这种分词方法是通过让计算机模拟人对句子的理解，达到识别词的效果。其基本思想就是在分词的同时进行句法、语义分析，利用句法信息和语义信息来处理歧义现 象。它通常包括三个部分：分词子系统、句法语义子系统、总控部分。在总控部分的协调下，分词子系统可以获得有关词、句子等的句法和语义信息来对分词歧义进 行判断，即它模拟了人对句子的理解过程。这种分词方法需要使用大量的语言知识和信息。由于汉语语言知识的笼统、复杂性，难以将各种语言信息组织成机器可直 接读取的形式，因此目前基于理解的分词系统还处在试验阶段。</p>
<p><u>3、基于统计的分词方法</u></p>
<p>从形式上看，词是稳定的字的组合，因此在上下文中，相邻的字同时出现的次数越多，就越有可能构成一个词。因此字与字相邻共现的频率或概率能够较好的反映成 词的可信度。可以对语料中相邻共现的各个字的组合的频度进行统计，计算它们的互现信息。定义两个字的互现信息，计算两个汉字X、Y的相邻共现概率。互现信 息体现了汉字之间结合关系的紧密程度。当紧密程度高于某一个阈值时，便可认为此字组可能构成了一个词。这种方法只需对语料中的字组频度进行统计，不需要切 分词典，因而又叫做无词典分词法或统计取词方法。但这种方法也有一定的局限性，会经常抽出一些共现频度高、但并不是词的常用字组，例如“这一”、“之 一”、“有的”、“我的”、“许多的”等，并且对常用词的识别精度差，时空开销大。实际应用的统计分词系统都要使用一部基本的分词词典（常用词词典）进行 串匹配分词，同时使用统计方法识别一些新的词，即将串频统计和串匹配结合起来，既发挥匹配分词切分速度快、效率高的特点，又利用了无词典分词结合上下文识 别生词、自动消除歧义的优点。</p>
<p>到底哪种分词算法的准确度更高，目前并无定论。对于任何一个成熟的分词系统来说，不可能单独依靠某一种算法来实现，都需要综合不同的算法。笔者了解，海量 科技的分词算法就采用“复方分词法”，所谓复方，相当于用中药中的复方概念，即用不同的药才综合起来去医治疾病，同样，对于中文词的识别，需要多种算法来 处理不同的问题。</p>
<p><strong>分词中的难题</strong></p>
<p>有了成熟的分词算法，是否就能容易的解决中文分词的问题呢？事实远非如此。中文是一种十分复杂的语言，让计算机理解中文语言更是困难。在中文分词过程中，有两大难题一直没有完全突破。</p>
<p><u>1、歧义识别</u></p>
<p>歧义是指同样的一句话，可能有两种或者更多的切分方法。例如：表面的，因为“表面”和“面的”都是词，那么这个短语就可以分成“表面 的”和“表 面的”。这种称为交叉歧义。像这种交叉歧义十分常见，前面举的“和服”的例子，其实就是因为交叉歧义引起的错误。“化妆和服装”可以分成“化妆 和 服装”或者“化妆 和服 装”。由于没有人的知识去理解，计算机很难知道到底哪个方案正确。</p>
<p>交叉歧义相对组合歧义来说是还算比较容易处理，组合歧义就必需根据整个句子来判断了。例如，在句子“这个门把手坏了”中，“把手”是个词，但在句子“请把 手拿开”中，“把手”就不是一个词；在句子“将军任命了一名中将”中，“中将”是个词，但在句子“产量三年中将增长两倍”中，“中将”就不再是词。这些词 计算机又如何去识别?</p>
<p>如果交叉歧义和组合歧义计算机都能解决的话，在歧义中还有一个难题，是真歧义。真歧义意思是给出一句话，由人去判断也不知道哪个应该是词，哪个应该不是 词。例如：“乒乓球拍卖完了”，可以切分成“乒乓 球拍 卖 完 了”、也可切分成“乒乓球 拍卖 完 了”，如果没有上下文其他的句子，恐怕谁也不知道“拍卖”在这里算不算一个词。</p>
<p><u>2、新词识别</u></p>
<p>新词，专业术语称为未登录词。也就是那些在字典中都没有收录过，但又确实能称为词的那些词。最典型的是人名，人可以很容易理解句子“王军虎去广州了”中， “王军虎”是个词，因为是一个人的名字，但要是让计算机去识别就困难了。如果把“王军虎”做为一个词收录到字典中去，全世界有那么多名字，而且每时每刻都 有新增的人名，收录这些人名本身就是一项巨大的工程。即使这项工作可以完成，还是会存在问题，例如：在句子“王军虎头虎脑的”中，“王军虎”还能不能算 词？</p>
<p>新词中除了人名以外，还有机构名、地名、产品名、商标名、简称、省略语等都是很难处理的问题，而且这些又正好是人们经常使用的词，因此对于搜索引擎来说，分词系统中的新词识别十分重要。目前新词识别准确率已经成为评价一个分词系统好坏的重要标志之一。</p>
<p><strong>中文分词的应用</strong></p>
<p>目前在自然语言处理技术中，中文处理技术比西文处理技术要落后很大一段距离，许多西文的处理方法中文不能直接采用，就是因为中文必需有分词这道工序。中文 分词是其他中文信息处理的基础，搜索引擎只是中文分词的一个应用。其他的比如机器翻译（MT）、语音合成、自动分类、自动摘要、自动校对等等，都需要用到 分词。因为中文需要分词，可能会影响一些研究，但同时也为一些企业带来机会，因为国外的计算机处理技术要想进入中国市场，首先也是要解决中文分词问题。在 中文研究方面，相比外国人来说，中国人有十分明显的优势。</p>
<p>分词准确性对搜索引擎来说十分重要，但如果分词速度太慢，即使准确性再高，对于搜索引擎来说也是不可用的，因为搜索引擎需要处理数以亿计的网页，如果分词 耗用的时间过长，会严重影响搜索引擎内容更新的速度。因此对于搜索引擎来说，分词的准确性和速度，二者都需要达到很高的要求。目前研究中文分词的大多是科 研院校，清华、北大、中科院、北京语言学院、东北大学、IBM研究院、微软中国研究院等都有自己的研究队伍，而真正专业研究中文分词的商业公司除了海量科 技以外，几乎没有了。科研院校研究的技术，大部分不能很快产品化，而一个专业公司的力量毕竟有限，看来中文分词技术要想更好的服务于更多的产品，还有很长 一段路。</p>
<p>本文来自<a href="http://blog.csdn.net/tember/archive/2006/02/19/602622.aspx" target="_blank">http://blog.csdn.net/tember/archive/2006/02/19/602622.aspx</a></p>
<h3  class="related_post_title">读过此篇文章的读者也读过：</h3><ul class="related_post"><li><a href="http://www.nupt.org/171" title="不要随便的相信网赚广告">不要随便的相信网赚广告</a></li><li><a href="http://www.nupt.org/132" title="测试一下">测试一下</a></li><li><a href="http://www.nupt.org/152" title="高考和端午节">高考和端午节</a></li><li><a href="http://www.nupt.org/30" title="一个有意思的搜索引擎">一个有意思的搜索引擎</a></li><li><a href="http://www.nupt.org/188" title="一周碎碎念">一周碎碎念</a></li><li><a href="http://www.nupt.org/169" title="终于放假了">终于放假了</a></li><li><a href="http://www.nupt.org/37" title="近日期中考试，没有更新博客！">近日期中考试，没有更新博客！</a></li><li><a href="http://www.nupt.org/19" title="翻译《The Art of the Content Site》第三波">翻译《The Art of the Content Site》第三波</a></li><li><a href="http://www.nupt.org/153" title="Joomla消息管理">Joomla消息管理</a></li><li><a href="http://www.nupt.org/51" title="DedeCMS2007,马上释出">DedeCMS2007,马上释出</a></li></ul>]]></content:encoded>
			<wfw:commentRss>http://www.nupt.org/56/feed</wfw:commentRss>
		<slash:comments>4</slash:comments>
		</item>
	</channel>
</rss>
