搜索引擎工作原理之语意分析

来源:一大把网站博客      2007/11/1   浏览3732次   

今日,据国外媒体报道,一家名为Powerset的创业公司正开发能采用“自然语言”的搜索技术,以取代当前流行的“关键词”搜索方式。这个信号无疑又是对搜索引擎技术的一大挑战。据分析人士称,如果Powerset技术能够得以完善无疑将对谷歌、雅虎和微软等主流搜索服务商构成威胁。

他们所指的“自然语言”搜索,即用户可键入更为直接的问题,如可键入“史蒂夫·乔布斯对苹果有何看法?”这样的句子,然后将得到更准确的查询结果。而目前关键字的搜索方式通常是键入“苹果史蒂夫·乔布斯看法”等不能组成句子的词汇。这种自然语言搜索的工作方式让搜索引擎更智能化了,最终应归根到搜索引擎的语意分析上,已能突破目前的技术瓶颈。

所谓的语意分析,也就是当用户在客户端将自己输入的信息递交给搜索引擎服务器的时候,搜索引擎服务器首先要对所收到的信息进行语意分析,它需要知道用户想要什么,它需要理解你输入的“半年”“六个月”是一个时间概念,然后才能对自己数据库中存有的信息进行索引,之后再去网站排序分析等方面的事情。

首先,我认为语意分析能力的高低是衡量一个搜索引擎水平高低的一个重要指标!因为搜索引擎最终服务于人,我不相信现在一个刚刚上网的人在使用搜索引擎的时候能知道自己该输入什么关键词。我们目前的搜索引擎在技术的语意分析上仍不能满足所有用户的需求,那些可爱的菜鸟们,他们可能还需要帮助文件的帮助来完成。如果哪天所有的搜索引擎上再也找不到一个帮助文件链接了,那才是搜索引擎语意分析环节真正成熟的一天。正如上面所言,我们完全可以在随心所欲搜索引擎里打上我们想说的话,搜索引擎很快的帮我们找回你想要的答案。

拿国内的GOOGLE和百度来说,GOOGLE的语意分析环节明显要比百度做的要好,这也可能是老大不愧是老大的技术优势吧。

百度请不要自惭形秽于自己的有眼无珠,GOOGLE亦不要忘形于“穿个马甲我照样认识你”的自信,这只是你趋向智能化的一个裙角。中国数亿个饥渴的网民期待着你们以后能有更好的表现!

革命尚为成功,同志仍需努力!


(责任编辑:)


中电动车网版权声明:
中电动车网转载作品均注明出处,本网未注明出处和转载的,是出于传递更多信息之目的,并不意味着赞同其观点或证实其内容的真实性。如转作品侵犯署名权,或有其他诸如版权、肖像权、知识产权等方面的伤害,并非本网故意为之,在接到相关权利人通知后将立即加以更正和删除。

相关阅读

用户评论

游客
发表评论

全部评论

  快讯 更多>
最新评论