December 03, 2004
商品搜索引擎::[Search Engine]

朋友私下里将他们完成的第一个商品搜索引擎给我试用了一下,真得感觉非常不错。
其实商品搜索引擎去年的时候他们就开始设计开发了,一直以来没有动向,我都忘记这这件事情了,知道今天收到email才知道原来已经做好了。
记得去年Google 的 froogle.com刚出来的时候,甚是惊讶,觉得google怎么会往买卖商品上走,当然今天google做什么我都不会惊讶了,当初不是。
商品搜索引擎的根据地当然是网络销售商了,将物品作为主要的搜索对象而且对于每种物品的通用情况建立如下的一些参数:
商品名称/别名等|商品来源(网站)|商品的联接|商品的描述|商品的照片|商品的价格|商品的运输/投递|商品的评价|商品的过期时间|购买的付款方式|商品的销售情况/销售量
1] 以上的参数如果盲目的采用爬虫的技术去进行抓取,将会非常困难,需要非常强的人工智能。2] 如果有人工参与的情况下,可以逐个网站建立parse的方案,有一些则需人工收集,也比较可行。
朋友的商品搜索引擎有几十个网上商场的信息,不算太大,完全可以采取以上的方法2。
3] 网上商家按照商品搜索引擎要求提供XML输出,通过加密渠道给搜索引擎作为来源,省去了爬虫的烦恼。
4] 更新性的商品增加通过独立协议发送给搜索引擎。
3] + 4] 将会将商品搜索引擎的开发难度降低许多,也是部分商品搜索采取的模式。无论如何,多元化的搜索引擎已经越来越丰富我们的生活了。
Posted at December 3, 2004 12:26 PM by Liang at 12:26 PM | Comments (4) | TrackBack(1) | Booso!| Niu.la收藏!Trackback
You can ping this entry by using http://www.wespoke.com/cgi-bin/mt/mt-tb.cgi/669
Trackbacked from http://world-poker-tour-2005-en.bargarmetal.com with excellent! i enjoyed reading your material. on .
Comments
恩 我实在不知道这个问题应该在那里问了(要是有不妥只处请谅解)
我以前看的一本书上提到过一种程序,他能根据页面的html标签搜索某个标记(比如)后有效的地址,本根据地址生成相应的数据库。我找这种程序很久了。但是一直都没找到,就找到这来了。 还有想问一下有没有小型的搜索引擎 只是针对自己站点的搜索引擎呢?
"网上商家按照商品搜索引擎要求提供XML输出,通过加密渠道给搜索引擎作为来源"
这样岂不是要求商家统一XML输出格式?如果没有统一,搜索引擎建索引将十分混乱;
另外,我对“数据通过加密渠道给搜索引擎”不是很理解,为什么要对数据进行加密呢,这些商品数据不能公开么?
Posted by: cansea at January 13, 2005 09:19 PM from 218.247.163.2这些商品数据都是公开的呀
全自动不太现实 但人工参与就很简单了 好的b2c网站也不是很多 采集五百个站点 顶天了.
你朋友的商品搜索引擎发展如何了?我们也有一个www.souro.com/compare/ :) 多交流。
Posted by: shijun at July 4, 2005 04:00 AM from 148.87.1.171