谷歌一电子商务商业模式实验报告

谷歌一电子商务商业模式实验报告

ID:45986669

大小:84.50 KB

页数:10页

时间:2019-11-20

谷歌一电子商务商业模式实验报告_第1页
谷歌一电子商务商业模式实验报告_第2页
谷歌一电子商务商业模式实验报告_第3页
谷歌一电子商务商业模式实验报告_第4页
谷歌一电子商务商业模式实验报告_第5页
资源描述:

《谷歌一电子商务商业模式实验报告》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、谷歌一电子商务商业模式实验报告广东金融学院实验报告课程名称:电子商务概论第1页共12页2.3业务流程的描述%1Google使用高速的分布式爬彳亍器(Crawler)系统中的漫游遍历器(Googlobot)定时地遍历网页,将遍历到的网页送到存储服务器(StoreServer)屮。%1存储服务器使用zlib格式压缩软件将这些网页进行无损压缩处理后存入数据库Repository(贮藏室)中。Repository获得了每个网页的完全Html代码后,对其压缩后的网页及URL进行分析,记录下网页长度、URL、UR

2、L长度和网页内容,并赋予每个网页一个文档号(docID),以便当系统出现故障的时候,对以及时完整地进行网页的数据恢复。%1索引器(Indexer)从Repository中读取数据;%1将读取的数据解压缩后进行分析,它将网页中每个冇意义的词进行统计后,转化为关键InJ(wordlD)的若于索引项⑴its),生成索引项列表,该列表包插关键词、关键词的位置、关键词的人小和人小写状态等。索引项列农被存入到数据桶(Barrels)中,并生成以文档号(docTD)部分排序的顺排档索引。索引项根据其重要程度分为两种

3、:当索引项屮的关键词出现在URL、标题、锚文本(AnchorText)和标签中时,表示该索引项比较重要,称为特殊索;引项(FancyHits);其余情况则称为普通索引项(PlainHits)0在系统中每个Hit用两个字节(byte)存储结构表示:特殊索引项用1位(bit)表示人小写,用二进制代码111(占3位)表示是特殊索引项,其余12位有4位表示特殊索引项的类型(即hit是出现在URL、标题、链接结点还是标签中),剩下8位表示hit在网页中的具体位置;普通索引项是用1位表示人小写,3位表示字体人小,

4、其余12位表示在网页中的具体位置。(补充其他内部业务信息:)%1特殊索引项用來表示位置的信息(8位)将分为两部分:4位表示AnchorText出现的具体位置,另4位则用来与表示AnchorText所链接网页的docID相连接,这个docID是由URLResolver经过转化存入顺排档索引的。%1索引器除了对网页中有意义的词进行分析外,还分析网页的所有超文木链接,将其AnchorText、URL指向等关键信息存入到Anchor文档库中。%1索引器生成一个索引词表(Lexicon),它包括两个部分:关键词

5、的列表和指针列表,用于倒排档文档相连接(如图3所示)o第5页共12页④索引器述将分析过的网页编排成一个与Repository相连接的文档索引(document,nbsplndex),并记录下网页的URL和标题,以便对以准确查找出在Repository中存储的原网页内容。而且把没有分析的网页传给URI,Server,以便在下一次工作流程中进行索引分析。%1URL分析器(URLResolver)读取Anchor文档中的信息,然后做⑥中的工作。%1Q)将其锚文(AnchorText)所指向的URL转换成网页

6、的docID;(b)将该docID与原网页的docID形成"链接对”,存入Link数据库中;(c)将AnchorText指向的网页的docID与顺排档特殊索引项AnchorHits相连接。%1数据库Link记录了网页的链接关系,用來计算网页的PagoRank值。%1文档索引(document,nbsplndex)把没有进行索引分析的网页传递给URLServer,URLServer则向Crawler供待遍历的URL,这样,这些未被索引的网页在卜-一次丁作流程中将被索引分析。%1排序器(Sorter)対数

7、据桶(Barrels)的顺排档索引重新进行排序,生成以关键词(wordID)为索引的倒排档索引。2.4盈利模式分析Google的主要盈利模式是在网络广告这一块,其提供的服务和内容是多元的发展和趋势。Google而对两种重要的客户:一种是普通的google用户,另外一种是与google用直接经济交易的商业客户。对于前者,google向其提供免费的信息检索服务,赚取网络点击率;而后者,google向其提供技术或广告宣传,并取得实质的经济收入,这是其得以持续发展在经营的资金來源。1、搜索技术搜索引擎技术的开

8、发成本很高,对于一些需要利川搜索技术,但其核心不是搜索服务的企业來说,不愿将巨额的人力、物力花费在搜索技术的硏发上,史倾向于从经营人型搜索引擎的企业购买相关的搜索技术。google作为全球最大的搜索引擎,其强大的信息处理技术及其他的搜索引擎相关技术都町以作为技术产品授权出售,为其带來经济利益。Google搜索引擎,使用一种自创的称为PageRank(网页级别)技术來索引网页,索引是由程序“Googlebot”执行的,它会第6页共12页定期地请求访问已知的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。