。”
技术总监觉得安夏说的有道理,在他心中,搜索引擎就是个查号台,用的人可能不多,不过还是得有。
如果他知道后世有人在百度上搜索谷歌,不知道会不会大跌眼镜。
当技术一开始研发,他就发现了问题。
搜索引擎的技术含量比早期的ft文件搜索器要高许多。
首先要打通的难关是用什么方法才能找到拥有对应字符的网页。
现在国外域名已经有很多,散落在互联网的世界中,总不能要他们像登记黄页一样,一个一个的上报吧
技术总监用力抓了抓日渐稀少的头发。
听到汇报之后,安夏心想难道现在还没有爬虫技术
嗯应该有办法解决的。
怎么解决来着我是一产品经理,没干过这事啊
安夏在自己仅存的技术记忆中搜寻相关知识,唉,让他们先试试吧,实在不行,就去麻省理工,把爬虫发明者抓来。
“你们先试试选一些网页,把链
接地址作为种子ur,把它们放进待抓取的队列中,做个程序,读取这些ur,然后再通过dns,哦,就是域名系统解析,可以转换成网络服务器对应的i地址。
然后下载对应页面,就可以抓取网页上的相关数据了大概是这样的原理。”
“哦原来如此”技术总监恍然大悟。
然后他高高兴兴地走了。
安夏困惑地看着他离开的背影。
什么
他懂了
他懂什么了
我也是先看过爬虫,才能记住这么长的东西
他居然已经“原来如此”了
算了不跟有天赋的人计较,他们都不是人
安夏放弃纠结,安安心心地冲了一杯咖啡,看她的股市信息了。,请牢记:,免费最快更新无防盗无防盗