公司准备做一个关于搜索引擎方面的东西,但是本人对这块不是熟悉,都需要配备什么样的资源,比如人才,软件(开源或商业的,开源优先),硬件,网络等,请大家不吝赐教。 大致的要求是能有一个爬虫去一些网站爬数据抓取回来,然后存储在本地。在用搜素技术搜索这些数据和分析这个这些对这些数据进行加工处理,方便用户使用。我们只是要求搜索某一行业的数据,而不是像百度这样可以搜索全网的数据。
回答这个问题的一个关键是,你们公司多有钱?打算在这上面花多少或有能力花多少?
有个数量级就行了,千、万、十万、百万、千万、亿、十亿。
别告诉我是50亿,这样我对这个世界就感觉不会再爱了...