中关村大数据产业联盟秘书长赵国栋一行到访智慧星光


2016年9月,中关村大数据产业联盟秘书长赵国栋先生、战略合作部会员服务部主任王维先生、行研部总监葛靖瑜女士、陈邢锐先生以及联盟单位代表等一行七人来到位于北京中关村的智慧星光总部交流访问。


此次来访,赵秘书长特意带来了两本自己的著作《产业互联网》和《大数据时代的历史机遇》赠送给智慧星光董事长李青龙先生,李青龙董事长接过两本著作后表示“书籍就是知识,知识就是财富,感谢秘书长为我们送来了这么好的财富。”就这样,交流会在愉快的气氛中开始了。



首先,李青龙董事长为大家介绍了智慧星光的公司情况,分享了技术优势以及产品、服务和数据应用。在谈到技术优势时着重介绍了智慧星光在数据采集和数据处理两方面的独特技术。


在数据采集方面智慧星光拥有两项颠覆性的创新技术,一个是协作式爬虫,一个是流式处理技术。通过协作式爬虫每日可以检索5亿条,经过去重等处理新增原创信息即将突破1亿条;通过流式处理技术每分钟可以处理200万篇文本,比传统模式的2000篇/分钟高出1000倍。为什么性能有这么高的提升呢?答案就是,突破思维习惯,逆向思维,大胆创新。大家都知道互联网信息的采集和检索主要应用分词和索引两项技术,在大数据时代来临之前这两种技术发挥了巨大的作用,在人类与互联网之间建立了沟通的桥梁。但是随着大数据时代的到来,这两种技术却成为了造成数据拥堵,新词无法检索,数据处理速度无法提升等问题的瓶颈所在。智慧星光通过“去分词”、“去索引”的技术,实现了关键的突破。


中关村大数据产业联盟秘书长赵国栋一行到访智慧星光


不分词大大节约了文本处理的时间,同时也解决了新词检索的问题,形成一个良性的发展态势。在索引的问题上,智慧星光用流式处理代替了传统的索引技术,在这里,李青龙董事长用了一个编制筛子的生动比喻为大家解读了枯燥的技术问题。



赵秘书长听了智慧星光的技术优势介绍后表示大开眼界,很赞赏智慧星光在技术研发上的努力,认为智慧星光有着成为在文本大数据领域领军的生态企业的潜力和胸怀。


接下来,李青龙董事长又针对标准化产品和数据应用进行了介绍,包括:舆情监测产品、智慧网评产品、可视化产品、银行投诉数据分析项目、APP数据采集项目、国家机构舆情全流程项目、证券交易所互联网调查项目、虚拟社会精细化管理数据应用等项目。最后,与会嘉宾畅所欲言,就关心的问题进行了深入交流。


分享到: