目前创办一家数据挖掘的公司难点在哪里?

比如技术,市场/客户。回复内容:

2013年5月10日,在淘宝十周年晚会-马云退休演讲中,马云说:这是一个变化的时代。还有人没搞清楚pc,移动互联网来了;还没搞清楚移动互联网,大数据来了。而变化的时代是年轻人的时代。

马云说的这句话很关键,他不仅提到了大数据,而且更是用一句话阐述了互联网从pc时代,进化到移动互联网时代,然后从移动互联网时代进阶到了大数据时代。有几个关键点很重要:

pc时代,全球催生了大量的互联网上市企业,包括谷歌、亚马逊、新浪、搜狐、新东方等等;

移动互联网时代,中国创业热潮风生水起,不仅有大量的移动互联网(包括手游)企业赴美上市,更是诞生了无数个创业奇迹;如:陌陌科技公司、中国手游娱乐集团有限公司均在纳斯达克上市;飞鱼科技、云游控股(forgame)和蓝港互动均在香港上市;而掌趣科技和北纬通信在深圳证券交易所成功挂牌上市。移动互联网不仅为我们的生活带来了便利,更是把创业热潮推向了历史最高峰。

现在问题来了,大数据时代,创业热潮是不是应该比移动互联网时代更加热闹呢?大数据时代如何创业?大数据创业的门槛又有哪些呢?

先回答第一个问题:大数据时代,创业热潮是不是应该比移动互联网时代更加热闹呢?

据我了解,不是。走在中关村创业大街上,你能收到的100份融资bp里,可能有99份都是app和o2o项目,但99家里90%以上会重视大数据。

那么大数据时代如何创业呢?请先了解一下大数据的创业门槛。

门槛一:数据

大数据大数据,没有数据怎么玩?那么数据从哪里来呢?

像百度、腾讯和阿里巴巴这样的bat企业,本身就积累了大量的数据,所以他们玩起大数据来,多半是“闷声发大财”。当然了,也可以举几个bat企业玩大数据的例子,比如说百度旗下的“百度迁徙”、“百度精算”、“百度舆情”、“百度大数据预测引擎”等等,都是百度的大数据产品应用;阿里巴巴的话,“阿里云”、“支付宝-花呗”、“支付宝-借呗”“芝麻信用”、“蚂蚁金服”等等,都应用了大数据技术。而腾讯方面,“腾讯广点通”、“腾讯云分析”和微信等也都应用了大数据技术。

尔等屌丝没有数据,如何玩呢?

首先,你可以通过第三方购买数据,比如说,数据堂就有很多数据出售和分享;其次,你可以用爬虫爬回一些数据来存储;再者,通过给企业、开发者、站长等等授权使用大数据工具来积累数据。这方面的新创企业包括talkingdata、友盟和dataeye等。最后,使用免费的政府、企业、和机构开放数据。比如说高德数据的api接口和微博商业数据api接口等等。

总体来说,解决好数据源是大数据创业的必要门槛。关键看你创业的项目是什么。

门槛二:硬件

在北京,我曾经参观过一家大数据初创企业,当时他们还没有拿到融资。我去他们的办公区发现一幕特别心酸的事情。他们的员工挤在一间很小的屋子里办公,而两件较大的屋子都用来安放大数据存储服务器。

大数据的存储量是很惊人的,这对机房和硬件设备也提出了新的挑战。这一点和移动互联网不太一样,你做一个app,用电脑搞开发,服务器用云服务器就行,按需购买。但是大数据不行,你没法把自家的数据存储在别人的云服务器上,一方面是安全因素,另外一方面也有产权因素。硬件也是大数据创业的门槛之一,但不是最大的门槛。

顺便补充一句,我曾经参观过的那家大数据新创企业,目前已完成百万美元的a轮融资,现在他们家的办公区特别宽敞,恭喜星图数据。

门槛三:人才

我认为大数据创业的最大门槛在于人才。和做app不一样,大数据创业你一个人乃至几个人都是没法玩转的。初创企业你就往10-15人这样的团队先招人吧,这样的团队要包括hadoop工程师、算法工程师,数据建模工程师、架构师、nosql工程师、bi工程师等等,全都是技术要求较高、薪资要求也很高的人才。大数据人才有多贵?在美国,在r、nosql和mapreduce方面需求的专业人才薪水达到了每年约11万5千美元,在中国也便宜不到哪里去,没有年薪30万,你很难招到一个大数据人才。

据中国商业联合会数据分析专业委员会统计,未来中国基础性数据分析人才缺口将达到1400万,而在bat企业招聘的职位里,60%以上都在招大数据人才。也就是说,技术很牛的大数据人才,他的选择面很宽,要么早就进入bat企业,要么也是在不错的企业拿着高薪,你要挖这样的人才,除了钱,股票、期权、福利等等,都是必须付出的代价。

2015年-2016年是大数据人才最为匮乏的两年,原因很简单,各大刚刚开通了大数据科目的院校,学生还没毕业;而招聘市场上的大数据人才需求量远远已经供不应求。除了bat企业,通信企业、电力企业、金融银行行业、医疗行业、工业、游戏行业等等,哪个行业不是都在招大数据人才?创业公司要在这么严峻的人才环境中找到适合自己的大数据技术人才,门槛可不止是钱。

门槛四:技术

说了人才,就要说技术了。大数据技术不是你懂c++或者r语言就够了的,大数据有一整套自己的技术体系,包括统计、编程、java、数据库、hadoop、spark、nosql、机器学习、自然语言处理、算法、数据可视化等等技术。光是hadoop需要用到的技术和编程语言就有很多项。而且市面上的大数据工具每家用的还不一样,用开源软件(如hadoop、spark)或者用sap(sap hana)需要的技术也不一样。技术要求较高,而拥有大数据综合技术的人才又较少,这也成为了制约大数据创业的最大问题。

门槛五:钱

其实我不想写钱,但是又必须写钱。大数据行业创业不缺资本,只要你创业项目的商业模式没问题,并且技术能力强,且团队靠谱,无论在中国还是在美国,融个a轮还是没有问题的,资本关注度很热。但是你在拿到融资之前,自己启动的资金就需要一大笔。人才、硬件和技术成本都较高。这么理解吧,如果说,几个好朋友凑50万花3个月可以做一个app项目,那么要在大数据行业创业的话,请先准备600-800万再来玩。

门槛六:商业模式

中国互联网上最赚钱的行业是什么?我认为是电子商务和网络游戏。电子商务和网络游戏也是互联网变现最快的行业。而大数据,它的变现能力不如网络游戏和电子商务那般简单直接。在我拜访过的很多企业中,他们手里有钱、有数据、有人才也有技术,但是他们不知道自己手里的数据可以拿来做什么。也就是说,大数据目前没有最明朗最直接的商业模式。

大数据只有和业务场景结合,才能产生价值。

大数据就像石油原油一样,你知道它在哪里,你可以开采它,但是开采出来你还需要冶炼,并且经过减压蒸馏、加氢精制、溶剂精制、溶剂脱蜡等炼制过程,成为成品油后运送到各个加油站,让汽车加满油后产生了动力才实现最终价值。大数据也一样,需要一整套复杂的过程才能实现商业价值。

那么你可能会问了,大数据交易算不算是商业模式呢?

我个人觉得,要看交易的是什么东西?原始的非结构化的数据,后面数据清洗需要太多的工序,数据存储也是很大的成本,这样的交易代价太高。我相信无论是企业用户也好,还是个人用户也好,大家更倾向于购买“拿来就能用”的大数据数据源。

你说京东和腾讯完成首笔大数据交易,我觉得就是一个笑话,京东和腾讯的大数据不早就整合在一起了么?我用微信直接就能在京东购物,数据是互通的,何必交易?

所以说,大数据创业最难的还是在于商业模式的思考,如果你没有找到一条让大数据变现的渠道,那么千万不要忙着拉团队创业。大数据行业创业,光有idea是不够的,跑通整个商业模式才是关键。

回答最初的问题来,大数据如何创业呢?我认为是:

一、找到一个大数据商业突破口;搞清楚你要用大数据解决什么问题,你的用户是谁?商业逻辑是什么?二、找到一笔启动资金;三、最好自己就懂一些大数据相关技术。四、找到几个可以与你同甘共苦的伙伴。五、找到你的数据来源,最好是独家的数据来源。

事实上,其实我认为目前不要着急去做大数据项目,做大数据处理工具是个不错的方向,可以先从做bi(商业智能)、crm、erp系统开始,等你有了客户,有了数据之后,回转头来做大数据项目,会更加水到渠成。

参考http://www.36dsj.com/archives/28653

你是这方面的人才或者创业者的话可以联系联系。
还是如何落地的问题,数据挖掘的范围太广,说起来太虚。还是先回答这几个问题再说:你能够解决什么样的客户怎么样的痛点?你的数据挖掘技术有什么优势或门槛?你的挖掘效果如何有效验证?这主要还是一个技术和产品驱动的活,先解决技术和产品的问题,再谈怎么铺bd吧。
找到你的用户,把他们的需求发掘出来。对数据的使用,绝大数公司都不是自觉的。
1、数据挖掘结果是否能赢得信任?特别在结果是错误的时候。2、需求是否是刚性的?客户能给你多少钱?3、业务占90%,it占10%,用人门槛很高。
有一部分来自数据本身获取
很多人都提到了帮助客户的问题,其实还可以延展一下,那就是:客户为什么需要你的数据挖掘?这个问题必须由你告诉客户,你的公司也是才因此有竞争力。需知你的客户如果已经知道他们要达到的目的是什么,那你的公司是公司吗?不是,你只不过是几个数据民工的包工头罢了。所以我认为在现在的条件下开一家数据挖掘公司最重要的是对目标公司的清晰认识,这需要你具备管理学、组织学等相关知识和非常丰富的经验。
说的有些夸张了。数据挖掘的产业链覆盖多个范畴,小团队只要专注在某个领域自然会有所斩获,前提是小团队确实有人才
你问出这问题,就基本告别这行业了,咱创办个容易的吧!
数据挖掘公司我觉得最关键的是:你能为社会或者客户带来什么好处。。能提高效率呢、还是能发现新的利润增长点? 既然是挖掘,那首先你得有可挖的数据源,这个源你如何获得?如果获得了数据源,那经过对数据的清洗,关键还是在数据分析上了。你的分析思路和分析报告,对客户的利益要害作用有多大,还需要进一步观察。。共勉吧

Posted in 未分类