“我也不怕告诉你们,我搞了15个月的p人脸识别技术,只是我在深度学习型人工智能方面的试水作品,主要是为了培养团队。从明年,也就是06年开始,我会把人工智能的主要努力方向,放到用户行为分析、偏好分析上面。
最终实现用人工智能揣摩用户喜欢什么,从而把他喜欢的内容产品推送给对方这种商业模式。我相信,这一天实现的时候,不管是叮铛网还是某点网,或者nn,正版付费用户的规模都会产生一个数倍乃至数十倍规模的爆炸。
到时候,内容产业会迎来一个盗版的垃圾资源容易找,但是盗版的、知道你品味的好书好歌好游戏难找,用户或许不会为纯粹的内容付费,但是他们不得不为内容知道他喜欢什么内容的人工智能组合套餐付费。”
顾诚用一句轻松的展望,把马风和丁三石都拉到了一个悠然神往的世界里。
丁三石是做内容产业的,从游戏到音乐,他深知国内的盗版问题有多严重。而如果可以解决盗版问题,足以养活多几十倍乃至百倍的内容产业者,并且把细分需求的长尾效应发挥到何等极致的程度。
“你你在长尾理论这本书里写的未来远景,原来在多年之前你就已经知道要怎么去实现了?这这也太夸张了吧,你写长尾理论的时候,你连杰夫辛顿教授的名字都没听说过,也不认识吧?那个世界上都还没有深度学习型人工智能这个概念,你是怎么预言未来会有这么一种技术来实现你的布局的?”
丁三石觉得自己的大脑已经不够用了。他这辈子没服过几个人,虽然他很服顾诚,但直到今天,他才发现跟顾诚一比,他自己完全就是井底之蛙啊。
除非顾诚是先知或者穿越者,否则怎么可能在两三年之前就预料到今天才略微看得到一点萌芽的未来传媒分发形态?
“你猜对了,我在写长尾理论之前,就已经看到今天,甚至看到三年五年之后了。”顾诚毫不谦虚地承认了。他需要这种铁口直断的威望,来让丁三石和马风对自己深信不疑。
“那你今天把这些都告诉我们,你就不怕我们也开始布局,跟马腾那样抄袭你的套路么?”马风对人性的认识更加深刻,第一时间觉得顾诚似乎有什么有恃无恐的阴谋。
顾诚没心没肺地笑了,笑得非常君子坦荡荡:“抄?怎么抄?大数据在我手上,你们有么?人工智能的算法在我手上,你们有么?这些都没有,就算知道我的思路,你们拿什么抄?”
马风一愣,心说确实是这个道理。
难怪顾诚有恃无恐了。
马风暗忖顾诚这人如果不是抱有什么目的,很少跟同行吐露这么多干货的。今天突然说这些,莫非是另有所图?于是他自然而然地问道:
“那你今天和我们说这么多,究竟有何图谋?总不会是突然给我们扫盲开眼的吧?”
顾诚见被戳穿了,也就不再掩饰:“马哥就是贼啊,一下就看出来了。行,那我也不瞒着你们,实话说了吧。未来的深度学习型人工智能,要想运作得好,需要的配套条件千头万绪,我也不可能一个人包打天下,从头做到脚。所以有些配套,我觉得未来会有一定前途,但是还不配我亲自出手的,你们今天要是有意向,就可以自己找资源准备起来了。”
马风和丁三石的耳朵一下子就竖起来了。
顾诚这家伙创造的奇迹太多了,哪怕是他拔根毛下来,一点微末的看不上的小生意,那背后都是无限商机。
当然了,顾诚看不上的生意,一般做起来肯定比较辛苦,或者低俗,要不无法形成垄断不能常年暴利,只能赚个几年快钱,然后就要陷入低门槛的激烈竞争。
但即便如此,那也肯定是一门普通人求都求不来的商机。
见哥们儿都听得很认真,顾诚也不藏着掖着,干脆地伸出三根指头,比划着说:
“未来要做好深度学习型人工智能,关键有三方面的条件。
第一是要有好的算法,这个是核心,就像是软件。
第二是要有充分的大数据,这个就相当于是软件里的输入素材。而且深度学习型软件是可以自我优化自我进化的,输入素材越多、数据标示越好最终的效果就越好越精准。一旦某一方面的大数据有优势,未来的巨头可以很快形成滚雪球效应,跟后来者拉开差距。
第三,就是要有处理这些天量数据的硬件处理速度以目前的人工智能运算量来看,哪怕是解决最简单的图片识别,或者语音智能识别,甚至只是输入法频次统计反馈,都不是任何一个单独的服务器可以承载的。或许每一个需求,都要用一个数据中心的处理能力去处理。
但是同时,每个数据中心处理的多个问题又可能有很高的重复率,数据处理过程量的复用率会很高。所以拥有越多处理需求、越多处理硬件资源的企业,在处理效率上就会有明显的优势。这时候,我们就会发现,依靠传统的为每一个新的业务需求购置一批服务器、搞一个专门的数据中心,效率会非常低下,成本会非常高昂”
顾诚刚说到这儿,被不怎么懂技术的马风给打断了:“那么怎么解决这一点呢?如果只是钱贵的话,那也不是什么大问题,我们费钱别人也费钱,大家一起涨价不就行了?”
“呵呵如果是你贵我也贵,确实问题不大,涨价就是了。但是如果人工智能的应用成本太高,它对传统产业和传统咨询类人工岗位的替代效应就不明显了。用人工智能大面积解决问题,必须是其成本明显低于雇佣人类客服、记者、编辑、老师、咨询师、查法律文书卷宗的基层律师、只会开票的基层会计师
资本家才会把这些重复脑力劳动的基层白领开除掉,改用机器人。不解决成本问题,或许你不会被其他人工智能竞争对手同行甩开,但对于整个人工智能行业消灭人类岗位的进程,起码会造成三到五年的延后。”
马风还在琢磨其中的算计,丁三石却已经听懂了:“确实,就跟今年我看到滨江咱黄易总部隔壁,有几家做新兴产业的公司,虽然大家都贵,但是卖不出去的主要原因不是因为比同行贵,而是买了的产品之后,售价减去产品全生命周期内省下来的电费,依然比节能灯都贵,所以那些物业老板才不买。我跟其中一家叫罗莱迪斯的公司老板喝过几次功夫茶,就听他说起过这事儿。
还有隔壁的海康威视,早几年也是这个情况一套监控卖那么贵,之所以卖不出去,不是因为它比竞争对手大华家卖得贵,而是因为多装这几套监控的成本,比多雇佣一个保安都贵了,才卖不出去。这两年成本下来了,那些精明的企业主才开始多装监控少雇保安。”
马风的见识还是很广博的,他做电商起家,各行各业都了解一点。听了丁三石举的例子,他马上就想通了。
人工智能的普及,说到底是跟人力成本在p价钱,不是跟同行p价钱。比人便宜才有资本家用。
于是他诚恳地追问顾诚:“那小顾你觉得,有什么快速降低人工智能运算成本的办法呢?总不能让我们去投资英特尔,指望硬件厂商把单位计算效能的p价钱加速猛降下来吧?”
“当然不是。”顾诚端起茶杯,作势喝了一口,表情很淡定,“首先,p的架构模式,处理深度学习算法需要的并行数据处理时,效率还是太低了。就算要在硬件上下手,也不该找英特尔。”
应该找英伟达,但是这句话顾诚就敝帚自珍了,没必要告诉马风和丁三石。
他从02年就收购了公司,在人工智能用p领域的布局,已经占到了先机。未来不管是挖英伟达的技术团队、积累技术储备,还是直接想办法到英伟达投资,都很灵活。
这事儿,他自己就能做,不需要马风和丁三石的配合。
他今天需要说出来的,都是些他不愿意啃的硬骨头。
“其次,即使不在硬件的物理指标上争取跨越式发展,我们还可以在资源配置效率上做文章这个解决方案,就叫做云计算。利用未来网络的进一步便利,把各大互联网公司的数据中心整合起来。
或者让专门的服务器数据托管公司形成虚拟服务器虚拟数据中心的架构,实时优化调度计算资源,把闲置的计算力量以一个相对较低的价格临时、分时租赁给出现处理需求的人工智能公司用这些招数,可以轻松做到在硬件物理性能没有飞跃的情况下,靠优化配置节约数倍的计算资源成本。”
“你说的这招,目前技术上实现得了?”马风和丁三石异口同声地狐疑道。
顾诚淡定地耸耸肩:“比较难,但是已经有机会年初的时候,英特尔公司就开始力推双核p处理器了,对多线程计算的分配效率和架构也做出了很大优化。我们公司,目前就基于此基础,尝试了内部代码编译服务器的分布式编译架构。你们不信的话可以去参观一下。”