【iShout】说说新浪微博的数据化产品,比如阅读数
中国的互联网产品里,能让名流共草根一色,吐槽与赞誉齐飞的,新浪微博肯定居首。远的不说,这几天新浪微博推出阅读次数指标后,不少用户虚荣心得到满足的同时,又矫情觉得数字高到虚不受补,纷纷埋怨新浪微博大举跃进高放卫星,直呼受不了这种加零行为。不过也有明眼人帮着辩护,浪浪虽浪,可 “盈利连五道口买套 140 平米的房子都难”,是不会碰嘉欣跟嘉玲的。
微博官方的反应显得很大气,他们在认真解释 “微博阅读数” 的定义,积极征集技术改进方案。但企业微博何时开放此功能无明确答案,此举有何商业动机和价值绝口不提。这又像许多人许多次的感受一样,新浪微博为技术水平和数据存量付出百倍努力,让功能十倍增加,但就是缺一线明媚的变现希望。坐拥大数据金矿,遭遇百生十、十生一的尴尬,离一生二二生三三生万物的微博生态梦渐行渐远,作为死忠的粉丝用户,有时也不禁想问,新浪微博,你们肿么了?
借这个机会,我决定全面吐槽一下新浪微博的数据相关产品。吐槽之前说一句:辣笔小喷所到之处,误伤请莫放心上。挺住就是真汉子,然后可以找留几手求虐。
点评现在开始:
微博数据中心:相关数据产品有:微数据、微指数、风云榜和微报告等。主要提供入门级分析。曾因积极学习第三方微博数据工具的长处,而被寄予厚望。可州官放火后百姓少点灯,对微博第三方数据应用的生态环境受创功不可没。不像腾讯数据平台部门那般能承担公司大数据战略重任,微博数据中心一直缺乏有想象力的重磅数据产品出现。相比淘宝已经通过数据魔方、量子恒道等大数据服务获利,微博数据中心离变现尚远。
微博搜索:提供相关、实时、热门等类别微博搜索结果,以及微博搜人服务。从发展情况来看,仍在弥补跟常规搜索引擎的差距,尚未发挥基于关系链的搜索的价值(可对照 Facebook 的 Graph Search)。微博的移动客户端索性采用第三方云云搜索服务。虽然搜索是最能进行商业变现的数据驱动类产品,但微博搜索在此方面无任何看得见的动作。
微博开放平台:接口服务经历 1.0 到 2.0 的升级,几经站外应用、移动应用、站内应用、企业应用等主推形式变换。对第三方数据挖掘类应用态度保守。试图推行企业应用收费接口,但目前报价和政策都不明朗。
智能排序及粉丝通:智能排序是新浪微博对时间线展示微博流的一次颠覆性尝试。反应多为负面,但体现了新浪微博部分产品经理数据化意识的萌芽,试图一步到位结实开花,精神可嘉。不过更像是替加插企业微博广告到用户时间流的 “粉丝通” 服务铺路,而遭受更多诟病。这两个功能过于激进地代替用户进行决策,精细化利用数据的技术远未到位。
单条微博旁的推荐功能(微博相关人、微吧、推荐微博、热门微博推荐):进行全方位的推荐,决心值得赞赏。但因为跟体验更攸关的谣言微博、水军、僵尸粉问题未得到实质解决,虽然在推荐功能上付出巨大努力,换来的用户体验感受提升并不明显。同时,因为推荐功能并未跟广告产品推荐挂钩,在无商业成效的情形下,不知新浪微博对改善推荐功能是否会有足够的虔诚和耐心。
赞按钮和阅读数:属于功能体验微创新、提升活跃度、增加数据存量的举措。“赞” 按钮虽然可以用于改善智能排序及关联推荐,但从用户感受来看,未形成正向反馈,可能流于形式。阅读数显示的技术投入巨大,但数字估测过于乐观,且无法溯源,对用户的麻痹效应可能只能持续一段时间。相信对企业微博开放赞和阅读数指标,可以提升广告溢价,但广告主如果无法精细化评估该指标的话,新浪微博在这些指标上的投入是否换来足够多回报,结果存疑。
微任务:属于新浪微博对草根大号盈利模式后知后觉、亡羊补牢产品,并与微博易、微易互通等第三方平台争食。目前看来,虽然凭借官方意志采取强制措施,交投活跃度仍然有限。身为半官方产品,居然未在微博广告转发直发效果数据的追踪上有任何作为。
自助广告系统:传说中新浪微博卸任事业部经理的彭少彬曾主导开发广告系统,而新的事业部经理王高飞也曾剧透新浪微博新的自助广告系统,但目前都再无新消息放出。而且从新浪微博新的自助广告系统截图来看,广告交易功能过于简化,充其量像个微任务的升级版,看不到太多数据驱动的影子。
SAX:有零星消息透露品友互动以实时竞价拍卖(RTB)广告需求方平台身份对接了新浪广告交易平台(SAX),但随后品友互动即遭央视 315 批评曝光。目前尚不知 SAX 隶属新浪门户还是新浪微博(常理推测属于新浪门户的比重较大)。个人觉得微博变现,除沿用类似百度的搜索竞价外,第二大希望就在于广告,建议参考 Google 基于大数据把广告网络里的广告位进行 RTB 模式拍卖的模式。新浪微博最极致和最疯狂的广告模式,就是让每个微博主的每条微博旁都有可实时竞价的广告位,而阅读曝光量等也就成为投放效果指标。当然,要这么玩需要胆识才情,不是人人胆粗如彦宏跟布林。
新浪云平台 SAE:SAE 在提供基于云计算的托管等服务上卓有成效,累积了不少用户,并已经有明确商业模式,未来可以在大数据基础服务上发力。但目前开放结构化数据服务(OTS)、开放数据处理服务(ODPS)、域名托管备案等服务的发展,连阿里云都没赶上。
新浪微博移动客户端产品:虽然来自移动端的微博已经超越 PC 端,考虑到新浪微博在移动端纷繁复杂的产品线现状,不太可能引领大数据驱动的移动产品发展,更不像有带领移动端商业模式突破的格局。移动端产品主要充当大数据收集功能和 PC 端产品的挖坟者,所以建议新浪微博及早变现,在 PC 端埋点金银财宝,让移动端挖坟能有点收获。
吐槽到此,可能也有人问,新浪微博数据算不算大数据啊,是不是就一个北京新媒体公司?我的答案是当然算大数据。在 IT 圈浮躁到人人都开始说大数据的时代,要区分真大数据和伪大数据也的确不容易。有一个简单判断方法是:若是业务需要,数据关联多、增长快、变动大,以致传统关系型数据库(RDBMS)搞不定或者不合适,而要采用 NoSQL 这种新型云存储架构时,大数据开始名副其实。新浪微博这种新型社交媒体,是典型的大数据场景。
据可靠消息,新浪微博部署的 Redis 这种 NoSQL 存储跟处理架构是全球最大规模的。这难度几乎可以类比咱们接过社会主义这种半成熟的开源产品然后做到全球最大。所以你也能理解新浪微博偶尔的宕机事故了,有兴趣的可以多跟他们@TimYang 的团队探讨沟通。
那你会说,新浪微博搞大数据到底欠缺什么?其实大数据怎么玩,目前也挺无定论。若非要找个指导方法学,我想说说伯克利大学有个叫 AMPLab 的大数据研究团队。这个名字可以说点到了大数据的精髓:A (Algorithm) 指(机器学习)算法;M (Machine) 指(云计算)机器;P (People) 指(提供数据和知识的)群众及专家。AMPLab 承担着奥巴马的大数据计划项目,他们推出的几个开源工具影响很大,国内关起门在对其进行二次改造的几个大 IT 公司最清楚。
拿 AMP 来度量一下新浪微博,我们知道新浪微博数据够多,云基建也凑合,但缺有章法的为机器学习算法投入,尤其是没有优化核心业务指标的数据科学团队。据说新浪微博目前正进行人事调整,以致数据中心和数据挖掘的规划未明。大家或许都在期望新任微博联席 CEO 许良杰(Jack)的举措吧,毕竟人家具备第一代搜索引擎研发经验,以及开创 ebay 上海研究院的经历。
未来,新浪微博的十周年纪念片里,估计会有这么一小段说这个时期:
查尔斯曹在唱:Only You,能杀妖和除魔,伴我去取西经……
Jack 许在叹:……oh Rose,哦,不,紫霞,我在找你。
题图来自 apoto