播客类今日头条诞生记:TensorFlow成共享秘方?
TensorFlow 有望成为 AI 时代的「安卓系统」。
Castbox 的创始人王小雨最近很忙,虽然公司在国内,但她近期基本都泡在美国洽谈音频版权合作事宜,希望能够进一步推进付费业务的开展。
瞄准海外市场的 Castbox 是一款音频类聚合应用,可以对标国内的喜马拉雅 FM 和荔枝 FM。从 2016 年创立到现在,Castbox 已经连续两年在谷歌开发者大会中被评为音频聚合类的最佳应用。
然而,尽管在两年间,Castbox 在全球 135 个国家的订阅用户已经超过了 700 万,是目前 Google Play 上第一的音频应用,但王小雨始终对开启付费模式保持谨慎态度。
如果半年前没有选择使用 TensorFlow,王小雨大概不会这么早就下决心到美国洽谈音乐版权问题,并推进音频收费项目。
变成播客类今日头条的 Castbox
(Castbox目前使用的是和今日头条相似的AI内容推荐 图|Castbox官网截图)
此前阻止王小雨开展收费项目的正是对用户粘性的忧虑。即使是在比国外音频类聚合应用市场更为成熟的国内市场,在付费阅读上依然仍处于探索阶段,尚未完全伸展拳脚。
这样的现状正是考虑到,在对平台产生认同和依赖前,为内容而来的游客,很可能因为付费模式而选择逃离。但如果用户能够形成对平台的使用习惯,并产生强烈的认同感,其付费订阅意愿提升,便会更加有利于付费模式的推进。
但如何让游客变成住民,对一个平台形成依赖呢?作为谷歌前员工,王小雨很自然地想到了用谷歌的开源工具 TensorFlow来为 Castbox 留下更多住民。
在使用 TensorFlow 之前,王小雨使用的是传统的协同过滤,可以根据用户订阅推荐相似内容,但这种基于用户订阅所得到的推介结果的相似性和准确度不高,推荐内容不够贴合用户需求,用户订阅转化率不够高,不足以形成Castbox推进付费模式的环境。
而通过利用 TensorFlow 提供的框架,Castbox 的开发人员开发出一款拥有内容推荐功能的 AI 系统,解决了推荐内容的不贴合。
这一借由 TensorFlow 开发的 AI 系统选择关注用户的点击通过率,而非单纯的订阅状况,并通过机器算法,将 CTR(Click-Through-Rate 点击通过率)高的音频内容推荐给用户。这种算法的好处在于,它不需要考虑不同国家语言的差别,只要根据大数据就可以掌握用户兴趣点并加以推荐,这和今日头条的原理是相似的。
这款内容推荐应用上线半年多后,Castbox 的用户数量由 500 万提升到 700 万,用户内容订阅转化率提升了一倍,用户平均订阅音频节目从 3 个增长到 6 个左右。「Castbox 要针对全球 135 个国家的用户,从 5000 万个内容中给用户推荐……而 Castbox 给我(用户)推荐的都是很符合我(用户)心意的内容。」对于王小雨而言,内容订阅转化率的提高证明了用户对平台的粘性正在加强,用户留存率也随着提高,而这正是王小雨现在忙着购买版权的底气之一。
像王小雨这样利用 TensorFlow 开发自己应用的人并不少。比如,国内的游戏厂商《列王的纷争》也接入了 TensorFlow 中谷歌翻译的 API,能够让中外游戏玩家进行沟通。而清华大学自然语言处理与社会人文计算实验室的学者也在使用 TensorFlow 加深对语言的理解。
想做 AI 时代的「安卓系统」,从为企业节省博士开始
(安卓系统在全球拥有超过 20 亿使用者 图视觉中国)
2005 年,安卓系统母公司被谷歌收购时还名不见经传,但 12 年后的今天,它在全球已经拥有 20 亿用户。谷歌开发出来的原生安卓系统,无论哪国的开发者都可以使用,开发者更可以在原始版本中进行自己的更新。像国内的小米 MIUI、魅族 flyme都是在原生的安卓系统上进行加工的。
与原生的安卓系统相比,谷歌开源TensorFlow平台还不到两年,但谷歌对它的期许却更高,希望它能变成 AI 时代的「安卓系统」,这也是谷歌从mobile first 到 AI first 转向的重要一环。
尽管看起来不为人所知,但我们在日常生活中使用谷歌产品时早已和 TensorFlow 打过交道。当你使用谷歌翻译、搜索、地图、YouTube 时,TensorFlow 贡献的底层架构一直在默默工作。
在谷歌的官方介绍中,TensorFlow 是采用数据流图(data flow graphs)、用于数值计算的开源库。这个库提供包括图像识别、语音识别等神经学习的数据基础架构,是专门为系统开发人员准备的深度学习开源工具。
不过,TensorFlow 提供的系统库并不是一个严格的「神经」库。只要开发者能够将计算表示为一个数据流图,就可以使用 Tensorflow。这也被很多行业人士吐槽,认为 TensorFlow 开源的底层应用太过基础。但对 Castbox 这样的初创企业来说,基础性的架构至少已经帮助他们解决了一个极为关键的问题——减少开发 AI使用的技术人员数量。
(谷歌官网对TensorFlow框架的介绍 图|谷歌)
Castbox 的 CTO 贺晓聪告诉极客公园,他们目前真正负责内容推荐 AI 开发的只有一个员工。而按王小雨的说法,如果不依靠 TensorFlow,要开发出同样的应用,可能需要用到十几个成熟的技术人员,而这样的技术人员,在王小雨看来,最少也得是博士水平。
尚且不论十几个拥有成熟技术的博士的招募成本,对于一个初创公司而言,在目前成熟技术人员都集中在谷歌、微软、苹果等大公司的情况下,能不能招到都是一个问题。TensorFlow 显然为这些初创公司解决了这个大问题。
普适法则,TensorFlow 的差异化竞争路线
(外媒对目前各大公司开源平台的形象性介绍 图|bonkersworld)
事实上,现在的开源系统不止谷歌的 TensorFlow,苹果、微软、甲骨文在内的大公司都在开源自己的系统。上图是外媒对各家平台做的一次总结,虽然未必完全准确,但从某种程度上,的确反应了目前开源平台的现状。
相比竞争对手,TensorFlow 更注重拓展技术覆盖面,以更大的普适性抢占优势地位。TensorFlow 所使用的底层技术更加注重对不同技术的优化结合,目前在专业领域的深度学习项目都可以使用 TensorFlow 平台,规模在同类中可以达到最大。而且其灵活性也比其他的平台更好,即使是新的研发项目也可以轻易接入到 TensorFlow。
除此之外,TensorFlow 还支持异构设备分布式计算,这意味着它能够在各个平台上运行模型,从电话、单个 CPU / GPU 到成百上千 GPU 卡组成的分布式系统,适用性和实用性非常强。
正是由于这种普适性,虽然起步较晚,但TensorFlow 已经拥有超过 500 位代码贡献者,共有超过 12000 次的代码提交和超过 100 万次的代码库下载。TensorFlow 在教程、资源、开发者和贡献者的数量上均处于领先地位。
(36dsj对目前各大开源工具的横向比较 图|36dsj)
谷歌也很重视与使用 TensorFlow 的开发者的沟通。王小雨在开发 Castbox 的时候,就会经常和谷歌内部开发人员沟通,「我们会发给他们,一般都在 24 小时内回复。」王小雨说。在谷歌内部设立有Newsletter,可以和企业开发人员进行沟通,除了在中告知团队的新进展和动态,还会针对外部开发人员发来的邮件中的问题进行释疑。