人工智能预测谁是歌王,娱乐至死背后还有更大
你还记得6年前那只在南非世界杯上征服全球的章鱼保罗吗?章鱼保罗在2008欧洲杯和2010世界杯两届大赛中,预测14次猜对13次、成功率飙升至92%,成为预测王。章鱼保罗预言帝真实原因在于,好事者根据章鱼的生理习性进行了一定的引导。从实质来讲,章鱼保罗仅仅只是一个符号,好事者的背后其实是德国奥伯豪森水族馆的“公关营销”参谋团队根据数据分析、情报展开分析。
可以说,一切预测的背后,其实都是数据、情报作为支撑。数据越丰富,预测成功的概率就越大。阿尔法狗大战李世石之后不到一个月的时间,恰逢一年一度的湖南卫视“我是歌手”歌王决赛即将上演。阿里云的人工智能小Ai预测歌王结果,可谓噱头十足。
笔者曾在《从IT领袖峰会谈话看人工智能的“三重门”》提到人工智能的三重境界——弱人工智能、强人工智能、超人工智能。预测歌王其实正是人工智能基于复杂场景展开高强度的计算,属于强人工智能的范畴。表面上看,这仅仅只是一次娱乐,其实背后潜藏了更多野心。
预测歌王战胜棋王,两者谁才技高一筹
一个是预测歌王,一个是挑战棋王。两个人工智能,谁才技高一筹?这的确令人费解。不过,按照人工智能“三重门”的层级划分来看,阿尔法狗还是属于弱人工智能,预测歌王这种基于复杂场景的判断可能更加复杂,属于强人工智能。
“弱人工智能”其实在学界的定义是指,模仿人的深度神经网络,来进行机器的计算。强人工智能的背后,需要强大的数据服务作为支撑。
很多人都在说,围棋不同于象棋,围棋背后有着深刻的文化、情感因素,围棋强调全盘考虑,对于人工智能而言,十分复杂。还有人说,阿尔法狗和1997年的深蓝有着很大的区别——深蓝是靠硬算,其能力是固定的;阿尔法狗会根据盘面自主学习,其能力在不断增强。
谷歌的阿尔法狗战胜李世石,背后其实是“大数据+算法”的方式进行计算。阿尔法狗对生物神经系统有种模拟或近似,但阿尔法狗的下棋逻辑是非常简单的。每下一步棋,阿尔法狗都是在对每一步棋的胜率进行反复计算,选择在胜率最大的点进行落子。其实,这种计算思路与1997年的深蓝并无本质区别,阿尔法狗只是利用了实时运算的能力将更多棋谱纳入其背后的数据资源之中。
那么强人工智能呢?强人工智能指的是AI与大数据、云平台、机器人、互联网及物联网等场景深度融合,真正与产业结合,扮演基础性的角色。
“我是歌手”这样的歌唱比赛虽然谈不上产业,但是却存在复杂场景,AI要在这种环境中预测胜负成败,其实存在很大的困难。某种意义上看,AI预测这样一场比赛,已经是在挑战强人工智能。
“我是歌手”这样的赛事,背后的赛制和冠军产生机制非常严谨和复杂,还要考虑到歌手临场发挥、出场顺序、选曲、个人喜好等不确定因素的影响。这是湖南卫视节目组、所有电视观众、500位大众评审、7位明星歌手共同创造的一个充满随机性的巨大谜题。
人工智能要在这种环境中去预测“谁是歌王”,其复杂性在于,情感和变数——音乐是情感因素十分复杂的一个事物,评委和现场选手又是存在诸多变数的变量,现场观众更是无力掌控的可变函数。
阿尔法狗只需要去打败一个人,它在单点进行计算,进行突破,就可以完成自己的任务。而小AI需要预测“谁是歌王”,它面对的是千千万万个具有情感的还在不断变化的人,它需要理解每个人的心理变化,现场的气氛转向,其复杂性其实远高于阿尔法狗。
强人工智能的背后,复杂场景才是目标
如果打一个不恰当的比喻,阿尔法狗画的是直线,预测谁是歌王的小AI走的是迷宫。
目前的弱人工智能只能运用在下下棋、写写消息、翻译文本等这些相对较为简单和实用的内容上。
但是,人工智能存在的目的绝非仅仅只是做这些相对固定、机械甚至是缺乏实用性的事情。今年的IT领袖峰会上,李彦宏就谈到,让机器学下围棋是容易,让人去下棋、拿到围棋九段很难;让机器开车很难,但人去拿到一个驾照很容易。
李彦宏的本意是,人工智能真正的运用场景是,需要面对非常复杂的使用场景,比如说自动驾驶、比如说再金融、电商等各个领域进行数据分析,为人们提供决策依据。
由此看来,强人工智能才是人工智能未来真正发展的方向,因为人工智能最终还是要走向实用。
放在复杂场景中来看,“我是歌手”这样的赛事上去预测歌王,考验的就是人工智能对复杂场景的应对能力,需要基于神经网络、社会计算、情绪感知等原理工作,其背后是阿里云的大数据作为支撑。除此之外,小Ai 在预测之前,“海补”了几百万首歌提升音乐品味和鉴赏能力,基于阿里音乐数据库从历史赛事和海量资料中寻找影响比赛结果的变量因子,训练出一个实时动态模型进行预测,比如歌曲、歌手、粉丝、现场氛围、网友讨论等维度,每种维度都通过机器学习提取海量特征。这些特征有的是静态的,有的跟随比赛不断变化,需要现场实时计算,最终给出预测排名。
原英特尔中国研究院院长吴甘沙在面对媒体媒体采访时就曾直言,这个预测的技术要求甚至高于Nate Silver的奥斯卡预测,因为数据大、维度极多、大量是非结构化数据,没有足够多的历史数据来训练模型。
其实,在未来的实际运用中,强人工智能面临的复杂场景也是如此。强人工智能在金融、电商、无人驾驶等领域的实际运用之中,其实面临的复杂场景和预测“我是歌手”的歌王一样,都会遇到数据大、纬度多、变数大等问题。
谷歌这场的阿尔法狗大战李世石的棋局,更多还是噱头。谷歌自己也清楚,人工智能真正的场景在于复杂的实体产业。
这种复杂场景才是未来产业运用中将要面临的常态。以金融领域为例,有人说,未来国家金融监管部门可能会引入人工智能,对复杂的经济系统提供决策支撑。所以说,这次“我是歌手”预测谁是歌王,表面上看只是人工智能在一个娱乐节目中的尝试,很多人都会被其外表的“娱乐”所蒙蔽,甚至称其“娱乐至死”。但这场实验其背后真正的目的在于,挑战人工智能发展的高度,指明强人工智能的实际运用。
DT时代的大背景下,未来应用前景几何
强人工智能其应用前景其实和一家公司的数据能力密不可分。曾有一种理论谈到,在人工智能领域,缺乏数据的公司,未来很难提供真正可用的服务。
联想到马云多次公开谈到过的DT时代的论述,其实很容易发现这样趋势。马云说,这一次技术革命是IT时代走向DT时代,是真正的大大的释放……这个时代核心资源已经不是石油,而是数据。
人工智能背后的资源其实就是大数据,缺乏数据的人工智能是无法生存的,在未来的应用场景之中,数据为成为支撑人工智能的核心资源。