learn-tech/专栏/技术领导力实战笔记/205邵浩:人工智能新技术如何快速发现及落地(上).md
2024-10-16 06:37:41 +08:00

62 lines
8.8 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

因收到Google相关通知网站将会择期关闭。相关通知内容
205 邵浩:人工智能新技术如何快速发现及落地(上)
你好我是狗尾草科技合伙人人工智能研究院院长邵浩。从上世纪80年代开始我们经历了技术飞速发展的四个时代分别是PC时代、互联网时代、移动互联网时代以及我们正在经历的人工智能时代。现如今人工智能的新概念、新技术层出不穷作为技术管理者一个重要的能力就在于如何快速发现技术并且落地到实际产品中。在本文中我将跟你一起讨论人工智能新技术如何快速发现和落地。
人工智能技术现状及成熟度概述
简要来说人工智能概念自从1956年达特茅斯会议上被提出之后迄今为止经历了3个热潮。第一个热潮伴随着神经元模型、深度学习模型以及增强学习的雏形即感知器的提出和发展而兴起但却由于适用性较窄而进入低谷。第二个热潮出现在上世纪80年代初到90年代浅层学习算法如支持向量机、Boosting、最大熵等得到广泛应用IBM、苹果推出的个人电脑也进入到普通百姓的家庭但由于第五代计算机的失败和背离工业发展的方向的技术路线人工智能再一次进入低谷。
2006年杰弗里·欣顿Geoffrey Hinton和他的学生在《Science》上提出基于深度信念网络Deep Belief Networks, DBN可使用非监督学习的训练算法随后2012年DNN技术在ImageNet评测中取得了突破性进展人工智能进入到新的热潮围绕语音、图像、机器人、自动驾驶的技术大量涌现。
2017年8月20日微软语音和对话研究团队负责人黄学东宣布微软语音识别系统取得重大突破错误率由之前的5.9%降低到5.1%可与专业速记员比肩1谷歌在2015年提出的深度学习算法已经在ImageNet 2012分类数据集中将错误率降低到4.94%首次超越了人眼识别的错误率约5.1%2DeepMind公司在2017年6月发布了当时世界上最好的文本到语音环节的生成模型——WaveNet语音合成系统另外截至2019年3月由斯坦福大学发起的SQuADStanford Question Answering Dataset使用BERT的系统暂列第一其F1分值达到89.474。
每一次热潮都会伴随着媒体的大肆报道,在吊起广大民众胃口和期望值的同时,让大家产生一种错觉,认为人工智能马上要统治世界了。因此,在人工智能符号主义、连接主义、行为主义之外,又出现了一个叫“媒体主义”的分支,主要特点是哗众取宠,什么吸引眼球就写什么。至于我们当前正处于的人工智能第三次热潮,会不会由于强人工智能的难以突破,又一次跌入谷底,还有待观望。
如图从独立咨询公司Gartner发布的最新技术成熟度曲线中我们可以看出脑机接口、知识图谱以及通用人工智能技术都有了快速的发展但强人工智能的极点何时出现我们还不可知。
人工智能技术落地的种种困难
在简要介绍完人工智能技术的发展现状之后,我们来谈谈人工智能落地的难点。
2012年之后随着一波投资热潮大量人工智能公司如雨后春笋般涌现同时政府也在人工智能上投了很多热情以期推进智能化和产业升级。借此契机大量传统的软件公司乃至文化公司为了更快的融资和拿到政府的补贴想尽办法为自己的产品和解决方案冠上人工智能的头衔。但实际上人工智能的落地并没有想象的那么美好媒体上经常看到的一些炫酷的案例背后也都存在大量人工设计的场景和规则。甚至专门出现了一个叫做P2V的场景全称是PPT to VC。然而随着2018年后资本热度的冷却很多人工智能创业公司不得不转型寻求安全的落地业务甚至有一些公司已经挣扎在倒闭边缘。
我们就拿最近很火又很难的技术为例,聊一下从技术到产品的落地痛点。
首先是自然语言处理Natural Language Processing简称NLP技术所对应的产品在C端通常是聊天机器人在B端通常是智能问答解决方案。例如狗尾草科技的公子小白智能音箱以及小i公司的智能客服机器人等。
微软亚洲研究院副院长周明博士曾经提到,自然语言处理技术可以看做是人工智能皇冠上的明珠。尝试用技术模拟人类的真实对话,在开放领域就是个伪命题。因为人类的对话过程中,所表达出的信息,不只是文字本身,还包括世界观、情绪、环境、上下文、语音、表情、对话者之间的关系等。一句“今天天气不错”或者“你好么”所表达的意思可能是千差万别的。因此,目前聊天机器人还远远没有达到人类的期望值,给人的感觉也是人工智障。
但在一些特定场景下的聊天机器人和智能问答系统却能够表现出令人满意的效果。比如2018年谷歌开发者大会上打电话预约理发店的对话系统就把场景限制在了预约理发店这个业务本身通过有限状态机以及大量的规则和数据把这个特定场景做的看似天衣无缝。同样在大型电商平台的客服机器人场景下所涉及到的状态也是有限集合因此其效果也能做的比较好。
由于在开放域对话中现有技术还无法达到人类预期研发人员和投资机构又把眼光投向了近两年比较火热的知识图谱技术上。知识图谱的概念提出已久谷歌在2012年提出了Knowledge Graph的概念并通过知识图谱实现了“让搜索通往答案”的理念。
知识图谱的火热程度从国内质量最高、参会人数最多的全国知识图谱与语义计算大会CCKSChina Conference on Knowledge Graph and Semantic Computing就能一窥端倪。CCKS在2016成立之初只有500名参会者这个数据到了2017年是600人2018年是800人而2019年杭州的会议预计参会者将突破1000人。
作为从感知智能到认知智能跨越的重要基石之一知识图谱被寄予了厚望但真正在落地上却鲜见成功案例。尤其是很多公司和地方政府机构在谈需求的时候一上来就说“我想用知识图谱技术你们能不能把现在的知识库变成知识图谱实现大数据的链接应用”其实知识图谱技术能不能应用要综合考量多方面因素就拿知识的表示和存储来说选用不同的数据库就需要用到不同的知识表示。RDF数据的一种三元组表示形式的数据表示可以选用Jena数据库而图表示可以选用Neo4j图数据库。对不同来源的数据还需要进行大量的数据清洗和结构化甚至还牵扯到纸质文档例如医院病历的手工录入。结合业务来看很多时候传统关系型数据库就能解决的问题完全没必要用到大规模图数据库否则很容易导致整个项目成本高效率低的问题。
以上就是很典型的人工智能从技术到产品过程中的难点痛点,那作为技术管理者,面对如此现实,我们要如何快速发现新技术并将其落地到实际产品中呢?受限于篇幅,我将在下篇文章中与你分享这个话题,欢迎持续关注。
感谢收听,如果你觉得这篇文章对你有帮助的话,也欢迎把它分享给更多的朋友~
参考文献:
W. Xiong, L. Wu, F. Alleva, J. Droppo, X. Huang, A. Stolcke, The Microsoft 2017 Conversational Speech Recognition System, Microsoft Technical Report MSR-TR-2017-39, arXiv:1708.06073v2, 2017.
K He, X Zhang, S Ren, J Sun. Delving Deep into Rectifiers: Surpassing Human-Level Performance on ImageNet Classification, arXiv:1502.01852v1, 2015.
作者简介
邵浩TGO鲲鹏会会员日本国立九州大学工学博士。现任上海瓦歌智能科技有限公司总经理深圳狗尾草智能科技有限公司合伙人人工智能研究院院长带领团队打造了聊天机器人产品“公子小白”及AI虚拟生命产品“琥珀•虚颜”的交互引擎。中国中文信息学会青年工作委员会委员中国计算机学会YOCSEF上海学术委员会委员。研究方向为人工智能共发表论文40余篇出版了业内第一本聊天机器人著作主持多项国家级及省部级项目曾在联合国、WTO、亚利桑那州立大学、香港城市大学等任访问学者。