本帖最后由 3dfx232 于 2019-1-11 14:43 编辑
商业化应用现状发展水平:基本可用 vs 中等偏前
自然语言处理技术目前在行业应用中究竟现状如何呢?对于这个问题,专家们给出的回答有些许不同。 首先,五位专家都一致认可自然语言处理技术在行业中的应用范围已经非常广泛。科大讯飞认为,对比而言,语音技术作为感知能力的代表,应用水平相对更高,属于好用状态;NLP 要看具体的任务,不少任务的实际应用性能也不错,总体上来说,NLP 行业应用属于基本可用状态,离真正意义上的好用还是有较长的距离。 而小米则认为,自然语言处理技术的含义很广,笼统地说,NLP 和语言技术在目前的行业应用中都处于中等偏前的水平。
相比之下,与科大讯飞有着合作的氪信很坦率地指出,语音技术由于深度学习的发展在最近几年有很大的突破,这使得语音识别、语音合成、声纹识别等技术均可大规模应用在工业领域。但是,光有耳朵和嘴巴还是不行,这个智能系统最重要的是要有大脑,听进来的话需要理解它(NLU),然后是怎么通过自己的知识积累和业务诉求来回复(NLG)。这个大脑的核心技术就是 NLP 相关的技术。但然而,坦白地说,NLP 在工业领域的应用还属于早期阶段,不像视觉领域,行业内已经有具体标杆效应的独角兽公司,如旷世、商汤等。很多智能交互系统要么只能在非常狭窄的领域中做简单的任务,要么有经常被诟病的人工智障的问题,NLP 技术虽难,但任重道远。
主要应用领域和应用场景
正如各位专家所说,目前自然语言处理技术在行业中的应用已经非常广泛,包括电商、翻译、金融、智能硬件、医疗、旅行、住宿等各个行业,应用场景涵盖语音分析、文本分析、情感分析、意图分析、图形和图像识别、互动语音回复、光符识别等,已经应用于公有云、私有云和混合云之上,IT 和电信商、医疗、零售、银行等都是自然语言处理技术的终端用户。 在这些领域和场景中,自然语言处理技术比较成熟的商业化包括搜索引擎、个性化推荐、广告、细分领域的知识问答 / 智能问答等,常用的自然语言处理的方法包括分词标注、文本分类、关键词分析、敏感用语识别、词频统计、观点归纳,情感分析等。然而,虽然有不少公司标榜自己的在产品中应用了这些技术,但是真正产生实用价值,并为企业带来可见收益的公司却是少数。 AI 前线通过与处在自然语言处理技术前沿的五家企业:科大讯飞、京东、腾讯、小米和氪信的交流,进一步了解了当前自然语言处理技术在企业中的应用和商业化现状。五家企业对应的行业领域应用场景分别为翻译、智能对话与客服、智能问答、智能硬件和金融。
五家公司自然语言处理技术典型应用一览: 商业化现状
目前为止,单纯依靠 NLP 或语音技术变现还是一件比较困难的事。在采访中,五家公司都表示在公司内部财报中并没有专门针对这两项技术带来收益的计算方法,甚至发生收益是否归功于这两项技术的争论,感叹语音是性价比很低的事情,离钱太远。
因此,AI 前线并未获得可以直观显示这两项技术带来具体收益的数据。 但是,我们可以从一些与这两项技术密切相关的智能硬件销售情况,侧面了解到其商业化现状。 比如,根据全球权威市场调研机构 Canalys 发布的 2018 年第三季度中国智能音箱报告显示,阿里巴巴旗下天猫精灵出货量 220 万台、排名第一,小米小爱音箱出货量 190 万台、排名第二,百度出货量 100 万台,排名第三。其中,截至 10 月底,小米小爱同学累计 80 亿次唤醒,日活达 3400 万,也间接为该公司带来收益。 据媒体报道,科大讯飞发布的智能转写机器人“讯飞听见 M1”目前已经正式预售,此前推出的智能硬件中,讯飞翻译机 2.0 上市 5 个月销量超 20 万台。科大讯飞董事长刘庆峰称,该公司 2C 业务翻番增长,而且现金流情况也很好,已经占到公司的销售收入的 30% 多,毛利接近 40%,“尽管激烈的市场竞争会让翻译机等应硬件产品价格出现一些小的波动,但整体上翻译机会维持在 50% 的毛利率,降价范围在 5%~10% 之内。” 另外,数据分析网站 statista 的一组数据,也能反映出自然语言处理全球市场的大致状况。数据显示,2018 年,全球自然语言处理的市场规模达 5.8319 亿美元,到 2024 年将达到约 21 亿美元。
那么,在业内人士的眼中,NLP 和语音两项技术在商业化或落地方面的进展算是成功还是失败呢? 对此,五位专家给出了自己各不相同的回答,但总体上都对 NLP 和语音领域近年来取得的进步表示肯定,表示自然语言处理技术基本处于可用状态,虽然还远未到完善,但看好其未来的商业化应用前景。 氪信表示,语音的率先突破引领了 AI 这一波的兴起。今年以来基于 ELMo 模型在多个场景内都有不俗的效果,以及最近 2 个月谷歌提出的 BERT 模型疯狂屠榜都一再表明,基于合理的模型结构实现 NLP 的模型迁移有很大的发展前景,而在技术上的持续投入也会收获累累硕果。 科大讯飞表示,技术的进展和突破非一朝一夕之功,还是要相信全球的广大 AI 研究者,能够给大家带来惊喜。关于商业化层面,还涉及到市场、供需是否一致等一系列问题,包括国外的 Google、Facebook 等企业,国内的 BATI 等企业,都在各个垂直领域做了很多探索,也有不少进展。总体而言,科大讯飞对 AI 技术的应用持非常乐观的态度,虽然当前还面临一些技术上的挑战,或者商业上的资源瓶颈等,但相信随着 AI 市场机制的健全和刚性需求的不断增长,AI 的更大范围应用将要马上到来。 小米对自然语言处理技术的信心更强,认为总体而言,这两项技术在商业化方面的还是比较成功的,只是由于 NLP 技术是很多商业领域的支撑技术,因此很多商业的成功大家都不将功劳归功于 NLP。实际上,近年来机器翻译和文本生成领域取得了不小的进步。当然,相对于其他领域,NLP 领域的提高幅度没有那么大,一方面是因为 NLP 领域的相对水平已经比较高 (相对于图像等领域),另一方面,现有数据驱动的方法要做到自然语言的语义理解还具有相当难度。小米认为,要真正突破,还是要理解自然语言。 腾讯认为,还是需要找到场景。以视觉为例,大家看好像人脸技术已经非常成熟,各家公司都已经做到 99% 精度,但最开始的商业化落地还是在安防领域,产品打磨的比较成熟了,才逐渐渗透到其他行业。自然语言处理技术我相信也需要这样一个市场认知和接受的过程。这两年也看到了比较多的商业化落地的产品,包括智能客服,知识图谱、信息抽取等,市场热度也在逐渐升高,腾讯表示非常有信心。当然,一方面 NLP 技术相对视觉还不够特别成熟,这就需要产学研一起摸索和进步,另一方面在商业化方面也需要找到一些核心场景和抓手,逐点突破。 京东也认为,目前自然语言理解技术在深度学习的驱动下,已经获得了长足的进步,无论是人工智能领域的头部公司,还是基于人工智能高新科技催生出的创新型企业,都在摸索自然语言理解技术新的应用场景创新。比如京东目前就基于领先的自然语言理解技术,结合京东零售、物流、金融等全价值链场景和精准数据,打造出业内领先的解决问题型智能对话系统。结合京东情感 AI、知识图谱等技术的发展,更孵化出涵盖售前、售中、售后的有温度智能客户服务、高精准的 AIoT 对话服务、大规模个性化内容生成等有实际应用的价值的落地探索,为京东自身的主营业务带来巨大价值。
但是,自然语言处理技术还面临着一大困难,那就是特定场景需要特定的模型。通用语言理解模型成为这一问题的关键。
|