0
今年8月,雷锋网将在深圳举办盛况空前的“全球人工智能与机器人峰会”,届时雷锋网将发布“人工智能&机器人Top25创新企业榜”榜单。目前,我们正在拜访人工智能、机器人领域的相关公司,从中筛选最终入选榜单的公司名单。
如果你也想加入我们的榜单之中,请联系:2020@leiphone.com。
图片来源:TechCrunch。
本文作者为微软开发者部门前负责人、Madrona Venture Group 风险投资合伙人 S. SOMASEGAR 和 Madrona Venture Group 风险投资合伙人 Daniel Li。
应用智能指的是使用机器学习技术开发、使用历史数据和实时数据,做出预测和决策的应用的过程。这些开发出的智能应用能够为用户提供丰富的、自适应的、个性化的体验。
我们相信今天每一个成功的新应用都是智能应用.
聊天机器人大军、虚拟助手和电子商务网站在学习在正确的时间展示正确的推荐;最新的交友应用能够学习并能不断提升用户体验。此外,为了应对新成长起来的应用,传统的应用也在变得越来智能。
现在是投资更广泛的智能应用生态系统(intelligent app ecosystem)的大好时机,因为应用开发中几个重要的趋势正汇聚到一起:
大规模计算能力的可用性,和用于支持机器学习模型的低成本存储;
机器学习技术的易用性让开发者可以利用这项技术;
将微服务(microservice)作为应用的开发模式;
可用于发展开发应用的平台,尤其是基于消息和语音等“自然用户界面”的平台。
我们思考了智能应用出现的多种方式,以及它们是如何开发。本篇中的智能应用汇集阐释了对智能应用的创造很关键的多种技术的层次。
作为投资者,我们喜欢思考主要行业变化的市场动态。智能应用的兴起必将为创业公司和大型科技公司创造很多新机会。以下是我们对经营不同层次智能应用的企业有关键影响的因素的一些想法:
应用将会通过机器学习,定义终端用户的体验。
图片来源:TechCrunch。
在应用层上存在两类主要的应用:由应用智能驱动的全新应用,和得到应用智能改进的现有应用。
全新的应用得解决一些难题:终端用户愿意为“人工智能”付多少钱,以及怎么确保它们能获取交付给用户的一部分价值。更广泛地,这能检验我们观点是否会实现,即机器学习的价值主张将成为收入的一个主要来源。
同时,因为高质量的相关性数据对机器学习的重要性,我们认为针对特定行业或特定用途的应用将成为应用层上机遇的最直接的金钱袋。
现在已有的针对特定用途的应用的主要领域包括自治系统、安全和异常检测、销售和营销优化、以及个人助理。我们也能看到一些有趣的垂直行业的智能应用,尤其是在零售、医疗、农业、金融服务和生物技术行业。最新一代杀手级应用则是来自于科技巨头,比如亚马逊为电子商务、谷歌为搜索和广告、Facebook 为社交、Uber 为交通、Netflix 为娱乐开发的应用。这些公司在机器学习开发和用户数据积累上拥有显著的领先地位,但我们相信,会有从零开发的更智能的新应用,能在这些应用智能驱动的领域内获胜。
新接口将会将应用转变成跨平台的“宏服务(macro-service)”。
图片来源:华纳兄弟影业
当我们思考新智能应用的开发方式时,一种明显的做法是将“应用”转变成一项可以通过任意数量的接口提供的服务或体验。比如,我们将看到 Uber 这样的公司通过应用、网页和/或语音接口开发其提供的“服务”。
对公司而言,如果它们使用微服务模式设计它们的应用,那么将自己的服务进行跨平台扩展就要简单得多——整合一个新平台只需要简单地增加一个新的 API 层,就能连接所有已有的微服务:认证、产品目录、库存、推荐以及其它功能。
Slack、Facebook Messenger、Alexa 和虚拟现实商店等新平台的增长对开发者来说也是有利的,因为平台会越来越开放、会增加让开发者生活更简单的应用、还会通过投资基金等手段互相竞争以获得开发者的关注。
最终,在接口层上,我们将看到文本、语音和视觉的“自然接口”将解锁会话商务和增强现实/虚拟现实等新型类别的接口。我们对这些接口的未来是非常乐观的,因为它们是人类互相之间、人类与世界之间互动的方式。
智能构建模块和学习服务将会成为应用背后的大脑。
图片来源:TechCrunch。
随着企业们对微服务开发模式的采用,即插即用不同机器学习模型和服务以实现特定功能的能力将变得越来越有价值。在这一层面上,我们能看到两种类型的企业:一类是原始机器智能提供商,另一类是训练模型(即“模型即服务”)提供商。
第一类提供商为智能应用开发者提供“原始的”或核心构建模块,如算法和部署过程。第二类提供商则为企业提供中间服务,让企业可以即插即用地使用预训练模型处理图像标记、自然语言处理或产品推荐等任务。这两类智能应用背后的企业为智能应用提供了很大一部分价值,但这一层的关键问题是如何确保这些构建模块能获取它们提供给终端用户的一部分价值。
IBM 沃森的方法是免费为开发者提供其 API 的使用权,但在开发者的应用被发布给消费者时会收取其 30% 的收入。其它一些提供商则基于 API 调用、计算时间或虚拟机进行收费。
这一层的企业的关键不同在于:为开发者提供优质用户体验的能力,以及机器学习算法和模型的准确度和性能。
对于自然语言理解等复杂而又通用的问题,如果供应商具有最好的数据、模型和流程,预构建的模型很可能会更简单、性能更高。但是,对于特殊的特定业务,创业公司和企业得开发他们自己的模型和数据集。
困难又枯燥的数据收集和准备任务将变得更智能。
在数据被准备好送入机器智能的工作流程或模型之前,还需要进行收集、聚集、清理和准备。消费者和企业应用的数据来源包括照片和视频、网站和文本、客户行为数据、IT 运营数据、物联网传感器数据和网页数据。
当应用仪器收集到原始的数据之后,还需要将其转换成机器支持的格式。比如,企业需要将文本文件和照片等非结构化数据转换成机器可以审查的结构化数据。这一步中,必须认识到模型的质量高度依赖于其输入数据的质量。没有高质量训练数据而开发的 bot 或“人工智能”可能会导致意想不到的后果(参考微软的 Tay),而这种训练数据的收集往往依赖于半手动的过程,比如众包或查找历史数据集。
这一领域中其它值得关注的部分是传统上作为数据源(如点击流数据或应用性能日志)的“笨”管道的公司。它们不仅将尝试构建预测性和适应性的功能,还将面临来自希望从相同的数据源中提取观点的智能服务的竞争。
这将成为金融、客户关系管理、IT 运维、市场营销、人力资源等传统上收集数据但不即时提取观点的行业的一个创新领域。比如,HR 软件将基于之前招聘的历史数据,在提供面试反馈和关键岗位最佳候选者方面,表现得越来越好。
智能应用将构建于大数据技术的基础上。
图片来源:Flickr/Marius B under a CC by 2.0 license
全世界的数据量每 18 个月翻一番,而且因为这种大数据爆炸,企业已经在存储和数据分析上投入了巨资。
Hadoop 和 Spark 这样的项目已经成为了较大型的应用智能生态系统的关键推动者,而且它们也将继续在智能应用各个层次中充当关键角色。在选择分析基础设施上,开源仍将是一个重要的特性,因为客户希望看到“引擎盖下”是什么,以及避免在他们选择数据的存储位置和方式时被供应商限制。
在 IaaS(基础设施即服务)领域内,每一家主要的云提供商都将争取支持智能应用的工作负载。我们已经看到一些公司开源了自己 IP(知识产权)的关键领域(如谷歌的 TensorFlow 机器学习平台),从而将企业和开发者吸引到它们的平台。尤其是谷歌,未来将成为一家值得关注的公司,因为公司为增长核心 IaaS 业务,而将自己通过世界上最大的数据集训练的机器学习模型开放给用户。
最终,专注于存储和管理大规模照片、视频、日志、交易和物联网数据的硬件公司,将成为企业客户紧跟智能应用生成的新数据的关键。
机器学习人工智能生态系统市场各层分布
随着机器学习的腾飞,我们认为这个生态系统中各个层次上都存在价值,以及有机会建立赢家通吃的成功业务。在智能应用的世界里,数据为王;可以带来高质量数据的服务将在它们的数据腾飞中取得不公平的优势——更多的数据能带来更好的模型,又带来更好的用户体验,接着又是更多用户,产生更多数据。
十年之后,绝大多数应用将会是智能的,机器学习将变得和过去十年中的云一样重要。现在进入并拥抱智能应用的企业将在构建最优秀的用户体验和最有价值的业务上取得显著的竞争优势。
via TechCrunch
雷峰网原创文章,未经授权禁止转载。详情见转载须知。