这家专注声学的AI公司获得Pre-A融资1600万元,让我们全面分析它到底有多靠谱?!

sound-500x375

2017/03/16 • AI/人工智能, 投融资, 热点 ,

项目名称:声智科技

行业关键词:科技、硬件、智能、声学

融资情况:

投资机构:洪泰、瑞峰

金额:1600万

轮数:Pre-A轮融资

项目概况:声智科技是一家人工智能交互与声学解决方案服务商,从事语音交互芯片、模组和设备研发、设计、制造并提供整体声学技术解决方案。现已完成Pre-A轮融资,其中由洪泰基金领投,峰瑞资本跟投。

从 iPhone 的 Siri、AlphaGo开始,近几年兴起的智能手环、智能医疗、无人驾驶等,都表示未来智能产业将成为新一代技术革命的急先锋。

机器已然从单纯的存储信息、处理海量数据,到可以“看懂”人类的文字,“听懂”人类的语言的阶段,未来还将创造更多不可能的奇迹。

那么,目前人工智能领域的投资又展现出怎样一派景象呢?其中又有哪些潜在的创业机会等待去挖掘?

一、广阔的市场蓝海等待开拓

1.人工智能市场蓝海待开拓

当前,人工智能已经开始渗透到各行各业,甚至走进寻常老百姓家。

据估算,2015年全球人工智能市场规模约484亿人民币,其中中国市场规模约12亿元人民币,其中60%的贡献来自语音识别,视觉识别占比达 12.5%。未来这一新兴行业将保持高速增长,根据BBC research的预测,2020年全球人工智能市场规模将达183亿美元,约合1190亿元人民币,年均增长率达19.7%;预计中国市场增速将高达50%,届时将有约91亿人民币的市场蓝海等待开拓。

随着多个发展瓶颈的接连突破,当前人工智能已经到了感知智能的阶段,同时新科技的热潮也依然没有停止翻涌。

不过,根据Gartner 2016年发布的新兴技术成熟度曲线图来看,人工智能应用普及还需时日,虽然感知型智能机器时代已经悄然来临。

目前领域重点主要聚焦在透明沉浸式体验(transparently immersive experience)、感知型智能机器时代(perceptual smart machine age)以及平台革命(platform revolution)。

这就代表,虽然目前基础条件储备基本完成,但人工智能应用化技术还比较生涩,更全面的数据还需完善,处于一个待成熟的时段。

在未来的5-10年,感知智能将逐步普及,但认知智能的突破尚不明朗。

3.深挖人工智能细分领域

据悉,2015年全球人工智能领域企业已获得将近12亿美元的投资。

而在国内,到 2016年初,中国人工智能领域的企业已达百家,其中约65家获得投资,共计 29.1亿人民币。

而本篇文章要介绍的就是一家专做智能硬件的公司,声智科技,属于感知型智能机器时代里的机器学习这一块。

二、声智科技,亮点何在

在智能家居领域,如今Amazon 智能音箱Echo出货量超过900万台,谷歌、苹果、微软也纷纷投入市场割据洪流中,而国内还没有成熟的智能音箱技术方案商。声智科技学习MTK等硬科技公司,提供一揽子式的智能音箱开发套件解决方案,并且秉承合共赢的理念,以开放和合作的态度,寻求智能音响全球领域的合作伙伴,共同搭建以用户为中心、数据为驱动、平台为服务,完整的人工智能交互图谱与闭环生态链条。

1.术业有专攻

智能语音交互的第一步是语音识别,但是一直以来,真实环境下远场语音识别的准确率都不好,很多AI公司都在试图通过深度学习的方法解决这个难题。

然而声智科技不这么认为。

声智科技的团队在中科院做了多年声学研究,很清楚物理底层信号的原理与难点,特别是人机交互所使用的语音信号。一般来说,人听到的声音包括直达声和反射声(人听自己说话的声音还包括骨导传输),当距离声源较远以后,声波的反射效果增强形成较强的混响,特别是在一些声学效果较差的环境,如果附近还有其他的噪声干扰,例如电视、风扇、汽车等等,即便我们人类也很难听清远处的人声,这就直接影响了远场语音识别的准确率(也会产生远程语音唤醒等难题)。

因而声智科技得出了以下的结论——虽然深度学习给语音识别带来了极大的提升,但在真实场景下,语音往往受到噪声、混响、回声等声学因素的干扰,致使输入云端模型的数据丢失大量特征,真实效果远未达到期望,因此最好从底层的声学技术切入去解决这个难题。

2.路径更快更可行

结论是下了,那么可行性呢?

要知道,想是一件事,做是一件事。

陈先生认为:深度学习识别的准确性主要依赖于模型的优化和数据的规模,同时也对训练样本数据的精度和维度都有极高要求,而这主要依赖于训练数据的采集和标注,但是目前来说,这些数据的获取几乎都是依赖于人力来完成。显然,这无法满足未来人工智能爆发式增长的需求,从底层声学技术入手,很可能是一条更容易实现的道路。

3.初有成效

该团队研发的回声抵消、噪声抑制、声源定位、混响消除、声音定向等核心技术和麦克风阵列等硬件已经量产应用,这也意味着解决真实场景下远程语音识别与唤醒的思路经过了验证。与此同时,声智科技以自己的技术和产品来采集真实场景下的远场语音数据,并以这些真实数据直接训练深度学习模型。陈孝良接受一些媒体采访时表示,目前已经将真实场景下的语音识别率从60%提高到了80%左右(中等阈值),随着场景数据量的增长将达到90%以上的识别率。

三、投资人看中声智科技

硬科技公司的成长和估值与互联网有着本质的区别,比如互联网更适合高速迭代而硬科技公司则要适当的憋大招,所以回退到1年前,硬科技公司融资并没有想的那么容易。但在这点上陈孝良无疑是非常幸运的,一直到现在他甚至没有写一份真正的BP,但融资却非常顺利。

1.该团队最有可能做出成绩

凯旋资本副总裁朱璘判断当AI遇到互联网后新硬件产品必会不断出现,而在绝大部分新产品品类上语音会成为一种主流交互方式,在这样的大前提下麦克风阵列加上降噪、回声抵消、Beamforming等算法就会成为新产品上的标配。也就是说想把真实场景下的语音识别做好,那必须先在前端声学上把信号处理好,麦克风阵列以及相关算法已经成为语音交互时代的浏览器。

显然声学所出来的这个精悍团队最有可能把前端的声学部分处理好,也就更可能做好真实环境下的语音识别。

2.该团队有两到三年技术优势

领投天使轮的峰瑞资本朱祎舟判断是声学此前是极为冷僻的学科,而现在则成为语音交互必不可少的一环,以一般人才的培养速度来测算,这可以让公司至少保持两年技术优势,再考虑前端离数据更近,数据优势延展到语音识别后公司整体技术优势可能持续3年以上,这无疑是巨大的红利。

所以朱祎舟最早进行了投资。

3.由端而云,该公司就是解决端的问题

领投Pre-A轮的洪泰基金的赖蕴琦判断在行业早期,终端始终是问题的核心,问题表象可能不尽相同或者体现为计算能力不足,或者体现为感知不够精准等。一个引申结论就是问题的解决始终是由端而云。

而该公司就是在声学底层解决问题,可以认为就是在解决“端”的问题。

四、路走对了!

声智科技的创始人高度对标MTK公司,选择了一个智能发展的好时机、没有残酷竞争的蓝海领域,依托声学所的研究经验制定了自己的策略,并证实了策略的可行性,先做底层硬件,再做方案、服务等等,用硬件做基础,用方案、服务扩展客户,必须要承认他的路子走对了。这是一条典型的硬件公司的路子,也是一位科学家将科研成果转型为商业科技的典型案例。

1.机会大窗口

陈孝良之所以选择从智能音响入手,主要是因为这个大市场里还未出现大玩家。数据显示,2014 年全球电子音响行业产值约为 4844亿元,2015年京东大数据显示音箱的销售额增长了62.6%。

去年春天上线的亚马逊智能音响Echo则在18个月已经售出300万台,2017年预计销量有望达到1000万台。

但在国内,模仿Echo的产品、互联网品牌的智能音响销量都不太好。他认为,这主要是因为智能音箱涉及的产业链和技术其实很复杂,但却没有公司提供优质的解决方案;而声智科技在这个领域机会很大。

当然市面上重视智能音响市场的AI厂商还有不少,比如科大讯飞、思必驰都推出了相关的产品。

不过创始人陈孝良告诉采访的媒体,这两家公司也拥有成熟且经过市场验证的麦克风阵列技术,这是Echo音箱的核心技术,也是Echo音箱的主要成本;但是仅有麦克风阵列技术还是不够的,这只解决了智能问题,却没有解决音箱问题,必须要有声学技术方案支持;此外,目前市面上的这些麦克风阵列方案强调通用语音交互,开发门槛太高,特别是有些技术点还不能完全满足垂直领域厂商开发的需要,这也给声智科技提供了时间窗口。

2.紧密结合技术

声智科技产品化的第一步是先做底层器件——声学模组,这是与技术结合最紧密的。公司即将推出的声学模组,主打零门槛集成和较高性价比,端内置远场拾音、噪声抑制、声源定位、声源分离、回声抵消、音效增强等算法(2.0版本还将集成声纹识别、情绪识别等算法),预计9月正式开放预售,希望以此圈住一批客户。目前,已经与360等国内知名厂商建立了合作。未来,如果客户量足够大,或者业务有需要时,也会考虑做成芯片。

3.方案锦上添花

在声学模组基础上,声智科技还打造了智能音响的一体化语音交互方案,包含硬件与云端服务,目标客户定位于传统音响厂商,主打零开发门槛,包括了多种麦克风阵列方案(单麦技术方案,双麦技术方案,4+1阵列方案,6+1阵列方案和8+1阵列方案),集成了自研的音箱声效、声波对码等技术,外接了第三方的语音识别、语义理解等技术,可以简单理解成一个没有壳的“Echo”,音响厂商只需要基于声智科技开源的APP开发集成,即可快速打造出个性化的智能音响。这大大降低了智能音响开发的门槛,甚至只需要7天就可完成样品模型。

五、主要竞争选手

名称:科大讯飞麦克风阵列

简介:基于科大讯飞核心语音技术,讯飞麦克风阵列完美解决远距离拾音痛点,提供优质音频。可应用于机器人、智能家居、智能硬件。

融资情况:上市融资。

来源:金牌顾问

Tags: ,

发表评论

电子邮件地址不会被公开。 必填项已用*标注

您可以使用这些HTML标签和属性: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>