首页 → 感悟 → 电视剧
科大讯飞AI,全面分析科大讯飞
日期:2018-11-30 23:19:36    编辑:苏菸限    来源:互联网
科大讯飞用AI颠覆录音笔行业:实时转写 分场景降噪 边录边译看点:录音笔这个传统“工具型”消费电子产
科大讯飞用AI颠覆录音笔行业:实时转写 分场景降噪 边录边译

看点:录音笔这个传统“工具型”消费电子产品,在AI加持下,焕发出新的生机,从录音工具转化为多场景实时“录音、转写”记录利器。

智东西5月22日消息,昨日,科大讯飞在上海举行了年度新品发布,会上讯飞推出了五款面向终端消费者的AI硬件产品和AI平台iFLYOS2.0,宣告AI技术进入规模化落地阶段。

新品中备受关注的是两款全新的智能录音笔产品SR701旗舰版和SR501标准版。在将语音核心技术与最新的硬件、AI技术结合并落地到消费者产品的道路上,讯飞迈入了一个新的疆域,并试图全面革新录音笔这个传统“工具型”消费电子产品,并拓展其应用边界,让它从录音工具转化为多场景实时“录音、转写”记录工具。

麦克卢汉说:“媒介是人的延伸”,录音笔可以看成是人们记忆的延伸。它记录了人们无法一时记住的全部内容,方便人们进行回放、提取重要信息。1877年爱迪生发明留声机标志着录音设备的诞生,之后便携式录音设备在20世纪中期被发明,在经历了几十年的磁带式录音设备的发展阶段后,21世纪初开始出现以闪存为存储媒介的数字录音笔,SONY、飞利浦成为这一领域的主要玩家。

现在进入AI时代,对数字录音笔的定义也发生了相应的变化,我们可将其划分为传统数码录音笔和智能录音笔。智能录音笔是基于人工智能技术,集高清录音、录音转文字、云端存储等功能为一体的智能硬件,是AI落地应用场景的代表性产品。

▲讯飞智能录音笔正式亮相

作为中国最大的智能语音技术提供商,科大讯飞曾利用其一流的翻译技术,打造了多款备受关注的翻译机。如今,讯飞高举高打,宣布推出两款面向中高端市场的智能录音笔SR501标准版和SR701旗舰版。这两款录音笔能分场景使用不同算法对环境进行降噪,让录音笔录制的声音更清晰。而且,这两款录音笔转写的准确率高达98%。它们还有边录边译的功能。

会前,智东西参与了这款内测状态的智能录音笔体验,并与这一产品的“创始人”科大讯飞副总裁兼消费者事业群副总裁李传刚进行了一次深度对话。通过还原讯飞用一年多时间定义并推出的这样一款语音 AI智能硬件产品的过程,我们将会看到讯飞团队如何再造录音笔这个产品形态,这个市场又会有多大的机会。

智能录音笔到底智能在哪?

李传刚说,讯飞智能录音笔是一款专业级的智能录音设备,它能让声音信息的存储、编辑、转写、查看功能更加智能和高效。

讯飞录音笔的智能首先体现在它对语音记录功能的重新定义:

第一、他们的智能录音笔可以实现语音转写,识别的准确率最高可达98%。而传统的录音笔在录音之后,还要让用户花费大量时间去再听录音并将其转为文字。讯飞智能录音笔还能将转写的结果实时呈现在机身全贴合高清触控屏上。而且,转写内容可同步到电脑、平板、手机多终端设备,方便用户进行编辑。

第二、讯飞智能录音笔利用人工智能技术分场景对环境中的噪声进行抑制,能使录制的人声更清晰。而传统的录音笔很难做到一款产品实现多场景目标声音和噪声区隔。

▲智能语音笔实时转写功能

与搜狗的智能语音录音笔不同,讯飞的这两款智能录音笔集软硬件于一体,能独立完成文字转换全流程,而无需外接其他设备。

而且,通过4G、WIFI等多种网络连接方式,录音及转写的文本内容可以一键分享至微信等社交平台。

▲智能语音笔的系统设置界面

用户还能通过录音过程中所打的标签点,在回放录音时迅速找到所需要的录音片段。

李传刚还介绍,讯飞的智能语音录音笔具有边录边译的增值功能,一方面,用户可以在屏幕上看到翻译的文本;另一方面,在外接耳机之后,用户可以听到录音笔的翻译。目前,该功能还需要4G网络或WiFi的支持。

▲智能语音笔边录边译功能

不同于讯飞翻译机主打多语种对话翻译,适用于语言不通的各个场景,讯飞智能录音笔的翻译功能可以说只是该产品的一个辅助功能,主要用于英文培训等记录场景,在转录同时进行辅助翻译。

李传刚认为讯飞智能录音笔是一款颠覆型的产品。他说:“万物互联时代来临,比起单一的‘录音’,用户更加需要的是多场景的‘智能语音记录助手’,而讯飞录音笔正是从功能和体验上实现了录音、转写、文件管理编辑的一体化。”

讯飞智能录音笔运用了哪些黑科技?

讯飞智能录音笔最重要的两大优势是录音更加清晰、转写的准确率更高。

那么它们是如何实现这两点的呢?

据李传刚介绍,讯飞将2颗哈曼定向麦克与6颗矩阵麦克相结合,并利用了远距离拾音算法和自主研发的降噪算法,能使智能录音笔达到15米远距离清晰收音的效果。

▲15米远距离收音

他说:“我们为智能录音笔设计了六大场景,每一场景都使用了不同的算法来抑制环境中的噪声。”

以远场演讲场景为例,设备会调用2个定向麦克风拾音,同时6个矩阵式麦克风识别周边及其他方向反射回来的噪声,通过算法进行比对消噪,使得录制的人声更加清晰。

在近场会议模式下,2个定向麦克风将停止工作,录音笔将6个矩阵麦克风对收集的信号进行加权算法,在目标信号的方向形成一个拾音波束,同时衰减来自其他方向的噪声,可以定向拾取与会者的发言,使得录取到的声音清晰准确。

▲智能语音笔(SR501标准版)的采访场景

这种分远场、近场进行拾音降噪的功能,是传统录音笔所无法具备的。

讯飞还使用了业界领先的语音识别和转写引擎。讯飞自2006年开始提供转写服务,其看家本领语音识别则在过去多年不断精进。面对万物互联时代的全新挑战,讯飞在18年9月包揽了国际多通道语音分离和识别大赛(CHiME)四个项目的冠军。

同时,智能语音笔中还使用了讯飞自家的TTS语音合成技术,让翻译结果实时可听。

在硬件方面,录音笔标配2000mAh电池,满电状态下可录音10小时。机身采用CNC航空级铝合金铣削而成,经过采用喷砂、阳极氧化工艺处理,打造出了高质感的外形。

两种不同型号的录音笔在核心功能上相差无二,不过,在硬件配备上稍显不同。比如,讯飞SR701旗舰版拥有3.5英寸 HD(720*1280)独立触摸屏,背板采用0.6mm弧形陶瓷背板;而SR501标准版为3.1英寸 WVGA(480*800)触摸屏,背板采用0.55mm 机铣玻璃背板;同时两种型号的智能录音笔在存储空间上也有所差异,SR701旗舰版内置32GB机身存储,同时配备20GB云端存储空间,SR501标准版则具备16GB机身存储和10GB云端存储空间。两款型号录音笔的具体产品配置如下表所示:

讯飞挖掘和再造录音笔新市场

根据市场公开资料预估,传统的录音笔全球市场大致有几千万,中国大致占一两千万左右。索尼是全球智能语音市场上的最大的玩家,市场份额约占10%,他们主要以高端智能录音笔为主,价格大致在1500元以上。飞利浦占市场份额的15%左右,他们主打中端的智能录音笔,产品售价在800元到1500元左右。

讯飞的SR701旗舰版售价为2999元,SR501标准版售价为1999元。从这两款产品的售价也可以看出,讯飞的智能录音笔主要是面向那些对高品质转写有需求的用户。这些用户可能是苹果、华为等高端手机的忠实粉丝,也是各个场景的专业记录者,消费水平较高,并且愿意为更高品质的文字转录功能付费。

而且,这些用户也对产品的硬件也有要求,他们希望智能录音笔有像高端手机一样的质感,这样的产品可以更符合他们的身份地位。

经过前期的市场调研,李传刚说智能录音笔将会对两大群体产生重大影响,第一大群体就是记者、学生、执法人员等对录音有需求的传统录音笔群体,新产品对于他们而言相当于升级换代。

第二大群体是对语音转写有需求的人,他们之前可能并未使用录音笔。他举例说,比如老师有写书的需求,他们原来会使用APP将语音转化为文字,然后再修改文字。有了这款产品之后,老师能在课堂上带着智能录音笔,实现实时的语音转写,及时记录课堂上闪过的灵感。而且,他们的录音笔在充满电后可以连续10小时录音,不用担心续航问题。

一年时间打造专业级智能录音笔

作为“骨灰级”AI玩家,讯飞在翻译和转写赛道上具备典型技术优势。

对比手机上的录音和转写软件而言,讯飞此次推出的智能录音笔是独立的设备,仅处理单任务,能把录音和实时文字转化的功能发挥到极致。而手机是一个处理多任务的产品,在录音、转写的同时,有可能还要接电话、社交等,这就影响了任务的处理进程。在中型、大型的会议现场,人们就不能拿手机去录音。相比之下,这两款智能录音笔更为专业。

据了解,讯飞智能录音笔项目硬件团队目前仅有30多人,他们在市场调研上花费了3个月的时间,从立项到现在推出产品,用时不过1年时间。

在研发过程中,讯飞遇到的挑战一方面来自于录音、转写、翻译技术的一体化整合;另一方面在于针对用户真实需求进行6大场景的录音和转写效果的优化,比如演讲、采访、会议等。

李传刚在与智东西交流时说,在未来,讯飞智能录音笔还会搭载更多的黑科技。

结语:讯飞转写技术进一步落地 智能录音笔开辟语音记录新疆域

科大讯飞轮值总裁胡郁是讯飞消费者业务的操盘手,他非常感概地说:“伟大的技术需要伟大的产品来实现落地。”在过去的20年内不断实现技术创新对讯飞而言是很重要的,随着行业、商业社会的重构,进行商业模式的创新对如今的讯飞而言也至关重要。

他说,讯飞智能录音笔代表着讯飞从源头核心技术系统创新到产品应用创新的过渡,体现了讯飞正在拥抱全新的商业模式创新。

▲李传刚在发布现场讲解产品

在录音和转写功能落地的尝试上,讯飞此前已有讯飞听见会议系统和在线转写平台的良好积淀,而此次讯飞智能录音笔的全新推出,是科大讯飞将智能转写技术放到了一个使用场景更广、人群更广的c端市场来落地。

据智东西了解,在科大讯飞内部,由胡郁带领的消费者业务对2019年的定义是“人工智能价值兑现的一年”,讯飞正在结合自己的翻译和转写两大技术优势来布局自己的消费者业务,不断将其核心技术转换成消费者可用的硬件设备。除了智能录音笔,讯飞其他的相关产品也正在研发当中。

本账号系网易新闻·网易号“各有态度”签约帐号

来源:https://mp.weixin.qq.com/s/7iumthLIJAkFKmBn-YZ4Jg
猜你也喜欢:领导力:如何做一名品牌经理(品牌,经理,企业,品牌管理,产品)
领导力:如何做一名品牌经理(品牌,经理,企业,品牌管理,产品)

品牌管理这个概念并非是一个新近诞生的字眼,我们大多数的企业都已经将其归结到一个非常重要的管理职能来考虑。但是在我接触的那么多客户中,到底应该给品牌经理赋予什么样的职责以及在企业组织内部如何定位品牌经理,仍然是困惑于众多企业管理者的大问题,特别是一些近几年在有形产品领域已经取得了不小成功的中国企业。

谈到“品牌经理”,很多人一定会联想到宝洁等国外知名的品牌企业,它们给中国带来的不仅仅是先进的产品、企业管理理念和新的市场竞争格局,更是在中国培养了一大批早期的品牌经理和产品经理。在很大程度上,品牌经理前两年的频繁跳槽也正是众多从跨国公司中吸收到养分的品牌管理人才向其他企业流动。

然而品牌管理的最大困难在于,品牌往往是存在于人的意识形态中的无形物;对于大多数企业来说,品牌管理不仅包括很多有形的因素,如品牌名称、视觉识别、环境和外部传播等,还包括了诸多不可见的因素,特别是人员、服务、产品和服务开发、知识管理、客户关系等。这些又恰恰是理解和提升品牌价值的重要课题。品牌经理必须理解和掌握这些品牌管理中的各种因素,才能管理品牌在客户心目中的联想并有效地提升品牌价值,这是对品牌经理工作目标的根本性描述。

事实上,品牌经理最为重要的是在企业内部植入一套系统的品牌管理工作流程,并协调好各个业务部门和功能性部门的关系,让品牌工作在企业内部充分协同,共同来传递品牌应有的价值。这个过程可以分解为“创造品牌”、“管理品牌”和“评估品牌”。 从中我们可以发现品牌经理应该担当的工作包括: 猜你更喜欢:非必要成功因素(乔布斯,现实,力场,扭曲,这是)

现实
非必要成功因素(乔布斯,现实,力场,扭曲,这是)

现实扭曲力场———怪诞天才乔布斯的“超能力”

我一直认为每一个成功的人的经历都可以当成一部传奇来看,而且它的时间范围不局限于古代或者现代,因为每个成功人士的性格和内容都是不同的。正如同必然中的偶然,共性中的特性,就像行星的轨道可能会偶然的相交却永远不可能相同,但这并不影响每一颗行去散发自己的光辉,所以他们每一个人的身上有着值得我们关注和学习的闪光点,并且不会因为历史的原因而褪色。为此,尽管乔布斯性格上有着严重的缺陷,但是他改变的世界,推动了历史,他的光辉是无法磨灭的。

史蒂夫·乔布斯的性格缺陷源于他的幼年被亲生父母抛弃的经历,在他的很多朋友和外人看来,这是他有时候会失控般变的残暴的关键原因,即在史蒂夫的生活中,永远存在“被抛弃”这样的一个主题。“被抛弃”、“被选择”、“很特别”这样的命题构成了幼年史蒂夫最基本的思想,同时影响着他对自己和对事物的看法,他的养父母对他接二连三的任性是宽容而理性的,而且这种态度后来存在于每一个可以跟他相处的人里,包括朋友、情人、合伙人甚至是敌人。这样他的叛逆和那种令人发指的执拗就变得容易解释。这也影响了他以后想完全掌控自己制造的每一种东西甚至是身边的每一种事物的强烈欲望,并且力求艺术性的完美。他想通过这种方式来证明自己——不是被抛弃,而是被选择,这样我的父母就会后悔当初的决定。

所以,乔布斯是不能接受违背自己意愿的事情发生的,因为在他看来“你期待他们做出好成绩,你就能让他们做出好成绩”。在他的团队中,他们将之用《星际迷航》中的一个术语来描述——“现实扭曲立场”,有他在的时候,现实都是可以塑造的,他能让任何人相信几乎任何事情。等他不在的时候,这种立场就会逐渐消失,但是这种立场很难让人做出符合实际的计划。可能别的人在一定程度上也可以拥有这种立场,但绝不会有乔布斯的这样强烈,因为这是源自于他内心深处强烈的控制欲以及天然的叛逆,正是因为如此,他拥有别人无法企及的驾驭人的能力,这种能力曾一度让比尔·盖茨嫉妒不已。陷入史蒂夫的扭曲力场中是一件很危险的事情,但也正是这种立场让他可以真正的改变现实。

在乔布斯之前没有人敢断言谁可以得到任何自己想要的东西,当然乔布斯也不能,但是他可以去改变或者扭曲事实,然后让别人去相信,最终成为事实,而这个事实正是他一直期盼的。乔布斯会断言一些事情——可能是世界历史上的一个事件,或者是叙述一场会议上某人提出的一个观点——而完全不去考虑事实是什么。这源于他对现实的有意蔑视,不光是对别人,也是对他自己。因为对现实的忽视,所以对不现实的东西给予肯定。当乔布斯这么做的的时候,通常都是一种策略,为了实现某个目的。现实扭曲立场是几种因素的混合物,其中包含了极富魅力的措辞风格,不屈的意志和让现实屈从于自己意图的热切渴望。让人惊奇的是,即使你敏锐地意识到了现实扭曲力场,他还是可以在你身上产生作用——你完成了不可能完成的任务,因为你并没有意识到它是不可能完成的。现实扭曲力场的根源在于乔布斯的内心深处不可动摇的信念:世界上的规则都不适用于他。乔布斯对人才的分类是两个极端,天才or 饭桶,非黑即白。用追求完美的心态去完成一件产品,那样他就会感觉自己成了艺术家。乔布斯会把制造伟大产品的激情摆在比迎合消费者的欲望更为重要的位置上,而且这种激情会影响他周围的每一个人。

我一直认为是乔布斯的疯狂造就了苹果,也造就了他的成功。这种疯狂包括在他的扭曲力场里。“这是狗屎”,这是乔布斯看到任何一个他不了解的方案时做出的第一评价,而且完全忽视这之后相关人员对它的解释,尽管如此,“我们把‘这是狗屎’解读为一个问句,它的真是意思是‘告诉我这为什么是最好的方法?’”,正因为乔布斯挑战了他,所以他们可以有理由怀疑这不是最好的,并且找到更好的方法。史蒂夫能看到 宏观层面,从而激励别人工作。

  • 本类最新
  • 时尚
  • 新闻
  • 生活
  • 视觉
  • 微爱
    栏目ID=88的表不存在(操作类型=0)

头条推荐

返回顶部