资讯 > 人工智能 > 正文

读书人罗永浩首秀搜狗人工智能录音笔,AI录音笔需求上升

2020/04/0420

读书人罗永浩首秀搜狗人工智能录音笔,AI录音笔需求上升

4月1日晚,"初代网红"罗永浩的抖音直播带货首秀,用接近3个小时,向4000多万观众推荐了23件商品。如同外界预料,为了确保不翻车,罗永浩首秀选品非常谨慎,选择的产品虽有争议,但还是不乏实力与口碑兼具的佼佼者。其中有一件,正好是我不久前也刚刚入手,使用了一段时间的职场利器。今天蹭着老罗这个热点,也分享一下我的使用体验。它就是搜狗在今年2月底正式发布的AI录音笔S1。

AI录音笔是一个尚在起步的新兴行业,除了记者、律师等需求较强的专业人士,绝大多数人目前还远未认识到它将带来的巨大价值。从这个意义上来说,老罗首秀这个超级话题的带动,一定会让更多人注意到AI录音笔的强大功能,并审视到自己的需求。与此同时,这个行业内的产品说多不多,但说少也不少。搜狗S1这一次之所以能够出脱颖而出,在我看来,最重要的原因不在于它技术多么强大,功能多么丰富,而是它更贴近用户需求,真正从用户场景出发,解决用户痛点,提升用户体验,受到更多用户喜爱。在前几天的视频号里,我其实已经发过一条简短的使用体验。不过,1分钟的时间太短,今天需要再详细说一说。

1

AI录音笔的需求还正在慢慢觉醒。

AI录音笔的核心竞争力,在于用人工智能,重新颠覆录音笔的功能和体验。最近两年,人工智能大潮汹涌,很多传统设备都在智能化转型。但这种智能化转型能为用户带来多大的体验提升,往往要打一个问号。其中,没有解决用户痛点,却用智能设备噱头来割用户韭菜的产品,数不胜数。但AI录音笔不同。我的个人判断,这是一个具有巨大潜力的刚需。为什么这么说?大脑的结构与工作模式,决定了记忆会不断流失,在现实生活里,永远是"好记性不如烂笔头":学生上课要做笔记,记者采访要做笔记,员工听老板指示要做笔记,几乎每一个人,都有将语音转写成为文字的需求。最早,我们只能依赖于自己写字的速度。所以,有了行书的行云流水,有了草书的奔放飘逸,有了普通人看不懂的"医生体",甚至有了专门的速记学。后来,录音技术的出现,让声音可以真实地记录和复原,我们可以将文字的记录整理,放到事后补充完成。而电脑打字技术的发展,也让我们现场记录的效率和准确性进一步提升。

但是,以上所有的方式,依然不够理想。

手工记录效率低;录音整理需要时间长;专业副词和电脑速记则需要专业人士才能胜任。最重要的是,以前的任何方式,都只有分工方式和流程不同,那些繁琐枯躁的文字整理工作,最终都必须由人来完成。所以,用游戏业的术语来说,最后还是只有氪肝或氪金两种选择,要么自己辛苦,要么支付昂贵的速记费,雇佣他人完成。前者太累,后者太贵。比如我,漫长的记者生涯里,就曾经有过无数半夜加班翻来覆去听录音的痛苦回忆,以及很多沓的速记公司发票账单。AI录音笔则不一样。它第一次用人工智能替代了人,来完成文字记录和整理的主要工作。这意味着,工作更加简单,成本更加经济。一小时录音,五分钟转写,且准确率高达98%,对于任何的文字记录工作来说都是一个质的飞越;中英日等10种语言、粤语、四川话等10种方言、贸易、医疗、IT的多专业术语的识别转写,几乎可以应对任何一种环境的录音转写需求;S1的一键智能区分讲话人、过滤无意义语气词,提炼标记重点,更是让文字整理仿佛重回直接对话场景。整理完的文本,我们也只需要简单修改,就可以直接使用,并用微信或QQ扫描,马上就能分享给其他人。这意味着,即使是一个普通人,也可以用极低的经济成本,彻底摆脱记笔记或是整理笔记的痛苦,享受人工智能为我们带来的生产力解放。用户对AI录音笔的需求正在慢慢觉醒。

2

录音笔的未来不仅是专业工具,更是生活的助手

当然,AI录音笔的竞争对手,并不仅仅是传统。比如,很多人都会问,为什么我们要花这么多钱,去买一支专业的AI录音笔呢?这也正是当前公众最普遍的一个认知误区。现在也已经有很多手机APP可以把语音转写成文字,我们直接用手机录音和转写文字,它难道不香吗?还真的不一定香。人工智能要将语音转写成文字,对于收音质量的要求极高。然而手机的主要功能,是用来打电话和上网,而不是记录和整理录音,所以它的收音能力并不专业。我们如果自己对着手机麦克风做记录,效果还稍好一些,但只要录音距离稍远、或者周围环境稍微噪一些,手机内置麦克风的收音效果就会大打折扣,导致人工智能识别率的断崖式下滑,转写文本无法使用。而AI录音笔不同,它经过了专门的设计和优化,可以确保最佳的收音效果和转写质量。

搜狗S1配备了2颗哈曼10mm指向麦,6颗全向麦,8麦阵列的运用,实现360°无死角拾音,最远拾音距离可达10米。而通过AI技术深度降噪不仅可过滤掉超过4万种真实噪音,更可以根据会议、采访、听课等不同场景的使用,实现定向增强收音,确保最佳效果,达到精准的录音和转写。但也有人会问,我们已经有专业的录音笔了,我就用它录音,然后通过电脑或手机进行人工智能转写,不是也行吗?这的确也是未来趋势的一个方向。

去年8月,搜狗就已经联手索尼录音笔、爱国者、纽曼等品牌,共同成立了AI创新联盟,帮助这些品牌的录音笔用户,通过搜狗的人工智能,获得更好的体验和增值服务。但从我个人来说,还是不会用这种方式的。一是录音要从录音笔里面导出来,再上传转写,更麻烦而且还要耽搁时间。二是它无法替代AI录音笔的很多实时功能。还是用搜狗S1为例,它不但支持录音转写,而且还支持63种语言的在线翻译,9种语言的离线翻译,以及中英文的实时同传。而且,不论是翻译还是同传,都能在它的3.5英寸触摸屏上,实时展示出来。这意味着,它不但是一支专业的AI录音笔,同时也是一台有用的智能翻译机。对我个人来说,这是一个极为有用的功能。因为我的英语水平有限,但每年都需要参加一些英文会议,采访一些外籍嘉宾,搜狗S1就能变身成我的随身同传。

AI录音笔功能的升级带来的是场景的拓展,之所以说AI录音在未来会成为刚需是因其已经不仅仅是专业工具,更是生活的助手。

3

人工智能的进步是为了人更好的工作、生活,搜狗AI的技术赋能也将帮助录音笔打开更多使用场景在我看来,无论录音转写,还是翻译同传,都只是AI录音笔颠覆行业的起点。

从本质上来说,人工智能技术是支撑AI录音笔发展的核心基石。以搜狗S1来说,我们拿在手中的是一台AI录音笔,但背后为它提供支撑的,其实是整个搜狗以语言为核心的AI技术体系。比如,搜狗自研的延迟可控的Adaptive Attention-based端到端建模技术。比如,搜狗在业界领先的深层Transformer-based端到端语音识别技术。比如,搜狗的知音NLP 引擎智能摘要技术,等等。

而随着硬件算力、软件算法的发展,人工智能技术仍然在高速发展。尤其是在越来越多用户使用AI录音笔以后,交互信息的累积,还会不断扩充人工智能的训练数据库,帮助它进行算法升级,进一步优化提高识别准确率和场景服务能力。这意味着,AI录音笔带给我们的体验,还会越来越好。它相对于其他设备的体验优势,差距还会不断拉大。

除此之外,在工业设计、使用场景、功能优化等方面,AI录音笔也比传统录音有更多的拓展空间。比如,以前我们要在浩如烟海的录音和文档里,找到一段需要的内容,可能需要花费大量的时间和精力,而现在,搜狗S1可以通过长按M键来唤醒语音助手,一句话就能帮我们找到录音,支持在标题、转写文本、录音时间中查找,甚至可以多条件组合查找。比如,搜狗S1同时支持连接4G和WiFi,可以把录音内容云同步,你在前方开会或采访,你的同事在后方就可以进行编辑处理,实现高效的分工协作。毫无疑问,未来类似的智能化、网络化的功能扩展,还将会越来越多,让我们的工作与生活更加方便。

最后,值得一提的是,AI录音笔的产业竞争,现在才刚刚开始。对于用户来说,智能设备首先需要的是有用,好用,不能有明显短板。然而,作为一个新兴行业,目前的绝大多数AI录音笔产品,在用户体验上考虑得都还不够完善,不够精细。就目前市面上的AI录音笔产品而言,搜狗的产品细节打磨,是相对最人性化,最让人舒服的。比如,很多产品的按键都是外凸式的,在随身携带的时候,常常会出现误开机甚至误录音,结果在不知不觉中耗尽了电量和存储空间,等到工作时才发现的意外尴尬。而搜狗S1的硬件设计,不但采用了更便于握持且不易滑落的曲线设计,按键也全都是内凹式的,还标配了镂空的保护壳,既高端大气上档次,也最大程度减少了误触的可能。

此外,它的电池高达2450mAh,待机时间长达20天,内存也达到64G,也是同类产品中最高的,而且支持边充电边录音,足以胜任一些极限强度的录音需求,比如连续10多个小时的不间断录音转写。

这些细节看上去并不起眼,但往往会是用户最终使用时,觉得一个产品"好用"还是"好麻烦"的分水岭。人工智能的进步是为了人更好的工作、生活,在AI技术的落地性上搜狗无疑做的非常出色,搜狗AI的技术赋能也将帮录音笔打开更多使用场景。



AI人工智能网声明:凡资讯来源注明为其他媒体来源的信息,均为转载自其他媒体,并不代表本网站赞同其观点,也不代表本网站对其真实性负责。您若对该文章内容有任何疑问或质疑,请立即与网站(www.aichinaw.com)联系,本网站将迅速给您回应并做处理。
联系电话:021-31666777   新闻、技术文章投稿QQ:3267146135   投稿邮箱:syy@gongboshi.com

关键词: