打造“操作系统” 搜狗开放AI技术赋能录音笔行业
- 2019-08-29 20:45:13
- 1,331 次阅读
- 0
整理录音文件,长期以来始终是一件让相关从业者头疼无比却又不得不做的事情,不过,这种情况即将随着搜狗面向行业开放听写能力而发生根本性的变化。
8月28日,以“全新声态,AI未来”为主题的“搜狗听写服务开放暨AI创新联盟成立发布会”在京举行,除了发布全新炫彩版AI录音笔C1之外,搜狗宣布将面向录音笔行业全面开放听写服务,并联合Newmine纽曼、爱国者、万成集团、索尼录音笔四家录音笔头部企业成立AI创新联盟。此次发布会由搜狗CEO王小川亲自开启,不仅有搜狗CTO杨洪涛、搜狗公司AI交互技术中心总经理王砚峰等核心层共同出席,更有纽曼、爱国者、万成集团、索尼录音笔一众高管现身捧场,消息一出,业界侧目。
那么,原本是竞争对手的纽曼、爱国者、万成索尼为何会心甘情愿走到一起?这次发布会又为何会备受业内外关注呢?
服务加持,AI重新定义产品形态
关于录音笔,相信大部分人都不陌生。功能单一、产品数年如一日没有本质创新跟不上互联网和移动互联网发展步伐,这几乎就是现阶段录音笔给大众留下的基本印象,也是近几年来智能手机全民普及和其他附带录音功能电子产品兴起之后,录音笔受到挤压、市场销量整体止步不前甚至出现下滑迹象的重要原因。不过,在得到搜狗听写服务加持之后,录音笔的产品形态将被重新定义。
基于搜狗听写服务,不论是市场上现有的任意品牌的录音笔,或是未来研发上市的新品,都可以集“快速转写、多端同步编辑、智能纠错、云端存储、便捷分享”等功能于一体,满足用户录音文件整理的全部需求,让用户实现“录音1小时 转写5分钟”的畅快体验,同时转写准确率高达95%。
可以说,接入AI听写服务的录音笔,将突破了传统录音笔的局限,严格来说不能再单纯称之为录音笔,而是一个全方位的语音记录、转写、编辑、存储和分享工具。
变革行业产品创新,源于雄厚技术积累
当前商业环境下,用户体验是决定产品生命力和市场竞争的“胜负手”。接入搜狗听写服务后,将有效改善此前录音笔存储传输不便、转写文本需反复听取等诸多不足体验,帮助合作伙伴实现“录音、转写、编辑、存储、分享”全链路打通,根本原因在于其雄厚的技术积累和独特的AI优势。
首先,搜狗AI一直坚持以自然语言处理为核心,其在语音识别、语音合成、语义理解、机器翻译等方面的独特优势,为搜狗听写服务打造了良好技术基础;其次,搜狗拥有互联网规模最大的语音数据,依托于语音请求峰值达到7亿人次的搜狗输入法,机器在不断学习之后,识别准确率会越来越高,可应用的场景也会越来越广泛。
目前,搜狗听写服务背后的转写技术已处于行业领先地位,其实时语音转写运用了搜狗自研的延迟可控的Adaptive Attention-based端到端建模技术,非实时语音转写功能使用业界领先的深层Transformer-based端到端语音识别技术,语音转写准确率可达95%以上。同时,基于搜狗输入法的海量用户数据,搜狗听写服务能够自动构建个性化识别网络,使用户常用语错误率下降40%;在语音增强方面,搜狗自研的Smart Voice麦克风阵列算法能够对噪声和混响进行多重深度优化,确保人声的高保真还原;在智能辅助编辑方面,搜狗语音转写可以通过云端智能纠错编辑技术,基于词图搜索和输入纠错模型,针对置信度低的转写结果提供多个候选词,帮助用户对转写结果进行纠正,同时还具备了良好的自动区分说话人、智能文本顺滑和标点预测等能力,可以为用户提供更多便捷功能。
AI赋能,推动行业生变革新
人工智能是新赛道,近两年来,AI技术与各行业的改造融合已经成为一种趋势,录音笔行业同样如此。尽管此前市面上已经出现了基于AI的录音笔,但仅限于单个产品或某个企业的创新,像搜狗这样面向录音笔全行业提供AI技术支持的先例绝无仅有。
正如微软在PC领域推出Windows、Google在手机领域推出安卓系统那样,搜狗此次开放听写服务,某种意义上来说是在录音笔领域打造了一套“操作系统”,在为合作伙伴赋能的同时,将给行业带来颠覆性的变化。未来,在搜狗听写服务开放并得到充分使用、在AI赋能效应充分发挥之后,录音笔行业会迎来跨越式发展。早上车早出发,这也正是纽曼、爱国者、万成集团、索尼录音笔愿意在变革初期就加入搜狗发起组建的AI创新联盟的重要原因。
文章评论 (0)