百度搜索AI发布声频转录文本运用SwiftScribe 较人力

2021-03-30 22:57 jianzhan
百度搜索AI发布声频转录文本运用SwiftScribe 较人力巧记快1.67倍 、2017-3-14、公布客户:user、字体大小:大 中 小

巧记制造行业已经迈入一场极大转型,手指头翻飞的巧记员将与一款网页页面运用变成“朋友”。前不久,我国人力智能化领导干部者百度搜索公布发布SwiftScribe网页页面运用,将更改彻底依靠人力的巧记制造行业现况。该网页页面运用背靠百度搜索深层视频语音鉴别系统软件,将声频文档变为文字,转换高效率较人力巧记快1.67倍。

百度搜索顶尖科学研究家吴恩达觉得这一运用将更改访谈视频外挂字幕转化成,他在Facebook评价称:“该运用十分合适将长视频语音变换为文字的人员,人力智能化将完成1+1超过二的实际效果。”

客户可在PC端开启SwiftScribe网页页面运用,选择wav和mp3文件格式的文档提交,系统软件就可以立刻开展解决,时间一分钟的声频文档能够在30秒内变换进行。客户可让用电脑键盘便捷键就可以开展加速播发、倒退和加上换行符等实际操作,解决进行后,只需人力调节尺寸写、标点及一部分拼读关键点就可以便捷、准确的进行声频变换。

从应用实际效果看,SwiftScribe能为巧记员产生1.67倍的高效率提高,减少40%的工作中時间。现阶段该系统软件可解决1钟头内的声频文档,而这一时间已经开发设计精英团队的勤奋下逐渐延伸,将来会提升视頻文档的视频语音鉴别及全自动加上标点等作用,并适用大量文档文件格式,减少客户应用门坎。

本次发布的SwiftScribe网页页面运用,借助于百度搜索新一代深层视频语音鉴别系统软件Deep Speech 2——曾被《麻省理工科专业技评价》获评“2017年十大提升技术性”之一。根据运用长达千余钟头的视频语音数据信息训炼,Deep Speech 2能够持续“学习培训”从视频语音中鉴别特殊的字或词。MIT评价其:在鉴别中文视频语音片断层面,要比人为因素鉴别更为准确。现阶段,百度搜索视频语音鉴别准确率已做到97%,变成制造行业领跑者。

做为非英文母语者,百度搜索SwiftScribe新项目主管吴田也曾备受长视频语音纪录的困惑“要梳理一段1钟头音频一件事来讲要花上10个钟头,”而这也是这一运用的设计灵感来源于。百度搜索在上年也发布了运用DeepSpeech2的安卓系统键入法TalkType,让客户可以术语音迅速键入文本。百度搜索美国硅谷人力智能化试验室新项目领导干部人Bijit Halder在公示中称:“TalkType是第一款智能化视频语音优先选择键入法。”

会话设备将变成2017人力智能化的发展趋势出风口,百度搜索吴恩达曾在《美国华尔街日报》的访谈中表明,伴随着准确率的提升和客户感受的提高,百度搜索的视频语音商品已渡过客户心中中的“使用期”。在视频语音商品迅速发展趋势的大自然环境下,amazon、iPhone、Google和微软公司等高新科技大佬都会抓紧产品研发各有的视频语音鉴别技术性,但是在长文字声频转换技术性上,百度搜索依然是制造行业最大水准的榜样。

现阶段,百度搜索SwiftScribe声频变换服务完全免费对外开放对外开放,但该运用身后的商业服务市场前景不能小觑。据百度搜索人员表露,将来期待可以向商业服务化运用变化。

打印此页 关闭窗口