收藏
0 有用+1
0

SwiftScribe

播报 讨论 上传视频
百度硅谷实验室(SVAIL)研发的人工智能网页应用
SwiftScribe是 百度硅谷实验室 (SVAIL)研发的人工智能网页应用,可以把音频资料转录成文字。
2017年3月,百度推出 音频 转文本应用,暂时免费。 [1]
只测试英文语音, [2] 其他语音尚未推出。 [3]
软件名称
SwiftScribe
最近更新时间
2017年3月
开发商
百度
软件版本
内测版

发展历程

SwiftScribe
2014年,百度的首席科学家吴恩达带着一个10人的团队开发 Deep Speech——一套 语音识别系统 。当时的研究重点在怎么提高嘈杂环境下的英语语音识别准确率。百度收集了9600个人7000小时的语音样本,添加了15种噪声,把样本扩充到10万小时。吴恩达表示这套系统的错误率比同期的微软 Bing Speech、Google Speech API 等竞争对手低 10%。
2015年,百度硅谷实验室又发表论文公布了 Deep Speech 2 ,这个系统开始学习汉语,也提高了对不同英语口音识别的能力。
2016年,百度利用 Deep Speech 技术推出基于 Android 的语音输入应用 TalkType,强调输入法对“语音优先”。同一年,Deep Speech 2 还入选了《MIT 评论》评出的“2016年十大突破技术”,入选的理由是“语音识别技术让智能手机变得更易操作”。 [4]

主要功能

SwiftScribe 基于 百度硅谷实验室 的最新研究成果 Deep Speech 2,以后还会增加对视频文件的语音识别支持,也会添加自动插入标点符号等功能。
SwiftScribe还处在内测阶段,并未开放。 [4]