1小时录音10分钟“翻译”成文字 绵阳创客要和速记“抢生意”

2016-02-01 06:52:31来源:四川日报编辑:刘波祖明远

  整理录音,是很多文字工作者的噩梦:将一定时长的录音整理为文字,往往要耗费时长的两倍甚至更多的时间。近日,国内首款PC(电脑)端长语音识别平台在绵阳问世,整理转化1小时的语音只需要10分钟,而且识别率达到97%以上。1月25日,记者在绵阳市高新区创业服务中心采访到了该产品的开发团队。

  当着记者的面,开发者之一黄博将手机内一段1小时左右的录音传到电脑上,点开软件,短短几分钟,录音便迅速转变为文字,而且每句都分行显示,方便对其进行修改校正。

  为什么速度这么快?黄博说,秘密在于其独有的声学分析模型。该软件可以像“切片”一样,把长段语音压缩、分包,然后通过云端翻译,从而保证语音翻译的准确、及时、高效。据开发团队介绍,目前国内常见的语音识别软件,大多只能识别简短的语音。“能将长语音快速转换为文字的,目前还仅有我们这一款。”黄博说。

  说起开发初衷,黄博说,此前他在机关事业单位工作,2015年科博会期间,他负责整理领导、嘉宾的发言,耗费了大量的时间精力,无奈之下,他将解决办法投向语音识别软件,却发现当时市面上的各种软件都只能针对短语音,而且识别率偏低。从中看到了商机的黄博,约了几位搞技术的朋友,组建起了开发团队,耗时近1年后,开发出了这款产品,“最初是考虑开发手机端产品,但手机硬件条件有限,所以后来转向了电脑端。”

  最终成型的产品对普通话的识别率达到了97%,同时还能识别山东话、河南话、粤语等方言。

    编辑推荐