您的位置:首页 >公司 >

捷通华声灵云开发者社区将开放 HCI产业需开放合作

来源:时间:2013-07-24

捷通华声灵云开发者社区将开放 HCI产业需开放合作。

C114讯(李明)随着移动互联网、智能终端、云计算的飞速发展,智能人机交互(HCI)技术也迎来了大爆发的时代。那么,新的产业变革给智能人机交互技术带来了哪些新的挑战和机遇?智能人机交互技术如何才能更好地实现产业化发展?中国企业为迎接智能人机交互时代的到来又做了哪些准备呢?

对于上述问题,北京捷通华声语音技术有限公司(下称“捷通华声”)董事长张连毅在接受C114专访时为我们进行了详细解读。

HCI技术大爆发:捷通华声推灵云平台

当前,语音合成、语音识别和手写识别已经成为智能人机交互的三项核心技术,正在悄悄地影响和改变着人们的生活。其中,语音合成技术可以让各种设备“开口讲话”,把各种文本信息以语音的方式播报;语音识别技术可以让各种设备“听懂”我们的话;手写识别技术可以帮助人们从各种设备中繁琐的按键操作中解脱出来,轻松输入文字。

而在张连毅看来,随着移动互联网、智能终端、云计算的飞速发展,智能人机交互技术也迎来了大爆发的时代。他认为,“智能人机交互技术是各大技术产业变革的画龙点睛之作,也是我国由‘中国制造’向‘中国创造’转型的巨大机遇,中国在智能人机交互技术领域的起步绝不输于外国企业。”

据张连毅介绍,捷通华声凭借十多年来在智能人机交互技术、移动互联网领域的雄厚积累,于2011年推出了全球第一个全方位智能人机交互感知云——灵云平台,为从“中国制造”向“中国创造”的全面升级提供了一个强大的“发动机”引擎;随后,又经过各方面的应用探索,于2012年再次推出了灵云平台2.0版本。

目前,灵云平台主要有语音合成(TTS)、语音识别(ASR)、手写识别(HWR)、光学字符识别(OCR)、自然语言理解(NLU)这五项核心技术,为不同领域、行业、企业,乃至个人用户,提供了多种智能人机交互解决方案,包括无纸化办公方案、电子签批方案、电子表单处理方案、语音技术方案、智能客服系统方案等,为企业高效办公、人们便捷生活提供强有力的技术保障。

灵云平台的客户不仅涵盖了政府、教育、金融、电信、能源、交通、医疗等传统行业领域的客户,更有智能家电、智能家居、互联网及移动互联网、智慧城市等新兴领域的用户。例如,目前捷通华声已将灵云平台与中国电信正在开发的EMP平台实现无缝衔接,成为其开放平台的重要组成部分,而捷通华声则负责提供其中的人机交互技术支持;此外,捷通华声灵云平台技术还应用到了百度语音助手等软件平台。

推动技术成熟完善:灵云开发者社区即将开放

相关数据显示,捷通华声已在国内语音识别、手写识别、模式识别技术市场占有了较大的市场份额,2010年世博会广播系统的语音技术80%是由捷通华声提供支持,全国的高铁所有站台的信息播报系统,都是采用捷通华声的语音合成技术。

虽然,捷通华声在智能人机交互技术领域已经成为领先厂商,但捷通华声在该领域的耕耘远不止于此。张连毅指出,“虽然智能人机交互技术已经取得了非常广泛的应用,但其技术本身还存在一些不完善的地方,例如语音识别率还不能做到百分之百,语音合成虽然已经可以流利地学习人讲话,但讲话的语气及感情色彩相比真人还有一定差距。”

因此,业界还需要去不断学习、了解、应用、完善好这些智能人机交互技术,这需要整个产业来推动其发展。张连毅透露,“为此,捷通华声的灵云开发者社区决定在今年7月18日向整个社会全方位开放各项能力,所有的企业和个人开发者都可以免费加入到灵云开发者社区。”

“在灵云开发者社区,企业和个人开发者均可直接下载语音合成(TTS)、语音识别(ASR)、手写识别(HWR)、光学字符识别(OCR)等多项HCI核心技术。与此同时,捷通华声还将加强技术指导,帮助开发者把不同的智能人机交互技术应用到产品上,与企业和个人开发者共同了解、学习、切磋、完善各种智能人机交互技术。”张连毅说。

据了解,灵云开发者社区作为捷通华声灵云平台的门户,是整个灵云平台非常重要的一部分。开发者社区将灵云平台的所有能力全部开放给用户,让用户可以自主的选择需要的能力去创造想要的产品,大到平台级智能人机交互多种能力的需求,小到个人开发者拥有的开发梦想,灵云平台都可以满足。

“在这里,开发者可以享受多能力支持服务、相互交流开发心得、创造多能力集合产品并上线产品。更为重要的是,通过开发者社区利用灵云平台的多种能力,开发者可结合自己的创造力,创造出各种新型的智能人机交互产品,这不仅有利于服务大众创造价值,还能够共同推动智能人机交互技术产业的发展。”张连毅强调,开发者社区是一个充满创造的世界,在这里通过我们共同的努力能够完成由“中国制造”到“中国创造”的完美转变,灵云开发者社区欢迎每一位企业和个人开发者的加入。

面对竞争:开放与合作可获双赢

除了通过灵云开发者社区来不断完善智能人机交互技术以外,捷通华声对于整个产业的发展也有着自己的独到见解。当前,智能人机交互技术早已不是什么新鲜事,微软、百度、谷歌等公司都已进入这个领域并有很强的研发实力,而作为专业的HCI技术提供商,科大讯飞、汉王等公司在各单项技术领域也获得了不错的成绩,智能人机交互产业迎来了群雄并起的时代。

在张连毅看来,智能人机交互技术正在迎来产业新的发展机遇。面对竞争对手的冲击,捷通华声会坦然面对这种竞争,并且继续开放智能人机交互技术的各种能力,凭借近20年在这个领域的积累继续完善技术,同时与业界保持密切的合作,以保持自身技术的领先性。

“毫无疑问,采取排斥和封闭的态度并不有利于智能人机交互技术产业的良性发展。”张连毅表示,“正如灵云平台定位于智能人机交互技术的能力开放服务平台一样,我们希望通过灵云平台向所有能够使用智能人机交互技术的厂商和开发者,提供全方位的核心技术能力;此外,捷通华声还会加强与业界合作伙伴乃至竞争对手的沟通与合作,共同把产业做大做强。”

例如,一直以来捷通华声与百度公司都保持着良好的合作伙伴关系。前不久,为促进双方在智能人机交互核心技术与产品等方面的合作,百度公司投资入股捷通华声。张连毅认为,此次战略合作,不仅对百度广泛应用语音合成、手写识别等技术形成支撑,也将对捷通华声智能人机交互技术的广泛应用与市场拓展产生非常大的促进作用。




图说财富