科大讯飞供图
互联网发展到2009年,进入移动互联新时期,科大讯飞终于找到了和互联网的切合点。2010年,科大讯飞发布了全球首个移动互联网智能语音交互平台——讯飞语音云,宣告移动互联网语音听写时代到来。
目前,科大讯飞已占有中文语音技术市场70%以上市场份额,讯飞语音云合作伙伴已经超过了35000家,面向大众的讯飞语音输入法用户数量突破1.5亿。
语速快、条理清晰、思维敏捷。
这是科大讯飞股份有限公司(以下简称科大讯飞)高级副总裁、讯飞研究院院长胡郁给记者留下的第一印象。
在记者阐明关于互联网第二波浪潮的采访主题后,胡郁果断指出:“科大讯飞成立10年来,经历了互联网的两波浪潮,其间公司处于平缓的稳步发展阶段。随着移动互联网时代的到来,也让我们迎来了巨大的转机。”
1999年11月11日,在中国科学技术大学(以下简称中国科大)发生了一件大事,6位中国科大的学生因为研制成功我国第一台“能听会说”的中文电脑,获得总计668.85万元的技术股权。
这里提到的“能听会说”电脑的研制是智能计算机研究领域的重要课题,也是我国“863 ”计划支持最早、持续最久的高科技项目。
在校大学生因技术创新而获得数量金额如此巨大的股权资本,这在我国高校历史上还是第一次。在这6 名学生当中,2 人是博士生,1 人是硕士生,3 人是本科生,而胡郁就是那3 位本科生之一,他的专业是电子工程与信息科学。
在当年获得股权奖励6名学生中,刘庆峰是科大讯飞现任董事长,也是当年项目主要成员,主攻汉语语音合成技术,胡郁负责汉语语音库设计,尹波是让电脑“能听会说”软件的主要设计者,黄海兵完成了有声电子邮件的系统设计。
“那段日子虽然艰苦,但也很幸福。”胡郁告诉《中国科学报》记者,我们因此成为了全国首批拥有百万资本的在校学生,却没有迷失方向。
从1999年开始,除了中国科大的学生身份之外,胡郁还多了一重新的身份——安徽中科大讯飞公司(科大讯飞前身)的研究员,主要从事语音合成专项技术研究,也是从那年开始,科大讯飞开始走入人们的视野。
随后的2000年到2011年,胡郁在公司从研究员做起,先后成长为基础研发部经理、讯飞语音联合实验室副主任、安徽科大讯飞公司研究院执行院长、科大讯飞高级副总裁、语音及语言信息处理国家工程实验室常务副主任。
事业快速发展的同时,胡郁也顺利完成了在中国科大的博士学业,并先后前往德国和香港进修,在柏林TFH学院他进行了语音合成韵律建模方面的研究工作。通过香港特区专才引进计划,胡郁在香港大学计算机系开展了语音识别前端鲁棒性方面的学习和研究。
“不进则退。”工科男胡郁在学习的同时开始了创业,也在创业的进程中完成了自己的学业,并且活学活用,不断将智能语音的核心技术成果推向市场。
胡郁记得在1994年自己接触了最早的互联网,当时还是文字版的BBS(电子公告牌系统),但已经让年轻的他兴奋了好一阵,只是他可能没有想到互联网能让自己在未来成就一番事业。
1994年,是中国互联网出现一系列新变化的重要年份。
1994年5月,中国科学院高能物理研究所设立了国内第一个WEB服务器,推出中国第一套网页,内容除介绍中国高科技发展外,还有一个栏目叫“Tour in China”,开始提供包括新闻、经济、文化、商贸等图文并茂的信息。同月,国家智能计算机研究开发中心开通曙光BBS站,这是中国大陆第一个基于互联网的BBS站。
1994年底,NCFC(中国国家计算机与网络设施)共连接中科院中关村地区30个研究所和北大、清华两校的各类工作站及大中型计算机500台,PC机及终端2000台。网上每天的国际传输数据量达300兆字节,相当于1.5亿汉字。
1995年,胡郁来到了中国科大。而这一年,刘庆峰获得了中国科大电子工程专业学士学位,并且作为项目主要成员参与中国科大“人机语音通信实验室”所承担的国家“863”项目和国家自然科学基金项目。
当年,胡郁在中国科大电子工程系名列前茅,这也让刘庆峰注意到了自己的小师弟,继而有了后面的创业合作。
从1995年到2009年,中国互联网经历了快速成长期。“对科大讯飞来说,1999年到2009年是我们平稳成长的10年。”胡郁说。
他列举了这10年来的一些成就:2000年,科大讯飞智能语音平台开发厂商突破100家,语音产业国家队地位初现;2004年,科大讯飞在国家“863” 项目中文语音合成国际评测中大比分囊括所有指标第一,销售收入首次迈过亿元大关;2008年,科大讯飞成功上市,成为中国语音产业界唯一上市企业……
胡郁表示,作为一家与互联网齐头并进的企业,我们希望能借互联网东风发展自身,并且已经作出了一些尝试,但我们也在1999年到2000年看到了互联网存在的泡沫,因此我们最终还是选择了脚踏实地做研发。
互联网发展到2009年,进入移动互联新时期,科大讯飞终于找到了和互联网的切合点。2010年,科大讯飞发布了全球首个移动互联网智能语音交互平台——讯飞语音云,宣告移动互联网语音听写时代到来。
互联网的浪潮成就了一批企业,但胡郁以及他所在的科大讯飞管理层都清醒地意识到在这些企业里中部分并不以核心技术见长。
胡郁指出:“我们是从中国科大走出来的企业,我们的特色是语音技术,也希望能成为专攻核心技术的企业。”
在科大讯飞发现语音产品新市场的同时,国际上知名的IT产业巨头纷纷参与其中:2011年10月,苹果公司在其iPhone智能手机中率先推出了智能语音助理应用Siri,并在2012年6月发布的IOS6中支持中文服务;Google公司也在其安卓智能手机操作系统中,推出了Google Now智能语音搜索及问答服务;微软公司将语音技术应用于最新推出的Windows Phone。
面对强敌,科大讯飞表现出自己的冷静,胡郁说:“这些企业的核心技术并不是语音技术,只是随着语音技术的发展,他们看到了商机,希望借此技术推动自己的产品迈入新的市场。”
对科大讯飞来说,公司在智能语音技术领域有着长期的研究积累,并在语音合成、语音识别、口语评测、自然语言处理等多项技术上拥有国际领先的成果。”胡郁笑称:“面对行业大佬的竞争,我们充满自信。”
科大讯飞确实有这样的底气。目前,科大讯飞已占有中文语音技术市场70%以上市场份额,讯飞语音云合作伙伴已经超过了35000家,面向大众的讯飞语音输入法用户数量突破1.5亿。
2013年,科大讯飞与中国移动、中国电信、中国联通三大电信运营商全面建立战略合作关系。胡郁还向记者透露,未来,不仅每一部手机都将能听会说;每一个玩具、每一台家电、每一辆汽车也将能听会说,科大讯飞正在为此而努力。
记者曾参观过科大讯飞的产品体验厅,电视换台、打开空调、让教学幻灯片唱歌、让行驶噪音环境中的汽车检索地图,这一切只需要一个口令就可以实现。
“智能家居也将是我们未来的主打市场。”胡郁告诉记者,“我们不是一家跟风的企业,我们只是在等待一个机会,移动互联网提供了这样的机会,那么我们也将努力用技术和实力去争取自己的话语权。同时,我们也希望向世界证明,中国的企业依靠核心技术创新和系统技术创新也可以赢得应有的尊重。”
3月3日,记者从科大讯飞获悉,其自主研发的全国产深度推理大模型“星火X1”完成全面升级,并在医疗、教育等领域推出系列创新应用。科大讯飞表示,此次升级“充分证明基于国产算力训练的全栈自主可控大模型具备登......
12月21日,在2024复旦大学EMBA同学会年会论坛上,科技部“863类人智能重点项目”首席专家、科大讯飞联合创始人胡郁以《人工智能(AI)进行时的困惑与解答》为题发表主旨演讲。胡郁。图片由主办方提......
当地时间11月6日,在爱尔兰都柏林举行的第121届IETF大会上,国际互联网协会将2024年度乔纳森·波斯塔尔奖授予中国科学家——清华大学教授李星。据悉,国际互联网协会在颁奖词中表示:“李星教授是中国......
9月2日,全省科技大会、河北省科学技术奖励大会在石家庄召开,对获得2023年度河北省科学技术奖的项目和人员进行表彰。253项(人/组织)被授予2023年度河北省科学技术奖。其中,河北省首次设置科学技术......
9月9日,以“AI汇湘江·数智驱未来”为主题的2024互联网岳麓峰会在湖南长沙举行。项目签约仪式。主办方供图峰会聚焦在“AI+”时代把握数字化、网络化、智能化发展机遇,为湖南数字产业发展勾画新蓝图,围......
AI应用要能够创造商业价值,核心在于对落地场景的深入理解。模型大小的选择也应根据实际应用场景和任务需求来决定。“AI大模型应用落地的第一核心是深入理解场景,用场景需求牵引着技术的发展。”7月29日,科......
近日,全国最大规模的车网互动示范区——江苏无锡车网互动示范区昨天正式商用。该示范区一期工程包含59台车网互动充放电桩,单桩最大充放电功率可达60千瓦。在示范区内,车主点击手机小程序中的放电按钮,就可以......
“中国互联网的发展史会记住这一天:1994年4月20日。”时隔30年,中国科学院计算机网络信息中心(以下简称网络中心)首任主任宁玉田依然清晰地记得那个特殊的日子。当天,一条传输速率为64K的国际专线从......
4月19日上午,中国全功能接入国际互联网30周年前夕,以“潮涌网络·向新出发”为主题的高端对话在中国互联网诞生地——中国科学院计算机网络信息中心举办。记者从该活动中了解到,30年来,中国互联网核心共性......
国家数据局19日发布消息,为摸清数据资源底数,加快数据资源开发利用,更好发挥数据要素价值,国家数据局、中央网信办等部门联合开展全国数据资源情况调查,调研各单位数据资源生产存储、流通交易、开发利用、安全......